The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги ]

Мониторинг и восстановление программного RAID в Linux
Управление программными RAID1-массивами в RHEL

Мониторинг состояния 

Информация о всех RAID-массивах:
   # more /proc/mdstat
или
   # cat /proc/mdstat
или
   # watch -n .1 cat /proc/mdstat

Информация о конкретном дисковом разделе:
   # mdadm -E /dev/sd<a-b><1-10>
например:
   # mdadm -E /dev/sdb2


Восстановление функционирования

Восстановление функционирования (rebuild) разделов диска по одному после
однократного "несмертельного" сбоя:
   # mdadm -a /dev/md<0-6> /dev/sd<a-b><1-10>
например:
   # mdadm -a /dev/md0 /dev/sdb1
Нужно быть аккуратным с номерами разделов
В случае ошибки, удалить компонент из RAID командой:
   # mdadm -r /dev/md0 /dev/sdb1
получается не всегда - устройство может быть занято.


Замена диска

1. Выключить компьютер и заменить диск

2. Включить компьютер  и определить имеющиеся на обоих дисках разделы:
   # fdisk /dev/sd<a-b> -l

3. С помощью fdisk создать на новом диске разделы, идентичные оригиналу
Необходимо пометить нужный раздел нового диска (sda1 или sdb1) как загрузочный
до включения в зеркало.
Swap-разделы не подлежат зеркалированию в программном RAID

4. Выполнить Мониторинг состояния и Восстановление функционирования 


Настройка оповещения

Мониторинг выполняется с помощью crond ежечасно.
В папку /etc/cron.haurly помещен файл mdRAIDmon, содержащий команду:
   # mdadm --monitor --scan -1 --mail=postmaster@domain.name.ru

Для проверки рассылки сообщения добавляется ключ --test:
   # mdadm --monitor --scan -1 --mail=postmaster@domain.name.ru --test

Помещая файл задания в папку, необходимо установить права доступа на выполнение
Если нужно чаще, самое простое, добавьте в /etc/crontab строку, используя нотацию с "/", например:
   */5 * * * * root run-parts /etc/cron.my5min

Конечно, можно попробовать и другие варианты планирования заданий с atd или batch. 

Создайте папку /etc/cron.my5min и поместите туда файл mdRAIDmon
C имитацией отказа диска мне было проще - сервер SR1425BK1 - с корзиной HotSwap
 
28.07.2005 , Автор: radigor
Ключи: raid, linux, disk, sata, crash / Лицензия: CC-BY
Раздел:    Корень / Администратору / Система / Диски и файлы / Диагностика и Восстановление после сбоя

Обсуждение [ Линейный режим | Показать все | RSS ]
 
  • 1.1, xz, 10:23, 28/07/2005 [ответить] [смотреть все]
  • +/
    пипец скока гимороя, непроще купить апаратный ?
    они уже достаточно доступны
     
     
  • 2.2, Andrey Mitrofanov, 11:32, 28/07/2005 [^] [ответить] [смотреть все]
  • +/
    > скока гимороя, непроще купить апаратный ?
    Действительно!? Проще.
    Ведь "аппаратный", за который "уплОчено" не надо ни мониторить, ни восстанавливать, правда?
     
  • 1.3, Аноним, 13:17, 29/07/2005 [ответить] [смотреть все]
  • +/
    нет мониторить надо, а востанавливать он умеет сам забрав из хот спаре винт, д... весь текст скрыт [показать]
     
     
  • 2.5, LostSoul, 20:33, 15/09/2005 [^] [ответить] [смотреть все]  
  • +/
    А софтовый sparse вам религия поставить запрещает?

    Любой аппаратный рейд до 500$ стоимостью явно проигрывает програмному в Linux.
    И производительность нормальная.

     
  • 1.4, Аноним, 13:18, 01/08/2005 [ответить] [смотреть все]  
  • +/
    как поднять софтовый raid1 на загружаемый раздел sda1 к примеру, есть такой же ... весь текст скрыт [показать]
     
  • 1.6, kapa, 00:46, 11/03/2006 [ответить] [смотреть все]  
  • +/
    извините, а если mdadm был настроен на raid-5 с 4 дисками, при выключении одного он читать-то как-нибудь с 3ёх даст? у меня не даёт, но восстанавливает без проблем
     
     
  • 2.9, Michael Shigorin, 22:04, 23/03/2008 [^] [ответить] [смотреть все]  
  • +/
    >извините, а если mdadm был настроен на raid-5 с 4 дисками, при
    >выключении одного он читать-то как-нибудь с 3ёх даст? у меня не
    >даёт, но восстанавливает без проблем

    У меня даёт.

    PS
    > Swap-разделы не подлежат зеркалированию в программном RAID

    Это не так.  Если требуется снизить возможность сбоя -- ещё как подлежат (равно как и в аппаратном).  Другое дело, что если машинка под рукой и некритична -- проще разбросать свопы с одинаковым приоритетом по дискам, разделы с данными на которым собраны в зеркало (см. swapon(8), swapon(2) /pri).

     
  • 1.7, inkv, 15:32, 31/08/2006 [ответить] [смотреть все]  
  • +/
    Протестил я это дело на Ubuntu Server 6.0.xx
    пашет. При инсталляции, поднял 1 и 5 раид.
    вынул 1 хард - сам хот спару поднял и заребилдил
    а вот обратно - все ручками надо делать.
    Читать с 3-х - тоже дал!
    Спасибо автору - статья помогла.
    Итоги - скорость копирования из каталога в каталог 4Гб файла - 40 МБ/сек
    винты - ИБМ, 10 000 шпиндель, 160 - шина. 36,7 гиг. Контроллер Tekram DC390 U3D.
     
     
  • 2.8, Rygoravich, 15:41, 08/02/2008 [^] [ответить] [смотреть все]  
  • +/
    >Читать с 3-х - тоже дал!

    А что в этом противоестественного? Винда с ее динамическими дисками справляется.

     
  • 1.10, Юрий, 17:12, 19/11/2008 [ответить] [смотреть все]  
  • +/
    Юзали на веб-хостинге 3ware raid довольно недешевый - начал парить мозг (без матов как именно говорить не могу, поэтому подробности опускаю). и вот где гемор :-) везти его из Москвы можно месяц и то если повезет, а linux незахотел подниматься без рейда!!! если у вас веб-сервер который должен всегда пахать - юзайте софтварный рейд. Это стопудовая незавсисимость от железа. Не разу кстати не видел, чтобы рейд жрал хотя-бы один процент процессорного времени.
     
     
  • 2.11, Michael Shigorin, 19:31, 19/11/2008 [^] [ответить] [смотреть все]  
  • +/
    Угу Ну мне вот доводилось От видения неприятного процента CPU за md _raid , ... весь текст скрыт [показать]
     
     
  • 3.12, Юрий, 08:43, 20/11/2008 [^] [ответить] [смотреть все]  
  • +/
    Я далеко не гуру линукса.

    Можно все тоже самое, только "на пальцах"? (Для простых смертных)

     
     
  • 4.13, Michael Shigorin, 19:39, 20/11/2008 [^] [ответить] [смотреть все]  
  • +/
    >Я далеко не гуру линукса.

    Аналогично :-)

    >Можно все тоже самое, только "на пальцах"? (Для простых смертных)

    bonnie/bonnie++ -- это бенчмарки, обычно живут в одноименных пакетах в дистрибутиве.

    noatime -- параметр монтирования ФС, при котором чтение данных не приводит к записи в метаданные (см. man mount, man fstab).

    xfs -- файловая система, которая хорошо держит большую нагрузку.

    последним пунктом можно не заморачиваться, но если есть где -- то лучше поискать по упоминаемым словам вроде md stripe cache и поэкспериментировать.

     
     
  • 5.14, Michael Shigorin, 01:14, 11/05/2010 [^] [ответить] [смотреть все]  
  • +/
    >поискать по упоминаемым словам вроде md stripe cache и поэкспериментировать.

    Поскольку спросили -- вот скрипт со ссылками:

    #!/bin/sh
    # http://www.mail-archive.com/linux-raid@vger.kernel.org/msg07509.html
    # (thanks vsu@)
    # https://mail.clusterfs.com/wikis/attachments/LustreManual.html#1.4.3_Proper_Ke
    # '-> The "cfq" and "as" schedulers should never be used for server platform
    for i in a b c d e f g h; do
            echo deadline > /sys/block/sd$i/queue/scheduler
            echo 1024 > /sys/block/sd$i/queue/read_ahead_kb
    done

    # http://scotgate.org/?p=107
    echo 2048 > /sys/block/md0/md/stripe_cache_size
    echo 2048 > /sys/block/md4/md/stripe_cache_size

    #echo 3000 > /sys/block/md4/md/sync_speed_min
    #echo 5000 > /sys/block/md4/md/sync_speed_max

    hdparm -a 1024 /dev/sd[a-h]
    hdparm -a 4096 /dev/md[04]

     

    Ваш комментарий
    Имя:         
    E-Mail:      
    Заголовок:
    Текст:



      Закладки на сайте
      Проследить за страницей
    Created 1996-2017 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    Hosting by Ihor