Проблема с AMI MegaRaid Enterprise 1600

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Проблема с AMI MegaRaid Enterprise 1600

Сообщение dolly » 22 авг 2007, 13:14

Всем доброе время суток!

Сегодня случилась следующая проблема с AMI MegaRaid

Конфигурация сервера:

1. Материнская плата - Intel SBT2.
2. Процессоры - 2 x Intel Xeon PIII-933
3. Оперативная память - 2 x 1Gb PC133 ECC Reg
4. RAID controller AMI MegaRaid Enterprise 1600 (BIOS F320)
5. HDD 8 * IBM DDYS T09170 9,1Gb 10000rpm
  Объединены в массив RAID-5
6. OC Linux Redhat 8.0 Kernel 2.4.20

В процессе работы сервера (без нагрузки) ОС потеряла файловую систему. После перезагрузки RAID BIOS выдал сообщение
"Logical drive failed" и по Ctrl-M в RAID BIOS не зайти (то же и по Ctrl-H). Не помогает войти в BIOS и отключение шлейфов SCSI.

Подскажите, pls, возможные пути решения проблемы.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Сообщение Tert » 22 авг 2007, 13:50

dolly
Отключите все диски от контроллера и, загрузившись в DOS, запустите MegaConf для DOS. Если утилита загрузится и найдет контроллер, то очистите из под нее всю конфигурацию контроллера и сбросьте все его настройки по умолчанию.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 13:52

Tert писал(а):dolly
Отключите все диски от контроллера и, загрузившись в DOS, запустите MegaConf для DOS. Если утилита загрузится и найдет контроллер, то очистите из под нее всю конфигурацию контроллера и сбросьте все его настройки по умолчанию.
Конфигурация самого массива сохранится?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 22 авг 2007, 14:00

Конфиг массива лежит на винтах. Они должны быть отстегнуты во время процедур.
Можно кстати попробовать переставить контроллер в другую машину.
Еще можно пристегнуть диски к более современному контроллеру LSI (320-1, 320-2, 320-2X, 320-2E) - он должен понять конфиг массива.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 14:01

gs писал(а):Конфиг массива лежит на винтах. Они должны быть отстегнуты во время процедур.
Можно кстати попробовать переставить контроллер в другую машину.
Еще можно пристегнуть диски к более современному контроллеру LSI (320-1, 320-2, 320-2X, 320-2E) - он должен понять конфиг массива.
понял, спасибо, попробую

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 14:27

megaconfом сбросил настройки, после этого в bios заходить стал,
но показал два диска из восьми как FAIL

Что можно еще попробовать? Поставить их в online?
Или же произошло то невозможное, что все-таки, к сожалению, возможно?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 22 авг 2007, 14:34

Мэйк онлайн. Если уверены, что они отвалились одновременно, то можно и оба сразу.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Сообщение Tert » 22 авг 2007, 14:37


Вот здесь Oleg2 написал FAQ по снятию логов с контроллеров LSI.
Снимите этот лог и посмотрите какой диск отвалился последним. Его и ставьте в online.
Кроме того, было бы неплохо перед этой операцией проверить отвалившиеся диски на обычном SCSI контроллере с помощью дисковой утилиты Drive Fitness Test.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 16:47

Tert писал(а): Вот здесь Oleg2 написал FAQ по снятию логов с контроллеров LSI.
Снимите этот лог и посмотрите какой диск отвалился последним. Его и ставьте в online.
Кроме того, было бы неплохо перед этой операцией проверить отвалившиеся диски на обычном SCSI контроллере с помощью дисковой утилиты Drive Fitness Test.
Логи с помощью megarc не снялись.
С помощью другого контроллера и DFT битый диск нашелся.
Однако в online я перед этим поставил оба.
Теперь logical drive в degrade.
Возможно ли еще восстановить raid?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 22 авг 2007, 16:57

Если массив деградед - Вы можете снять с него информацию. А потом уже перебирайте, меняйте диск и т.п.
Хотя этому старичку давно пора на пенсию - заслужил.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 17:01

gs писал(а):Если массив деградед - Вы можете снять с него информацию. А потом уже перебирайте, меняйте диск и т.п.
Хотя этому старичку давно пора на пенсию - заслужил.
Понятно, а если не затруднит, то дайте pls ссылку на процедуру
снятия информации с degraded массивов.

А старичок уже и был предпенсионным. :)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 22 авг 2007, 17:02

Гм. Не понял. Деградед - значит поврежден один диск. Но машина должна работать. Загрузиться (желательно с другой операционки) и скопировать.
Или он деградед, но инфу не видно?

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 17:42

gs писал(а):Гм. Не понял. Деградед - значит поврежден один диск. Но машина должна работать. Загрузиться (желательно с другой операционки) и скопировать.
Или он деградед, но инфу не видно?
Ну я так себе и представлял изначально, что в случае degrade
RAID будет доступен. Однако, partition table вроде как видна,
но система (Linux) не грузится, ругаясь на то, что не может
смонтировать root fs (ext2).

Попробую загрузиться с носителя.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Сообщение dolly » 22 авг 2007, 18:44

Итак, файловая система оказалась сильно повреждена, но
частично восстановима. fsck нашел много ошибок, но потихоньку
их исправил. Восстановить удалось не все. Теперь хочется
понять на будущее, что же все-таки произошло. Полетел
один из дисков, а контроллер ошибочно пометил как fail
два? Или все-таки оба полетели? К сожалению, не получилось
достать логи контроллера.

Просто хочется понять на будущее, насколько вообще можно
доверять, например, LSILogic и RAID5?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 22 авг 2007, 18:48

Доверять можно вполне, но у меня есть сильное подозрение, что Вы за эти годы ни разу не делали консистенси чек массива :)

Скорее всего просто бэд блоки были не на одном диске.

Также вероятен вариант с электрическим ударом - нередкое явление в отсутствии земли.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя