Infortrend F16F R2J2 Power Supply Failure
Модераторы: Trinity admin`s, Free-lance moderator`s
Infortrend F16F R2J2 Power Supply Failure
БП диагностирует ошибку.
Можно (нужно ли?) вынуть-вставить его находу для проверки, реальная ли это проблема?
Можно (нужно ли?) вынуть-вставить его находу для проверки, реальная ли это проблема?
- CyberDrake
- free-lance moderator
- Сообщения: 338
- Зарегистрирован: 23 авг 2002, 10:39
- Откуда: Санкт-Петербург
- Контактная информация:
продолжение.
через два дня возникла такая же ошибка на втором БП ( UPS в другой фазе) и дисковая полка отвалилась.
После физического выключения обоих БП и вкл. обратно, полка определили оба БП как исправные. LD, конечно же отвалился.
К сожалению, Infortrend бывает довольно неподатлив на online операции: иногда отказывается без перезагрузки видеть вставленые HBA или диски, возвращенные место. Пришлось перегружать контроллер, после чего все встало на место.
Справедливости ради скажу, что у меня не последняя версия FW.
Когда я жаловался на неподхват HBA, тех. поддержка Infortrenfd советовала обновиться.
Спасибо Cyberdrake за поддержку.
через два дня возникла такая же ошибка на втором БП ( UPS в другой фазе) и дисковая полка отвалилась.
После физического выключения обоих БП и вкл. обратно, полка определили оба БП как исправные. LD, конечно же отвалился.
К сожалению, Infortrend бывает довольно неподатлив на online операции: иногда отказывается без перезагрузки видеть вставленые HBA или диски, возвращенные место. Пришлось перегружать контроллер, после чего все встало на место.
Справедливости ради скажу, что у меня не последняя версия FW.
Когда я жаловался на неподхват HBA, тех. поддержка Infortrenfd советовала обновиться.
Спасибо Cyberdrake за поддержку.
Протокол событий:
====
1й день - выход из строя Power Supply 0 на полке F16F-R2J2
запись в лога
Если зайти в SES Device - > Power Supply -> Element 0,
то пишет вот такое:
====
в тот же день БП был выдернут и вставлен обратно. Контроллер уверенно сообщал ту же ошибку. БП был выключен (swith off ), но шнур питания вставлен.
====
3-й день. та же ошибка возникла в логах, полка обесточилась, поэтому увидеть SES диагностику было нельзя.
====
полка обесточена, затем включена обратно. Оба БП показываеют исправную работу, SES статусы OK
По совету Cyberdrake все диски вынуты по одиночке
Контроллер был перезагружен, в диски в полке подвытащены.
====
Диски в полку были вставлены вставлены, затем контролер еще раз перезагружен
Мои выводы
(могут быть ошибочными и отличаться от мнения сотрудников Тринити и Infortrend)
- проблема инициирована скрытой неисправностью БП или проблемой питания. Вероятно - и то и другой вместе.
- не следовало пытаться повторно включать потенциально неисправный БП (надо было либо оставить его выкл. до перезагрузки, либо заменить на другой)
- возникновение любых ошибок (даже софтовых) лучше при первой возможности лечить заменой блока и, если софтовая проблема не устраняется - перезагрузкой.
- ЗИП в сейфе - наш лучший друг.
====
1й день - выход из строя Power Supply 0 на полке F16F-R2J2
запись в лога
Код: Выделить всё
│SES(C4 I8)Power Supply 0 ALERT:Failure Detected
то пишет вот такое:
Код: Выделить всё
Status :Critical │
│ │Information :Failure Detected │
│ │ DC Failure DetectedDC Failed │
│ │ Not Providing power
в тот же день БП был выдернут и вставлен обратно. Контроллер уверенно сообщал ту же ошибку. БП был выключен (swith off ), но шнур питания вставлен.
====
3-й день. та же ошибка возникла в логах, полка обесточилась, поэтому увидеть SES диагностику было нельзя.
====
полка обесточена, затем включена обратно. Оба БП показываеют исправную работу, SES статусы OK
- В общем списке физ. дисков присутствует все диски полки в нейтральном состоянии FRMT DRV (т.е. отформатирован и неиспользуется)
LD в состоянии FAIL, в списке дисков 16 из 16-ти в состоянии FAIL.
По совету Cyberdrake все диски вынуты по одиночке
- В общем списке физ. дисков все диски полки в нейтральном состоянии MISSING
LD в состоянии FAIL, в списке дисков 14 из 16-ти в состоянии MISSING, 2 диска в состоянии FAIL
- В общем списке физ. дисков все диски полки в нейтральном состоянии FRMT DRV
LD в состоянии FAIL, в списке дисков 14 из 16-ти в состоянии FAIL, 2 диска в состоянии BAD
Контроллер был перезагружен, в диски в полке подвытащены.
- LD пропал из списка
====
Диски в полку были вставлены вставлены, затем контролер еще раз перезагружен
- LD был обнаружен в состоянии GOOD
Мои выводы
(могут быть ошибочными и отличаться от мнения сотрудников Тринити и Infortrend)
- проблема инициирована скрытой неисправностью БП или проблемой питания. Вероятно - и то и другой вместе.
- не следовало пытаться повторно включать потенциально неисправный БП (надо было либо оставить его выкл. до перезагрузки, либо заменить на другой)
- возникновение любых ошибок (даже софтовых) лучше при первой возможности лечить заменой блока и, если софтовая проблема не устраняется - перезагрузкой.
- ЗИП в сейфе - наш лучший друг.
Продолжение 2
через еще двое суток второй БП той же полки выдал ту же самую ошибку:
Сейчас снова работаем на 1 БП.
Замечу, что этот БП подключен к другому UPS, запитанному от другой фазы.
Есть подозрение, дело в самом JBOD: он выдает ошибки мониторинга и отсреливает нормально работающие устройства.
Код: Выделить всё
────────────────────────────────────────────────────────────────────────┐
│ │Status :Critical │
│ │Information :Failure Detected │
│ │ DC Failure DetectedDC Failed │
│ │ Not Providing power
Замечу, что этот БП подключен к другому UPS, запитанному от другой фазы.
Есть подозрение, дело в самом JBOD: он выдает ошибки мониторинга и отсреливает нормально работающие устройства.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 6 гостей