Прошу расшифровать лог
Модераторы: Trinity admin`s, Free-lance moderator`s
Прошу расшифровать лог
Добрый день!
Размещаю сервер в стороннем ЦОДе.
Сервер с контроллером LSI MegaRAID SAS 9341-4i
Пришло сообщение о критической ошибке RAID контроллера. Залез - один массив расформирован.
Привожу лог:
ID = 247
SEQUENCE NUMBER = 11656
TIME = 04-08-2019 21:57:53
LOCALIZED MESSAGE = Controller ID: 0 Device inserted Device Type: Disk Device Id: 0
ID = 91
SEQUENCE NUMBER = 11655
TIME = 04-08-2019 21:57:53
LOCALIZED MESSAGE = Controller ID: 0 PD inserted: Port 0 - 3:0:3
ID = 268
SEQUENCE NUMBER = 11654
TIME = 04-08-2019 17:30:20
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:3, Critical = 3, Path = 0x4433221100000000
ID = 247
SEQUENCE NUMBER = 11652
TIME = 04-08-2019 15:04:31
LOCALIZED MESSAGE = Controller ID: 0 Device inserted Device Type: Disk Device Id: 1
ID = 91
SEQUENCE NUMBER = 11651
TIME = 04-08-2019 15:04:31
LOCALIZED MESSAGE = Controller ID: 0 PD inserted: Port 0 - 3:0:2
ID = 268
SEQUENCE NUMBER = 11650
TIME = 04-08-2019 15:03:13
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:2, Critical = 3, Path = 0x4433221101000000
ID = 268
SEQUENCE NUMBER = 11649
TIME = 04-08-2019 13:51:20
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = -:-:0, Critical = 3, Path = 0x4433221101000000
ID = 139
SEQUENCE NUMBER = 11648
TIME = 04-08-2019 02:47:42
LOCALIZED MESSAGE = Controller ID: 0 Deleted VD: 1
ID = 114
SEQUENCE NUMBER = 11647
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:2 Previous = Failed Current = Unconfigured Bad
ID = 114
SEQUENCE NUMBER = 11646
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:3 Previous = Failed Current = Unconfigured Bad
ID = 252
SEQUENCE NUMBER = 11645
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 VD is now OFFLINE VD 1
ID = 81
SEQUENCE NUMBER = 11644
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 1 Previous = Degraded Current = Offline
ID = 114
SEQUENCE NUMBER = 11643
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:3 Previous = Online Current = Failed
ID = 248
SEQUENCE NUMBER = 11642
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 Device removed Device Type: Disk Device Id: 0
ID = 112
SEQUENCE NUMBER = 11641
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 PD removed: Port 0 - 3:0:3
ID = 268
SEQUENCE NUMBER = 11640
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:3, Critical = 3, Path = 0x4433221100000000
ID = 113
SEQUENCE NUMBER = 11639
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 Unexpected sense: PD = Port 0 - 3:0:3Logical unit not ready, cause not reportable, CDB = 0x2e 0x00 0x74 0x70 0x4c 0x83 0x00 0x00 0x01 0x00 , Sense = 0x70 0x00 0x02 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x04 0x00 0x00 0x00 0x00 0x00
ID = 251
SEQUENCE NUMBER = 11638
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 VD is now DEGRADED VD 1
ID = 81
SEQUENCE NUMBER = 11637
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 1 Previous = Optimal Current = Degraded
ID = 114
SEQUENCE NUMBER = 11636
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:2 Previous = Online Current = Failed
ID = 248
SEQUENCE NUMBER = 11635
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 Device removed Device Type: Disk Device Id: 1
ID = 112
SEQUENCE NUMBER = 11634
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 PD removed: Port 0 - 3:0:2
ID = 268
SEQUENCE NUMBER = 11633
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:2, Critical = 3, Path = 0x4433221101000000
ID = 35
SEQUENCE NUMBER = 11632
TIME = 03-08-2019 06:36:06
LOCALIZED MESSAGE = Controller ID: 0 Patrol Read complete
Я так понимаю, что вытаскивали и вставляли жесткие диски. Или я ошибаюсь?
Прошу помощи в расшифровке.
Размещаю сервер в стороннем ЦОДе.
Сервер с контроллером LSI MegaRAID SAS 9341-4i
Пришло сообщение о критической ошибке RAID контроллера. Залез - один массив расформирован.
Привожу лог:
ID = 247
SEQUENCE NUMBER = 11656
TIME = 04-08-2019 21:57:53
LOCALIZED MESSAGE = Controller ID: 0 Device inserted Device Type: Disk Device Id: 0
ID = 91
SEQUENCE NUMBER = 11655
TIME = 04-08-2019 21:57:53
LOCALIZED MESSAGE = Controller ID: 0 PD inserted: Port 0 - 3:0:3
ID = 268
SEQUENCE NUMBER = 11654
TIME = 04-08-2019 17:30:20
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:3, Critical = 3, Path = 0x4433221100000000
ID = 247
SEQUENCE NUMBER = 11652
TIME = 04-08-2019 15:04:31
LOCALIZED MESSAGE = Controller ID: 0 Device inserted Device Type: Disk Device Id: 1
ID = 91
SEQUENCE NUMBER = 11651
TIME = 04-08-2019 15:04:31
LOCALIZED MESSAGE = Controller ID: 0 PD inserted: Port 0 - 3:0:2
ID = 268
SEQUENCE NUMBER = 11650
TIME = 04-08-2019 15:03:13
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:2, Critical = 3, Path = 0x4433221101000000
ID = 268
SEQUENCE NUMBER = 11649
TIME = 04-08-2019 13:51:20
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = -:-:0, Critical = 3, Path = 0x4433221101000000
ID = 139
SEQUENCE NUMBER = 11648
TIME = 04-08-2019 02:47:42
LOCALIZED MESSAGE = Controller ID: 0 Deleted VD: 1
ID = 114
SEQUENCE NUMBER = 11647
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:2 Previous = Failed Current = Unconfigured Bad
ID = 114
SEQUENCE NUMBER = 11646
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:3 Previous = Failed Current = Unconfigured Bad
ID = 252
SEQUENCE NUMBER = 11645
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 VD is now OFFLINE VD 1
ID = 81
SEQUENCE NUMBER = 11644
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 1 Previous = Degraded Current = Offline
ID = 114
SEQUENCE NUMBER = 11643
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:3 Previous = Online Current = Failed
ID = 248
SEQUENCE NUMBER = 11642
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 Device removed Device Type: Disk Device Id: 0
ID = 112
SEQUENCE NUMBER = 11641
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 PD removed: Port 0 - 3:0:3
ID = 268
SEQUENCE NUMBER = 11640
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:3, Critical = 3, Path = 0x4433221100000000
ID = 113
SEQUENCE NUMBER = 11639
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 Unexpected sense: PD = Port 0 - 3:0:3Logical unit not ready, cause not reportable, CDB = 0x2e 0x00 0x74 0x70 0x4c 0x83 0x00 0x00 0x01 0x00 , Sense = 0x70 0x00 0x02 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x04 0x00 0x00 0x00 0x00 0x00
ID = 251
SEQUENCE NUMBER = 11638
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 VD is now DEGRADED VD 1
ID = 81
SEQUENCE NUMBER = 11637
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 1 Previous = Optimal Current = Degraded
ID = 114
SEQUENCE NUMBER = 11636
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:2 Previous = Online Current = Failed
ID = 248
SEQUENCE NUMBER = 11635
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 Device removed Device Type: Disk Device Id: 1
ID = 112
SEQUENCE NUMBER = 11634
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 PD removed: Port 0 - 3:0:2
ID = 268
SEQUENCE NUMBER = 11633
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:2, Critical = 3, Path = 0x4433221101000000
ID = 35
SEQUENCE NUMBER = 11632
TIME = 03-08-2019 06:36:06
LOCALIZED MESSAGE = Controller ID: 0 Patrol Read complete
Я так понимаю, что вытаскивали и вставляли жесткие диски. Или я ошибаюсь?
Прошу помощи в расшифровке.
Re: Прошу расшифровать лог
Уважаемые форумчане, помогите разобраться.
При извлечении диска в лог пишется PD removed, как у меня в логе.
При других условиях это сообщение могло появиться?
При извлечении диска в лог пишется PD removed, как у меня в логе.
При других условиях это сообщение могло появиться?
Re: Прошу расшифровать лог
это может быть при любой потере связи с диском.
1. несовместимость. бывает, что некоторые модели дисков часто самопроизвольно "отваливаются" от контроллера.
2. проблемы с питанием дисков.
3. проблемы с интерфейсным кабелем.
4. перегрев, повышенная вибрация, уход дисков в энергосберегающий режим и т.д. и т.п.
смотрите логи контроллера, IPMI, ОС и др.
1. несовместимость. бывает, что некоторые модели дисков часто самопроизвольно "отваливаются" от контроллера.
2. проблемы с питанием дисков.
3. проблемы с интерфейсным кабелем.
4. перегрев, повышенная вибрация, уход дисков в энергосберегающий режим и т.д. и т.п.
смотрите логи контроллера, IPMI, ОС и др.
Re: Прошу расшифровать лог
Спасибо за ответ. Буду разбираться.
Re: Прошу расшифровать лог
У меня, как видно из лога поочередно отвалились оба диска массива RAID1 (который состоял всего из двух дисков).
Есть шанс сохранить информацию, которая была на массиве? И если можно спасти данные, можно ли их спасти без физического присутствия? (почему спрашиваю... как я писал сервер находится в стороннем цоде).
Есть шанс сохранить информацию, которая была на массиве? И если можно спасти данные, можно ли их спасти без физического присутствия? (почему спрашиваю... как я писал сервер находится в стороннем цоде).
Re: Прошу расшифровать лог
Оба диска в состоянии Unconfigured Bad. Логического диска (массива) вообще нет.
Re: Прошу расшифровать лог
возможны варианты:
1. диски действительно вышли из строя. тогда можно только отнести их в фирму по восстановлению информации с дисков и, может, они смогут вытащить всю или часть информации.
2. был какой-то одиночный сбой, но диски исправные. тогда если заниматься этим самому, то сначала надо сделать посекторную копию.
потом принудительно перевести диск в он-лайн (сделать force online). в результате массив должен увидеться в состояние degraded и информация будет доступна.
3. это результат каких-то неправильных действий. например, том был заново инициализирован (т.е. информация безвозвратно потеряна), а потом диски переведены в оффлайн или извлечены на ходу. в этом случае ничего уже сделать нельзя.
1. диски действительно вышли из строя. тогда можно только отнести их в фирму по восстановлению информации с дисков и, может, они смогут вытащить всю или часть информации.
2. был какой-то одиночный сбой, но диски исправные. тогда если заниматься этим самому, то сначала надо сделать посекторную копию.
потом принудительно перевести диск в он-лайн (сделать force online). в результате массив должен увидеться в состояние degraded и информация будет доступна.
3. это результат каких-то неправильных действий. например, том был заново инициализирован (т.е. информация безвозвратно потеряна), а потом диски переведены в оффлайн или извлечены на ходу. в этом случае ничего уже сделать нельзя.
Re: Прошу расшифровать лог
А разве можно сделать force online, если нет логического диска? В контекстном меню MegaRaid при нажатии на диск нету такого пункта.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 7 гостей