Прошу расшифровать лог

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
bar2ian
Junior member
Сообщения: 13
Зарегистрирован: 01 фев 2013, 16:32
Откуда: Москва

Прошу расшифровать лог

Сообщение bar2ian » 05 авг 2019, 00:42

Добрый день!
Размещаю сервер в стороннем ЦОДе.
Сервер с контроллером LSI MegaRAID SAS 9341-4i
Пришло сообщение о критической ошибке RAID контроллера. Залез - один массив расформирован.
Привожу лог:

ID = 247
SEQUENCE NUMBER = 11656
TIME = 04-08-2019 21:57:53
LOCALIZED MESSAGE = Controller ID: 0 Device inserted Device Type: Disk Device Id: 0

ID = 91
SEQUENCE NUMBER = 11655
TIME = 04-08-2019 21:57:53
LOCALIZED MESSAGE = Controller ID: 0 PD inserted: Port 0 - 3:0:3

ID = 268
SEQUENCE NUMBER = 11654
TIME = 04-08-2019 17:30:20
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:3, Critical = 3, Path = 0x4433221100000000

ID = 247
SEQUENCE NUMBER = 11652
TIME = 04-08-2019 15:04:31
LOCALIZED MESSAGE = Controller ID: 0 Device inserted Device Type: Disk Device Id: 1

ID = 91
SEQUENCE NUMBER = 11651
TIME = 04-08-2019 15:04:31
LOCALIZED MESSAGE = Controller ID: 0 PD inserted: Port 0 - 3:0:2

ID = 268
SEQUENCE NUMBER = 11650
TIME = 04-08-2019 15:03:13
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:2, Critical = 3, Path = 0x4433221101000000

ID = 268
SEQUENCE NUMBER = 11649
TIME = 04-08-2019 13:51:20
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = -:-:0, Critical = 3, Path = 0x4433221101000000

ID = 139
SEQUENCE NUMBER = 11648
TIME = 04-08-2019 02:47:42
LOCALIZED MESSAGE = Controller ID: 0 Deleted VD: 1

ID = 114
SEQUENCE NUMBER = 11647
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:2 Previous = Failed Current = Unconfigured Bad

ID = 114
SEQUENCE NUMBER = 11646
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:3 Previous = Failed Current = Unconfigured Bad

ID = 252
SEQUENCE NUMBER = 11645
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 VD is now OFFLINE VD 1

ID = 81
SEQUENCE NUMBER = 11644
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 1 Previous = Degraded Current = Offline

ID = 114
SEQUENCE NUMBER = 11643
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:3 Previous = Online Current = Failed

ID = 248
SEQUENCE NUMBER = 11642
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 Device removed Device Type: Disk Device Id: 0

ID = 112
SEQUENCE NUMBER = 11641
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 PD removed: Port 0 - 3:0:3

ID = 268
SEQUENCE NUMBER = 11640
TIME = 04-08-2019 02:47:41
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:3, Critical = 3, Path = 0x4433221100000000

ID = 113
SEQUENCE NUMBER = 11639
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 Unexpected sense: PD = Port 0 - 3:0:3Logical unit not ready, cause not reportable, CDB = 0x2e 0x00 0x74 0x70 0x4c 0x83 0x00 0x00 0x01 0x00 , Sense = 0x70 0x00 0x02 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x04 0x00 0x00 0x00 0x00 0x00

ID = 251
SEQUENCE NUMBER = 11638
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 VD is now DEGRADED VD 1

ID = 81
SEQUENCE NUMBER = 11637
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 State change on VD: 1 Previous = Optimal Current = Degraded

ID = 114
SEQUENCE NUMBER = 11636
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 State change: PD = Port 0 - 3:0:2 Previous = Online Current = Failed

ID = 248
SEQUENCE NUMBER = 11635
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 Device removed Device Type: Disk Device Id: 1

ID = 112
SEQUENCE NUMBER = 11634
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 PD removed: Port 0 - 3:0:2

ID = 268
SEQUENCE NUMBER = 11633
TIME = 04-08-2019 02:47:36
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:0:2, Critical = 3, Path = 0x4433221101000000

ID = 35
SEQUENCE NUMBER = 11632
TIME = 03-08-2019 06:36:06
LOCALIZED MESSAGE = Controller ID: 0 Patrol Read complete

Я так понимаю, что вытаскивали и вставляли жесткие диски. Или я ошибаюсь?
Прошу помощи в расшифровке.

bar2ian
Junior member
Сообщения: 13
Зарегистрирован: 01 фев 2013, 16:32
Откуда: Москва

Re: Прошу расшифровать лог

Сообщение bar2ian » 05 авг 2019, 22:44

Уважаемые форумчане, помогите разобраться.
При извлечении диска в лог пишется PD removed, как у меня в логе.
При других условиях это сообщение могло появиться?

turboprop
Advanced member
Сообщения: 244
Зарегистрирован: 18 июн 2010, 11:22
Откуда: C.Петербург

Re: Прошу расшифровать лог

Сообщение turboprop » 06 авг 2019, 11:26

это может быть при любой потере связи с диском.
1. несовместимость. бывает, что некоторые модели дисков часто самопроизвольно "отваливаются" от контроллера.
2. проблемы с питанием дисков.
3. проблемы с интерфейсным кабелем.
4. перегрев, повышенная вибрация, уход дисков в энергосберегающий режим и т.д. и т.п.

смотрите логи контроллера, IPMI, ОС и др.

bar2ian
Junior member
Сообщения: 13
Зарегистрирован: 01 фев 2013, 16:32
Откуда: Москва

Re: Прошу расшифровать лог

Сообщение bar2ian » 08 авг 2019, 19:22

Спасибо за ответ. Буду разбираться.

bar2ian
Junior member
Сообщения: 13
Зарегистрирован: 01 фев 2013, 16:32
Откуда: Москва

Re: Прошу расшифровать лог

Сообщение bar2ian » 08 авг 2019, 21:32

У меня, как видно из лога поочередно отвалились оба диска массива RAID1 (который состоял всего из двух дисков).
Есть шанс сохранить информацию, которая была на массиве? И если можно спасти данные, можно ли их спасти без физического присутствия? (почему спрашиваю... как я писал сервер находится в стороннем цоде).

bar2ian
Junior member
Сообщения: 13
Зарегистрирован: 01 фев 2013, 16:32
Откуда: Москва

Re: Прошу расшифровать лог

Сообщение bar2ian » 09 авг 2019, 14:39

Оба диска в состоянии Unconfigured Bad. Логического диска (массива) вообще нет.

turboprop
Advanced member
Сообщения: 244
Зарегистрирован: 18 июн 2010, 11:22
Откуда: C.Петербург

Re: Прошу расшифровать лог

Сообщение turboprop » 09 авг 2019, 18:09

возможны варианты:
1. диски действительно вышли из строя. тогда можно только отнести их в фирму по восстановлению информации с дисков и, может, они смогут вытащить всю или часть информации.
2. был какой-то одиночный сбой, но диски исправные. тогда если заниматься этим самому, то сначала надо сделать посекторную копию.
потом принудительно перевести диск в он-лайн (сделать force online). в результате массив должен увидеться в состояние degraded и информация будет доступна.
3. это результат каких-то неправильных действий. например, том был заново инициализирован (т.е. информация безвозвратно потеряна), а потом диски переведены в оффлайн или извлечены на ходу. в этом случае ничего уже сделать нельзя.

bar2ian
Junior member
Сообщения: 13
Зарегистрирован: 01 фев 2013, 16:32
Откуда: Москва

Re: Прошу расшифровать лог

Сообщение bar2ian » 12 авг 2019, 22:23

А разве можно сделать force online, если нет логического диска? В контекстном меню MegaRaid при нажатии на диск нету такого пункта.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 9 гостей