RHEL AS 3.6(64-bit) Критическая ошибка в логе
Модераторы: Trinity admin`s, Free-lance moderator`s
RHEL AS 3.6(64-bit) Критическая ошибка в логе
Здравствуйте. Сервер с RHEL AS 3.6 (64-bit) два двухядерных процессора Opteron; 16Gb ОЗУ.
В логах и при старте машины появляется сообщение об ошибке. Подскажите пожалуйста о чём говорит эта ошибка :
===============================================
CPU 0: Silent Northbridge MCE
Northbridge status d4544001: 33080813
Error chipkill ecc error
ECC error syndrome 3328
bus error local node origin, request didn't time out
generic read
memory access, level generic
link number 0
err cpu1
corrected ecc error
error overflow
previos error lost
NB error address 0000001ff5c66e0 (адрес меняется)
===============================================
Спасибо.
В логах и при старте машины появляется сообщение об ошибке. Подскажите пожалуйста о чём говорит эта ошибка :
===============================================
CPU 0: Silent Northbridge MCE
Northbridge status d4544001: 33080813
Error chipkill ecc error
ECC error syndrome 3328
bus error local node origin, request didn't time out
generic read
memory access, level generic
link number 0
err cpu1
corrected ecc error
error overflow
previos error lost
NB error address 0000001ff5c66e0 (адрес меняется)
===============================================
Спасибо.
Спасибо, что откликнулись.
В логах - это имеется в виду /var/log/messages + на все консоли.
при старте - это "dmesg"
Извините, не уточнил : машина запускается и работает.
На ней крутится жутко загруженный сервер базы данных Sybase ASE-12.5
Сервер с такой ошибкой работает уже 4 дня.
Как мне кажется - это проблема с памятью, может memtest-ом её погонять?
Спасибо.
В логах - это имеется в виду /var/log/messages + на все консоли.
при старте - это "dmesg"
Извините, не уточнил : машина запускается и работает.
На ней крутится жутко загруженный сервер базы данных Sybase ASE-12.5
Сервер с такой ошибкой работает уже 4 дня.
Как мне кажется - это проблема с памятью, может memtest-ом её погонять?
Спасибо.
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
на счет memtest'а не уверен, т.к. memtest ошибки которые корректируются ECC не распознает. Кроме того, это может быть и CPU ошибка и мат. платы.
Можно попробовать потестить чтобы определиь что это такое поточнее и, в случае если это память -- какая конкретно плата за это ответственна (подробности --см. файлик в аттачменте)
Я бы обратился к в суппорт к производителю, т.к. 100% это дело в железе.
Можно попробовать потестить чтобы определиь что это такое поточнее и, в случае если это память -- какая конкретно плата за это ответственна (подробности --см. файлик в аттачменте)
Я бы обратился к в суппорт к производителю, т.к. 100% это дело в железе.
- Вложения
-
- edac.txt
- Documentation/edac.txt
- (18.72 КБ) 913 скачиваний
Кто сейчас на конференции
Сейчас этот форум просматривают: Bing [Bot] и 2 гостя