1) зеркало (2 винта по 36 гб U320 10k фуджики)
на этом мироре стоит система.
2) рейд 10
состоял из 2х хитачей 72 гб U320 10k + 2 hp-compaq 73 гб U320 10k
на нем лежали данные.
система работала в среднем сутки, при интенсивном IO она просто висла (halted, смог повторить ситуацию и увидел в консоли мол скази тайм аут i give up, причем не к отдельному масиву а ко всему разом)
в логах сендмыла (в остальных чистота никаких ошибок) проскачила ошибка Async IO error
сделал вывод что неполучица тут рэйд 10, видимо винты не дружат
сделал 2 отдельных мирора хитачи+хитачи и компаки+компаки.
да кстати Adaptec 2120S прошивка обновлена до последней.
и вот уже без 10го рейда машина снова повисла, без всяких логов и т.п. причом машина вешаеца не под нагрузкой!!!! под нагрузкой как трактор пашет. (+ запускал стресс тесты - пофиг не вешаеца)
при висюке она исправно пингуеца, при конекте на ssh отлупа нету а просто все висит, после ребута никаких ошибок ни у одного демона нету, ни кор дампов _ничего_!
з.ы. подключая монитор в дата центре к уже повисшей машинке ничего не видно и клава не реагирует..
-----------------------------
з.ы. мой контроллер есть в HCL для солярки и не просто есть а имеет тест левел 2, т.е. оттестирован самими сантехниками.... я уже и незнаю на что думать
з.ы.ы
м.б. имеет смысл для каждой фс установить вместо onerror=panic onerror=lock ?
и как проверить в винтах ли дело, м.б. каконть скриптик хитрый который бы перехватывал то что система пишет в консоль и отправлял куданибуть....