проблемы с созданием кластера
Модераторы: Trinity admin`s, Free-lance moderator`s
проблемы с созданием кластера
Есть железо:
1. два сервера Dell PowerEdge 2800, на каждом: 36GB SCSI U320 10K 80pin - 2 шт., PV110T LTO2 200/400GB, PERC 4/DC, ADAPTEC 39160 U 160 SCSI - 2 шт. (один не используется). При этом стриммер подключен к внутреннему scsi разъему, raid к scsi адаптеру, к которому подключено и внешнее хранилище.
2. внешнее хранилище PowerVault PV220S, 36GB SCSI U320 10K 80pin Internal - 6 шт., Dual Enclosure Mgmt Module (переключатель в положении Clustering), имеет два scsi разъема и подключено к обоим нодам к scsi адаптерам.
3. ноды между собой соединены хертбитом по витой паре.
нужно: сделать кластер на RedHat AS 3.0 + ClusterSuite.
Я такой задачей занялся впервые, поэтому буду благодарен любой помощи и заранее извиняюсь за неподкованность в этом вопросе.
При загрузке любой ноды с отключенным хранилищем она сразу начинает издавать продожительные сигналы одинаковой длины и периодичности, что продолжается пока ее не перезагрузишь. При полключенном к обоим нодам хранилище, включенном хертбите и одновременном включении обоих нод они некоторое время работают нормально, идет загрузка биосов, доходит до установки редхата, тут дело не доходит до графического режима установки - программа установки загружает драйвера и повисает на драйвере megaraid... Вторая нода при этом начинает "пищать". Иногда это происходит раньше - две ноды нормально грузятся, при этом одна из них или обе начинают "пищать", хотя загрузка продолжается как ни в чем ни бывало. Индикаторы никаких ошибок не показывают.
по загрузке биосов
первым идет MPTBIOS5-06 и выдает таблицу:
HBA ID LUN VENDOR...
0 7 0 LSI Logic
1 8 0 здесь стриммер (не помню точно что выдавалось)
1 7 0 LSI Logic
дальше Adaptec SCSI Bios v 3.10.0
сканирует scsi устройства и выдает пустую таблицу
Slot Ch ID LUN Vendor ....
затем Power Edge Expandable RAID Controller BIOS 1.09
предлагает по "ctrl-M" войти в настройки, но войти в них не получается, комбинация игнорируется.
вопросы такие:
1. правильно ли я понимаю, обе ноды и хранилище сидят на общей scsi шине?
2. почему ноды пищат? вероятно ли то что они являются аппаратным кластером и есть где то в биосе программа следящая за этой связкой?
если да, то как ее отключить? как вообще избавиться от этой проблемы, потому что нет никакого смысла продолжать установку пока идет такой сигнал об ошибке в аппаратной конфигурации кластера?
3. что нужно исправить в bios-ах? нужно ли переназначать id в первом?(таблицы на обоих нодах одинаковые). Во втором биосе все изменения эффекта не имеют, ни одно устройство не находится; в третий вообще войти нельзя.
Заранее благодарен за советы!
1. два сервера Dell PowerEdge 2800, на каждом: 36GB SCSI U320 10K 80pin - 2 шт., PV110T LTO2 200/400GB, PERC 4/DC, ADAPTEC 39160 U 160 SCSI - 2 шт. (один не используется). При этом стриммер подключен к внутреннему scsi разъему, raid к scsi адаптеру, к которому подключено и внешнее хранилище.
2. внешнее хранилище PowerVault PV220S, 36GB SCSI U320 10K 80pin Internal - 6 шт., Dual Enclosure Mgmt Module (переключатель в положении Clustering), имеет два scsi разъема и подключено к обоим нодам к scsi адаптерам.
3. ноды между собой соединены хертбитом по витой паре.
нужно: сделать кластер на RedHat AS 3.0 + ClusterSuite.
Я такой задачей занялся впервые, поэтому буду благодарен любой помощи и заранее извиняюсь за неподкованность в этом вопросе.
При загрузке любой ноды с отключенным хранилищем она сразу начинает издавать продожительные сигналы одинаковой длины и периодичности, что продолжается пока ее не перезагрузишь. При полключенном к обоим нодам хранилище, включенном хертбите и одновременном включении обоих нод они некоторое время работают нормально, идет загрузка биосов, доходит до установки редхата, тут дело не доходит до графического режима установки - программа установки загружает драйвера и повисает на драйвере megaraid... Вторая нода при этом начинает "пищать". Иногда это происходит раньше - две ноды нормально грузятся, при этом одна из них или обе начинают "пищать", хотя загрузка продолжается как ни в чем ни бывало. Индикаторы никаких ошибок не показывают.
по загрузке биосов
первым идет MPTBIOS5-06 и выдает таблицу:
HBA ID LUN VENDOR...
0 7 0 LSI Logic
1 8 0 здесь стриммер (не помню точно что выдавалось)
1 7 0 LSI Logic
дальше Adaptec SCSI Bios v 3.10.0
сканирует scsi устройства и выдает пустую таблицу
Slot Ch ID LUN Vendor ....
затем Power Edge Expandable RAID Controller BIOS 1.09
предлагает по "ctrl-M" войти в настройки, но войти в них не получается, комбинация игнорируется.
вопросы такие:
1. правильно ли я понимаю, обе ноды и хранилище сидят на общей scsi шине?
2. почему ноды пищат? вероятно ли то что они являются аппаратным кластером и есть где то в биосе программа следящая за этой связкой?
если да, то как ее отключить? как вообще избавиться от этой проблемы, потому что нет никакого смысла продолжать установку пока идет такой сигнал об ошибке в аппаратной конфигурации кластера?
3. что нужно исправить в bios-ах? нужно ли переназначать id в первом?(таблицы на обоих нодах одинаковые). Во втором биосе все изменения эффекта не имеют, ни одно устройство не находится; в третий вообще войти нельзя.
Заранее благодарен за советы!
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Скорее всего проблема в пересечении SCSI ID контроллеров, которые сидят на общей шине с дисковым ящиком. По крайней мере я так понял приведенную табличку (оба LSI (рэйд видимо) контроллера имеют ID7).
Я не спец в Делле - так что почитайте мануал на контроллеры на предмет - как им ID разные задать. Пока этого не сделаете, может быть все, что угодно.
Я не спец в Делле - так что почитайте мануал на контроллеры на предмет - как им ID разные задать. Пока этого не сделаете, может быть все, что угодно.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Имхо зря Вы задали адреса 1,2,3,4 - скорее всего теперь они с адресами винтов в корзине пересекаются. Посмотрите какие адреса на шине свободны. Как правило рэйд контроллерам выставляются 6 и 7 (они имеют наивысший приоритет на шине и как правило свободны). Причем разные выставлять надо на одном канале - т.е. 6,7 на одном и 6,7 на другом.
На шине (во втором биосе) он находит только одно устройство, на 7 id - это scsi адаптер.
У Вас есть какие-нибудь предположения почему он сразу начинает "пищать" если от адаптера отключить хранилище?
т.е. в адаптер включен только внутренний массив дисков одним кабелем, и в системную плату втыкается кабель от стриммера. на конце кабеля, что идет к стриммеру, висит терминатор (со стороны стримера), кабель который втыкается во внутренний массив дисков терминатора не имеет, он подключается к плате к которой подсоединены два внутренних винта (можно больше воткнуть); на ней два scsi разьема и один отличный от них; может туда тоже терминатор нужен какой-то?
У Вас есть какие-нибудь предположения почему он сразу начинает "пищать" если от адаптера отключить хранилище?
т.е. в адаптер включен только внутренний массив дисков одним кабелем, и в системную плату втыкается кабель от стриммера. на конце кабеля, что идет к стриммеру, висит терминатор (со стороны стримера), кабель который втыкается во внутренний массив дисков терминатора не имеет, он подключается к плате к которой подсоединены два внутренних винта (можно больше воткнуть); на ней два scsi разьема и один отличный от них; может туда тоже терминатор нужен какой-то?
Набросал вот небольшую схемку, надеюсь она хоть немного прояснит ситуацию
ID я расставил так, как понимаю, т.е. возможно неправильно.
ID я расставил так, как понимаю, т.е. возможно неправильно.
- Вложения
-
- cluster.xls
- (41 КБ) 907 скачиваний
Извините, это видимо из-за того что офис 2003.
Сейчас переформатировал в 2000, если не получится открыть - напишите сразу, сделаю в bmp или jpg.
Сейчас переформатировал в 2000, если не получится открыть - напишите сразу, сделаю в bmp или jpg.
- Вложения
-
- scheme_.xls
- (42 КБ) 906 скачиваний
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Насколько я понял схему, у Вас ящик с винтами сконфигурирован как один канал из 14 винтов (сколько реально винтов стоит неважно, SCSI ID все равно нельзя эти использовать). Получается, что на одной шине висит 14 винтов и два рэйд контроллера. Т.е. все 16 SCSI ID этой шины заняты (почитайте кстати мануал ящика на предмет, какие адреса он занимает на шине в одноканальном кластерном режиме). Почти наверняка каналы рэйд контроллеров Вы ОБЯЗАНЫ назначить как 6 и 7.
Кроме того, на схеме есть по два винта в каждом сервере, подключенные к тому же перку (кстати непонятны их адреса - у вас указан только один адрес, хотя винтов по два). Эти винты ОБЯЗАНЫ висеть НЕ на одном канале с внешним ящиком. Посмотрите мануал рэйд контроллера - какие его разъемы к какому каналу относятся (на каждом канале по идее должен быть один внешний и один внутренний разъем).
В общем, надо сделать так:
1. Каналам рэйд контроллера, подключенным к внешнему ящику, назначить разные адреса, не пересекающиеся с адресами, которые могут занимать винты в этом ящике - скорее всего 6 и 7 (в том виде, как на картинке, вообще ничего работать и не должно).
2. Внутренние винты повесить на другой канал, если это еще не сделано.
3. Подключение стримера в данном случае неважно - он на другом адаптере висит (интегрированном) - с ним вроде все в порядке, хотя адреса выставлены как-то не по человечески.
И вот тут немного информации есть http://www.dell.com/downloads/global/pr ... utions.pdf
И еще - в даташите на дисковый ящик написано, что в кластерном варианте он только 13 дисков поддерживает (один из адресов занимается SAF-TE процессором). Значит один слот в нем нельзя занимать винтом - проверьте, не попали ли Вы именно туда.
Кроме того, на схеме есть по два винта в каждом сервере, подключенные к тому же перку (кстати непонятны их адреса - у вас указан только один адрес, хотя винтов по два). Эти винты ОБЯЗАНЫ висеть НЕ на одном канале с внешним ящиком. Посмотрите мануал рэйд контроллера - какие его разъемы к какому каналу относятся (на каждом канале по идее должен быть один внешний и один внутренний разъем).
В общем, надо сделать так:
1. Каналам рэйд контроллера, подключенным к внешнему ящику, назначить разные адреса, не пересекающиеся с адресами, которые могут занимать винты в этом ящике - скорее всего 6 и 7 (в том виде, как на картинке, вообще ничего работать и не должно).
2. Внутренние винты повесить на другой канал, если это еще не сделано.
3. Подключение стримера в данном случае неважно - он на другом адаптере висит (интегрированном) - с ним вроде все в порядке, хотя адреса выставлены как-то не по человечески.
И вот тут немного информации есть http://www.dell.com/downloads/global/pr ... utions.pdf
И еще - в даташите на дисковый ящик написано, что в кластерном варианте он только 13 дисков поддерживает (один из адресов занимается SAF-TE процессором). Значит один слот в нем нельзя занимать винтом - проверьте, не попали ли Вы именно туда.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
И общие рекомендации кластеростроения.
1. Не торопиться!!!
2. Включаем массив и ОДИН сервер, конфигурим его контроллер для кластерного режима (читаем мануал!!! - возможно требуется выключение write back кэша), создаем-инитим массивы.
3. Включаем второй сервер ОТДЕЛЬНО. Конфигурим его контроллер (опять же RTFM - кластер мода, непересечение адресов и т.п.).
4. Включаем все вместе и уюеждаемся, что железо все видится как надо.
5. Гасим один сервер, на второй накатываем и конфигурим софт - операционка и одну ноду кластера.
6. Подключаем второй сервер и конфигурим его софт и вводим как вторую ноду в уже существующий кластер.
7. Вуаля!
1. Не торопиться!!!
2. Включаем массив и ОДИН сервер, конфигурим его контроллер для кластерного режима (читаем мануал!!! - возможно требуется выключение write back кэша), создаем-инитим массивы.
3. Включаем второй сервер ОТДЕЛЬНО. Конфигурим его контроллер (опять же RTFM - кластер мода, непересечение адресов и т.п.).
4. Включаем все вместе и уюеждаемся, что железо все видится как надо.
5. Гасим один сервер, на второй накатываем и конфигурим софт - операционка и одну ноду кластера.
6. Подключаем второй сервер и конфигурим его софт и вводим как вторую ноду в уже существующий кластер.
7. Вуаля!

Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 7 гостей