24 июля 2009 г.

Отказоустойчивый кластер MC/ServiceGuard

Если Вы попали на проект, где есть отказоустойчивый кластер на базе ПО HP MC/ServiceGuard, а Вы никогда с таким не сталкивались, то этот пост Вам поможет.
Отказоустойчивый кластер от HP абсолютно прозрачен. У вас есть 2 или более серверов, которые называются нодами или узлами кластера. У серверов общий дисковый массив (VolumeGroups переводятся в статус кластерных и активируются только кластером). Единицей кластера является пакет. В пакет входит ваше ПО (команды старта и останова), команды активации и монтирования файловых систем с общего дискового массива и виртуальный сетевой интерфейс, через который и работают пользователи с системой. Кластерное ПО отслеживает состояние всех нод кластера. Если основной узел целиком или частично(диски, сетевой интерфейс) теряет работоспособность, то пакет на нем останавливается (если это еще необходимо) и запускается на резервном узле кластера (см. рисунок). Этот процесс называется перетеканием. Пакетов в кластере может быть несколько.


Теперь от теории перейдем к практике. Куда смотреть:
  • Команда cmviewcl на любом узле кластера. Показывает информацию о названии и состоянии кластера, пакета и узлов.
  • Директория /etc/cmcluster - хранит все настройки кластера и пакетов.
  • В качестве журнала для сообщений кластерное ПО использует системный лог - /var/adm/syslog/syslog.log.
  • Журнал пакета следует искать в поддиректориях /etc/cmcluster. Имеет вид *.cntl.log.
  • Автостарт кластера настраивается в файле /etc/rc.config.d/cmcluster. В ручную запускается командой cmruncl.
  • Старт и останов пакета - командами cmrunpkg и cmhaltpkg. Подробности в руководстве man ОС.
Надеюсь, этот пост даст Вам начальные знания по данной теме. А дальше дело за Вами.
В учебном центре HP в Москве читают курс H6487S - HP ServiceGuard. Есть возможность - стоит сходить. Если к тому же попадете к Максиму Мошкову, как я в свое время, не пожалеете. :)

Автор: Шиболов Вячеслав Анатольевич


6 комментариев:

  1. Вячеслав, а у Вас есть действующий HP SAID? "Патчуете" свои сервера регулярно ил нет?

    ОтветитьУдалить
  2. Николай, а что такое HP SAID? Сервера на HP-UX есть, но с версией 11.11. Работают, не трогаю. :)

    ОтветитьУдалить
  3. SAID - Service Agreement ID. Года полтора назад ХП решили сделать сервис получения патче платным, и после покупки лицензии на поддержку дают такой сэйд. У меня его нет, а я хочу поставить софт HP APA для объединения сетевых плат в один интерфейс (аналог microsoft load balancing). Только нужны два драйвера для этого софта, а без сэйда их никак не получить. Думал у Вас есть возможность скачать :)

    ОтветитьУдалить
  4. Интересно, спасибо за разъяснение. Патч-бандлы последний раз ставил года 2-3 назад, не знал о таком нововведении.

    ОтветитьУдалить
  5. В-общем, настроил я HP APA на серверах, отклик теперь гораздо меньше. Вячеслав, а Вы настраивали такой конфиг? Может знаете подводные камни, на которые надо обратить внимание в будущем?

    ОтветитьУдалить
  6. Нет, Николай. Я с таким не сталкивался. Я начинал когда-то свою карьеру с позиции Unix-администратора. Сейчас этим уже не так плотно занимаюсь. Поэтому в данном вопросы Вы скорее всего компетентнее меня. =)

    ОтветитьУдалить