Восстановление после сбоев

YMatrix — это высокодоступная распределённая база данных, поддерживающая восстановление после сбоев узлов. Высокая доступность обеспечивается за счёт избыточного развертывания: узел Master должен иметь резервный узел Standby; для узлов данных (Segments) каждый узел Primary должен иметь соответствующий зеркальный узел Mirror.

Следующая диаграмма иллюстрирует типичное развертывание с высокой доступностью:

При сбое узла в кластере вы можете проверить статус узла через графический интерфейс (MatrixUI). В данном примере Master — mdw, Standby — smdw, а Segments — sdw1 и sdw2, каждый из которых имеет свой Mirror.

Принципы развертывания:

Master и Standby развертываются на отдельных независимых хостах.
Primary и Mirror каждого Segment развертываются на разных хостах.
Узлы Primary Segment равномерно распределены по хостам.

Такое развертывание исключает возможность отказа системы из-за сбоя одного хоста и обеспечивает балансировку нагрузки в кластере.

Ниже описаны автоматические механизмы обслуживания кластеров YMatrix и решения для различных сценариев сбоев узлов.

1 Механизм

YMatrix поддерживает Cluster Service для автоматизированного обслуживания. Эта служба включает две ключевые функции: автоматическое переключение (failover) и автоматическое восстановление (failback) (реализованы с помощью инструмента mxrecover). Вместе они обеспечивают полный цикл восстановления узлов.

1.1 Автоматическое переключение (Failover)

Автоматическое переключение — это механизм, при котором при обнаружении сбоя узла через проверки состояния кластера etcd система автоматически меняет роли между Primary и Standby узлами. Кластер etcd является центральным компонентом Cluster Service YMatrix и управляет состоянием всех узлов. При возникновении сбоя любого узла база данных автоматически выполняет переключение без участия оператора.

1.2 Автоматическое восстановление (Failback)

После завершения failover остаётся только новый Primary/Master — здоровых Mirror/Standby больше нет. При возникновении нового сбоя восстановление станет невозможным. Поэтому для создания нового здорового Mirror/Standby для повышенного Primary/Master используйте инструмент mxrecover.

Инструмент mxrecover предоставляет следующие функции:

Восстанавливает ранее отказавшие узлы Mirror/Standby
Создаёт новые Mirror/Standby для узлов, переведённых в роль Primary/Master
Перераспределяет роли узлов в соответствии с исходной конфигурацией

Примечание!
Подробное использование mxrecover см. в документации mxrecover.

2 Сценарии сбоев узлов

2.1 Сбой узла Mirror / Standby

Когда система обнаруживает сбой узла Mirror/Standby, его статус в графическом интерфейсе изменяется на down.

Примечание!
Сбой Mirror не влияет на доступность кластера, поэтому система не восстанавливает его автоматически.
Для восстановления Mirror используйте инструмент mxrecover — см. ниже.

Если время простоя было небольшим, а объём данных на отказавшем узле невелик, сначала попробуйте инкрементальное восстановление. Запуск mxrecover без параметров или с параметром только -c запускает режим инкрементального восстановления. Если инкрементальное восстановление не удаётся, выполните полную репликацию данных для восстановления узла с помощью команды mxrecover -F.

2.2 Сбой узла Primary / Master

При сбое узла Primary система автоматически повышает его Mirror до роли Primary.

2.2.1 Восстановление отказавшего Mirror / Standby

После того как система повысила Mirror/Standby до Primary, запустите mxrecover, чтобы создать новый Mirror/Standby для текущего Primary/Master и синхронизировать данные инкрементально или полностью, восстановив отказавший узел. Простой запуск mxrecover восстанавливает отказавший Mirror/Standby с использованием инкрементального восстановления. Как указано выше, используйте mxrecover -F, чтобы принудительно выполнить полное восстановление при необходимости.

[mxadmin@mdw ~]$ mxrecover

2.2.2 Перераспределение ролей узлов

Хотя mxrecover создаёт новый Mirror для повышенного Primary, это может привести к неравномерному распределению — один хост теперь управляет двумя Primary узлами (например, оба на sdw2). Это вызывает дисбаланс ресурсов и увеличивает нагрузку на sdw2.

Для перераспределения ролей выполните:

[mxadmin@mdw ~]$ mxrecover -r

После выполнения mxrecover -r проверьте обновлённую конфигурацию на странице управления кластером в графическом интерфейсе.

3 Влияние переключения Master на компоненты и рекомендуемые действия

Переключение Master происходит в двух случаях:

Сбой кластера: графический интерфейс показывает, что кластер недоступен — полностью нечитаем и незаписываем.
Аномалия кластера: интерфейс показывает аномалию — некоторые экземпляры нездоровы, но кластер остаётся работоспособным для чтения и записи.

Ниже подробно описано влияние переключения Master на различные компоненты и рекомендуемые действия для каждого сценария.

3.1 Графический интерфейс (MatrixUI)

Аномалия кластера

Это означает, что после сбоя Master произошло переключение, и Standby теперь управляет кластером.

В этом случае обращайтесь к графическому интерфейсу на узле Standby. Стандартный адрес — http://<standbyIP>:8240.

Вы можете войти, используя либо пароль базы данных mxadmin, либо пароль суперпользователя /etc/matrixdb5/auth.conf на узле Standby.

Все функции остаются полностью доступными после входа. Красный цвет слева указывает на отказавший узел; жёлтый — на завершённое переключение.

Сбой кластера

Это означает, что весь кластер недоступен. Вы всё ещё можете получить доступ к MatrixUI через узел Master для просмотра статуса, но функциональность запросов к базе данных будет ограничена.

Примечание!
Если ваш кластер изначально не имел настроенного Standby, но позже добавил его с помощью инструмента mxinitstandby, поведение будет аналогично предварительно настроенному Standby.

Примечание!
Всегда настраивайте Standby в production-средах.

3.2 MatrixGate

Аномалия кластера

Произошло переключение — Standby теперь управляет кластером.

Возможны два сценария:

Если Standby был настроен до запуска MatrixGate: MatrixGate автоматически обнаруживает информацию о подключении Standby при запуске — ручное вмешательство не требуется.
Если Standby был добавлен после запуска MatrixGate: поскольку MatrixGate проверяет наличие Standby только при запуске, новые Standby не вызывают автоматического переключения. Рекомендуется настраивать Standby до развертывания MatrixGate или перезапускать MatrixGate после добавления Standby.

Сбой кластера

MatrixGate размещён на хосте Master, который отказал, сделав кластер неработоспособным.

В этом случае процесс MatrixGate считается умершим или изолированным от сети вместе с хостом.

3.3 Мониторинг (развёрнутый через SELECT mxmgr_init_local())

Аномалия кластера

MatrixGate автоматически перенаправляет вставку данных мониторинга на Standby. Мониторинг продолжается без перерыва — ручное вмешательство не требуется.

Для просмотра дашбордов Grafana вручную обновите источник данных, указав адрес Standby.