Документ описывает функцию графического интерфейса для мониторинга состояния кластера.
Во время повседневной эксплуатации базы данных YMatrix выполняется большое количество SQL-запросов. Возможны проблемы, такие как сбои оборудования (например, отказ сети) или конфликты блокировок из-за высокой параллельности транзакций. Если такие проблемы не устраняются своевременно, они могут привести к замедлению ответов клиентов или прямым ошибкам, негативно влияя на эффективность бизнеса. Для более эффективного решения таких проблем функция графического мониторинга состояния помогает быстро выявлять аномальное поведение в кластере базы данных.
Мониторинг состояния периодически проверяет соответствующие системные каталоги в зависимости от различных параметров проверки. Он определяет, соответствуют ли состояния выполнения запросов ожидаемым бизнес-требованиям. При обнаружении отклонений от ожидаемых условий немедленно генерируется уведомление об оповещении. Уведомления можно просматривать в графическом интерфейсе. Для более своевременного оповещения вы также можете настроить получение уведомлений по электронной почте, если проверка веб-страницы затруднительна.
Введите IP-адрес (по умолчанию — IP-адрес хоста Master) и номер порта машины, на которой запущен MatrixGate, в браузер для входа в графический интерфейс.
http://<IP>:8240
После успешного входа перейдите на страницу Мониторинг состояния.

Вы можете выбрать, настраивать ли сервер электронной почты в зависимости от ваших потребностей. После настройки вы будете получать уведомления об оповещениях по электронной почте.
Доменное имя графического интерфейса
Для удобства быстрого доступа к деталям оповещения письмо содержит ссылку, перенаправляющую на графический интерфейс. Если получатели не могут получить доступ к домену по умолчанию, измените это поле соответственно.
Адрес SMTP-сервера
Адрес SMTP-сервера состоит из IP-адреса и номера порта. Пример: smtp.example.com:465.
Распространённые адреса сторонних сервисов электронной почты:
Alibaba Cloud Mail
Google Mail (Gmail)
Сначала включите службу IMAP или POP, см. документацию.
NetEase Mail
QQ Mail
Примечание!
Если служба электронной почты размещена самостоятельно, обратитесь к вашему администратору электронной почты или провайдеру услуг.
Имя пользователя
Учётная запись, используемая для аутентификации на SMTP-сервере. Необязательно; требуется только если SMTP-сервер требует аутентификацию по имени пользователя. Пример: [email protected].
Пароль
Пароль для учётной записи SMTP. Необязательно; требуется только если SMTP-сервер требует аутентификацию по паролю.
Примечание!
Если служба электронной почты размещена самостоятельно, обратитесь к вашему администратору электронной почты или провайдеру услуг.
Отправитель
Для сторонних сервисов электронной почты это поле должно совпадать с полем «Имя пользователя».
Для самостоятельно размещённых сервисов электронной почты введите адрес электронной почты отправителя.
Получатели
Введите один или несколько адресов электронной почты получателей.

Список содержит все элементы мониторинга, предоставляемые YMatrix. По умолчанию все элементы включены. Вы можете отключать или включать их по необходимости.

Если параметры по умолчанию не соответствуют вашему сценарию использования, вы можете изменить их.

| Элемент | Элемент мониторинга | Описание |
| 1 | Кластер недоступен | Периодически выполняет запрос SELECT * FROM gp_dist_random('gp_id'); для проверки доступности кластера. Если этот запрос трижды подряд завершается с ошибкой, кластер, вероятно, не работает. Возможные причины: сбой основного Segment и его зеркального Segment, сетевые проблемы, отключение питания или аппаратные неисправности. |
| 2 | Сбой Segment | Сбой основного Segment приводит к дисбалансу ресурсов на соответствующем зеркальном Segment. Хост зеркального Segment испытывает повышенную нагрузку, что замедляет выполнение запросов. В тяжёлых случаях может возникнуть исчерпание памяти, приводящее к недоступности кластера. Сбой зеркального Segment снижает доступность. Если одновременно выйдет из строя соответствующий основной Segment, кластер станет недоступным. |
| 3 | Запрос/транзакция выполняется более 12 часов | Длительные запросы/транзакции потребляют избыточную память и ЦП, замедляя отклик базы данных и потенциально вызывая OOM (исчерпание памяти). Они также могут задерживать процессы VACUUM. |
| 4 | Транзакция в состоянии "idle in transaction" более 1 часа | Длительное нахождение транзакции в состоянии "idle in transaction" блокирует большинство запросов, затрагивающих её таблицы, и препятствует VACUUM в освобождении мёртвых строк, вызывая раздувание таблиц. |
| 5 | Один запрос/транзакция блокирует более 5 других более 15 минут | Когда запрос/транзакция длительное время блокирует множество других, это может вызвать цепную реакцию блокировок, снижая отзывчивость сервиса. |
| 6 | Запрос, ожидающий эксклюзивной или AccessExclusive блокировки более 15 минут | Запрос, ожидающий эксклюзивной или AccessExclusive блокировки таблицы длительное время, может вызвать скопление заблокированных запросов, снижая эффективность отклика. |
| 7 | Запрос/транзакция удерживает эксклюзивную или AccessExclusive блокировку более 2 часов | Запрос/транзакция, удерживающая эксклюзивную или AccessExclusive блокировку таблицы длительное время, блокирует все запросы, обращающиеся к заблокированной таблице, снижая производительность. |
| 8 | Транзакция, удерживающая эксклюзивную или AccessExclusive блокировку в состоянии "idle in transaction" более 15 минут | Транзакция, удерживающая эксклюзивную или AccessExclusive блокировку и находящаяся в состоянии "idle in transaction" более 15 минут, блокирует большинство запросов к затронутым таблицам, снижая эффективность отклика. |
Если вы настроили SMTP-сервер, вы будете получать электронное письмо с оповещением при выполнении любого из условий, заданных в элементах мониторинга.

Независимо от настройки электронной почты, вы можете просматривать исторические записи событий кластера, вызвавших оповещения мониторинга, в разделе История событий.
