Самообслуживание: проверка состояния

Документ описывает функцию самообслуживания для проверки состояния в графическом интерфейсе YMatrix.

Если функции мониторинга и оповещения можно сравнить с «скорой помощью» для кластера, то функция проверки состояния выполняет роль «регулярного медицинского осмотра». Регулярные проверки помогают лучше понять общее состояние кластера, своевременно выявлять потенциальные проблемы, определять оптимальное время для выполнения задач обслуживания, таких как VACUUM, предотвращать сбои и снижать операционную нагрузку.

Функция самообслуживания для проверки состояния в графическом интерфейсе YMatrix поддерживает:

  1. Создание пользовательских планов проверки путем выбора нужных пунктов проверки
  2. Генерацию подробных отчетов о проверке, включающих количество аномалий, критические проблемы, анализ результатов, рекомендации по дальнейшим действиям и журналы проверки

1 Предварительные требования

Сначала войдите в графический интерфейс. Введите IP-адрес и номер порта Master-узла в браузере:

http://<IP>:8240

2 Самообслуживание: проверка состояния

Страница самообслуживания для проверки состояния.

Создание пользовательского плана проверки.

Полный список пунктов проверки:

Категория Пункт проверки Уровень
Базовая информация кластера Проверка доступности всех экземпляров Высокий
Проверка состояния кластера Высокий
Проверка пользователей, у которых истекает срок действия пароля в течение 30 дней Средний
Проверка действительности лицензии Средний
Проверка состояния количества подключений Низкий
Проверка версии кластера Низкий
Состояние выполнения базы данных Проверка состояния MARS2/CV Высокий
Проверка наличия данных в разделах по умолчанию Высокий
Топ-10 самых старых баз данных Высокий
Проверка 20 самых больших бизнес-таблиц Средний
Просмотр топ-20 самых больших системных таблиц Средний
Проверка 20 самых долгих выполняющихся SQL-запросов Средний
Выявление таблиц с дисбалансом данных, превышающим 10 000 строк Средний
Проверка согласованности индексов между Master и Segment Средний
Проверка наличия core-файлов на каждом экземпляре Средний
Проверка статуса выполнения политики автоматического партиционирования Средний
Проверка таблиц HEAP/MARS2 с коэффициентом раздувания более 20% Средний
Просмотр топ-10 самых больших схем по размеру Низкий
Проверка 20 наименее используемых индексов Низкий
Проверка 20 индексов с наименьшим коэффициентом попаданий в кеш индексов Низкий
Проверка системных таблиц с чрезмерно большими индексами Низкий
Проверка 20 самых больших индексов Низкий
Проверка количества субпартиций для каждой партиционированной таблицы Низкий
Проверка на наличие дублирующихся индексов Низкий
Просмотр размера каждой базы данных Низкий
Проверка параметров Plpython Низкий
Проверка размера логов базы данных на всех экземплярах Низкий
Проверка параметров базы данных Низкий
Состояние выполнения сервера Проверка статуса процессов за последние 7 дней Высокий
Проверка использования сетевой пропускной способности за последние 7 дней Высокий
Проверка использования дискового пространства Высокий
Проверка использования дискового ввода-вывода за последние 7 дней Высокий
Проверка использования CPU за последние 7 дней Высокий
Проверка использования памяти Commit за последние 7 дней Высокий
Проверка системной нагрузки за последние 7 дней Низкий
Проверка использования пропускной способности ввода-вывода за последние 7 дней Низкий
Проверка параметров операционной системы Низкий
Состояние выполнения mxgate Проверка логов mxgate на наличие сообщений об ошибках Низкий
Проверка количества подключений к базе данных, используемых mxgate Низкий

Уровни серьезности пунктов проверки определены следующим образом:

Уровень Описание
Высокий Аномалии по этим пунктам могут повлиять на стабильность кластера
Средний Аномалии могут повлиять на отдельные бизнес-операции
Низкий Аномалии не влияют напрямую на текущие операции, но могут усугубиться со временем

Примечание!
Для подробного описания каждого пункта проверки обратитесь к отчету о проверке.