Данный документ представляет общую архитектуру и связанные концепции YMatrix.
Из-за нестабильности, высокой стоимости, низкой производительности и большого времени отклика сложных многоуровневых стеков технологий обработки данных предприятиям сложно максимально эффективно использовать их потенциал.
Чтобы снизить сложность экосистемы данных, YMatrix разработала простую архитектуру с генами гиперконвергенции, объединяющую вычислительные, хранилищные и сетевые ресурсы в единую систему. Она основана на системе массово параллельной обработки (MPP) и соответствует принципам микроархитектуры.
Эта архитектура гибкая и адаптируется к различным сценариям: она не только оптимизирована для сценариев IoT с временными рядами, но и поддерживает традиционные аналитические хранилища данных и задачи бизнес-аналитики (BI).
Замена традиционных стеков технологий данных на гиперконвергентную архитектуру может показаться сложной задачей. Но зачем это нужно?
На самом деле, независимо от сценария, полное внедрение гиперконвергентной архитектуры приносит выгоду многим предприятиям, предоставляя единую основу для данных в их сложных ИТ-системах, включая умные подключенные автомобили, промышленный интернет, умное производство, умные города, энергетику, финансы, фармацевтику и другие отрасли.
По сравнению со сложными стеками технологий данных, такими как экосистема Hadoop, архитектура YMatrix обладает следующими преимуществами:
Гиперконвергенция
Высокая доступность
Богатая экосистема инструментов
Поддержка стандартного SQL
Полная поддержка транзакций ACID
В отличие от баз данных с другими архитектурами, гиперконвергенция YMatrix проявляется в интеграции множества типов данных и операций с ними, обеспечивая высокопроизводительную поддержку множества типов данных + множества сценариев в рамках одной базы данных. Внутренняя архитектура YMatrix основана на микроядре. На основе общих компонентов ядра предоставляются различные комбинации движков хранения и выполнения, чтобы удовлетворить потребности различных бизнес-сценариев, позволяя различным микроядрам достигать целенаправленного улучшения производительности записи, хранения и запросов.
Ниже приведена диаграмма, иллюстрирующая состав и функции внутренней гиперконвергентной архитектуры YMatrix:
_1696644131.png)
Следующие разделы содержат подробный обзор компонентов гиперконвергентной архитектуры YMatrix:
Общие компоненты ядра
Это в первую очередь общие ресурсы базы данных, такие как управление памятью, протоколы сетевого взаимодействия и базовые структуры данных.
Движки хранения и выполнения
Это комбинации движков хранения и выполнения, которые можно выбирать при создании таблиц в YMatrix для разных сценариев. Каждая комбинация формирует микроядро.
Оптимизатор
Преобразует SQL-строку в план запроса и генерирует оптимальный план на основе возможностей выбранного нижележащего движка хранения.
Журналирование, транзакции, управление конкурентностью, блокировки, снепшоты
Это стандартные компоненты ядра YMatrix, обеспечивающие общие функции, такие как контроль конкурентности, механизмы транзакций и восстановление после сбоев.
SQL
Это стандартный SQL-интерфейс между YMatrix и клиентом.
Аутентификация, роли, аудит, шифрование, мониторинг, резервное копирование, восстановление, высокая доступность
Это другие распространенные функции базы данных, поддерживаемые YMatrix.
Высокоуровневая архитектура базы данных YMatrix основана на классической архитектуре MPP (массово параллельной обработки) с некоторыми усовершенствованиями.
Ниже приведена диаграмма, описывающая основные компоненты системы базы данных YMatrix и их взаимодействие:
Следующие разделы содержат подробное описание различных компонентов системы базы данных YMatrix и их функций.
Узел Master
Узлы данных (Segments)
Клиент (Client)
MatrixGate
Сетевой уровень (Interconnect)
Служба управления состоянием данных (Cluster Service)