Размещение и управление данными в базах данных и хранилищах данных всегда было беспокойной и хлопотной задачей. Для понимания данных требуется много ресурсов и вычислительных мощностей. У Amazon Web Services есть универсальное решение для этой цели. У него есть сервис Amazon Redshift, который полностью управляет хранилищами данных пользователей.
В этой статье подробно объясняется Amazon Redshift и его архитектура хранилища данных. Будут подробно объяснены все компоненты архитектуры системы хранилища данных Redshift.
Что такое Amazon Redshift?
IT — это служба хранения данных, предоставляемая Amazon. Он эффективно управляет и анализирует большие наборы данных для аналитики и отчетности. Он построен на столбчатой модели хранения. Он использует кластеры вычислительных узлов, управляемых ведущим узлом, для обеспечения высокопроизводительной обработки данных.
Он берет данные из разных источников и объединяет их в хранилище данных. Он предлагает различные функции, такие как обмен данными и аналитика в реальном времени. Посмотрите изображение ниже, чтобы понять функции и возможности Amazon Redshift:
Давайте теперь перейдем к архитектуре системы хранилища данных.
Что такое архитектура системы хранилища данных Amazon Redshift?
Эта системная архитектура состоит из трех основных частей. Эти части:
- Хранилище
- Ускорение
- Вычисление
Давайте разберемся в их целях:
Хранилище
Часть хранилища посвящена услугам хранения данных Redshift. У него есть собственный вариант службы управляемого хранилища, а также вариант корзины S3.
Ускорение
Часть ускорения зависит от используемой службы хранения и используемой вычислительной мощности. Хранилище под управлением Redshift работает быстрее по сравнению с другими вариантами хранения.
Вычисление
Вычислительная часть касается исключительно используемой вычислительной мощности. Вычисления выполняются с помощью кластеров, а кластеры имеют узлы. Узлы, в свою очередь, имеют срезы.
Чтобы лучше понять все элементы и компоненты этой архитектуры, просмотрите изображение ниже:
Давайте разберемся в его компонентах один за другим.
Каковы архитектурные компоненты Amazon Redshift?
Ниже приведены архитектурные компоненты Amazon Redshift:
- Кластеры
- Узлы
- Срезы узлов
- Хранилище
- Внутренняя сеть
- Базы данных
Давайте обсудим их один за другим:
Кластеры
Кластер — это фундаментальная и основная единица. Он состоит из нескольких узлов. Если кластер состоит из нескольких вычислительных узлов, дополнительный узел-лидер подключается для координации деятельности этих вычислительных узлов и управления внешней связью.
Узлы
Узлы в кластерах бывают двух типов. Это:
- Лидерный узел
- Вычислительный узел
Давайте разберемся в этом по одному:
Лидерный узел
Он управляет связью с клиентскими программами и координирует взаимодействие с вычислительными узлами. Узел-лидер играет жизненно важную роль в выполнении сложных запросов. Он компилирует код на основе плана выполнения, который распространяется по вычислительным узлам, и назначает части данных каждому отдельному вычислительному узлу.
Вычислительный узел
Вычислительные узлы являются основой архитектуры Amazon Redshift. Они осуществляют как хранение, так и обработку данных. У них есть выделенные ресурсы, такие как память и процессор.
Срезы узлов
Вычислительные узлы дополнительно делятся на срезы. Эти фрагменты работают вместе для обработки назначенных рабочих нагрузок и достижения параллелизма для улучшения обработки запросов.
Хранилище
Хранение данных в Amazon Redshift управляется «Redshift Managed Storage (RMS)». Он имеет возможность масштабировать хранилище независимо, используя хранилище «Amazon S3». RMS использует высокопроизводительное локальное хранилище на базе SSD в качестве кэша первого уровня, что оптимизирует производительность.
Внутренняя сеть
Эта внутренняя сеть в Amazon Redshift помогает обеспечить быструю и безопасную связь между ведущими и вычислительными узлами. Эта сеть недоступна напрямую для клиентских приложений.
Базы данных
Кластеры имеют одну или несколько баз данных. Данные из этих баз данных находятся на вычислительных узлах. Клиентские приложения взаимодействуют с ведущим узлом. Вычислительный узел управляет выполнением запросов на всех вычислительных узлах.
Все дело в Amazon Redshift и его архитектурных элементах. В этой статье подробно объяснены рабочие компоненты Amazon Redshift.
Заключение
Архитектура Amazon Redshift является основой ее возможностей. Лидерный узел контролирует и управляет вычислительными узлами, а срезы узлов помогают в параллельной обработке. Redshift Managed Storage использует хранилище на базе SSD для повышения производительности. В этой статье объясняется архитектура системы хранилища данных Amazon Redshift.