Что такое архитектура системы хранилища данных Amazon Redshift?

Cto Takoe Arhitektura Sistemy Hranilisa Dannyh Amazon Redshift



Размещение и управление данными в базах данных и хранилищах данных всегда было беспокойной и хлопотной задачей. Для понимания данных требуется много ресурсов и вычислительных мощностей. У Amazon Web Services есть универсальное решение для этой цели. У него есть сервис Amazon Redshift, который полностью управляет хранилищами данных пользователей.

В этой статье подробно объясняется Amazon Redshift и его архитектура хранилища данных. Будут подробно объяснены все компоненты архитектуры системы хранилища данных Redshift.







Что такое Amazon Redshift?

IT — это служба хранения данных, предоставляемая Amazon. Он эффективно управляет и анализирует большие наборы данных для аналитики и отчетности. Он построен на столбчатой ​​модели хранения. Он использует кластеры вычислительных узлов, управляемых ведущим узлом, для обеспечения высокопроизводительной обработки данных.



Он берет данные из разных источников и объединяет их в хранилище данных. Он предлагает различные функции, такие как обмен данными и аналитика в реальном времени. Посмотрите изображение ниже, чтобы понять функции и возможности Amazon Redshift:







Давайте теперь перейдем к архитектуре системы хранилища данных.

Что такое архитектура системы хранилища данных Amazon Redshift?

Эта системная архитектура состоит из трех основных частей. Эти части:



  • Хранилище
  • Ускорение
  • Вычисление

Давайте разберемся в их целях:

Хранилище
Часть хранилища посвящена услугам хранения данных Redshift. У него есть собственный вариант службы управляемого хранилища, а также вариант корзины S3.

Ускорение
Часть ускорения зависит от используемой службы хранения и используемой вычислительной мощности. Хранилище под управлением Redshift работает быстрее по сравнению с другими вариантами хранения.

Вычисление
Вычислительная часть касается исключительно используемой вычислительной мощности. Вычисления выполняются с помощью кластеров, а кластеры имеют узлы. Узлы, в свою очередь, имеют срезы.

Чтобы лучше понять все элементы и компоненты этой архитектуры, просмотрите изображение ниже:

Давайте разберемся в его компонентах один за другим.

Каковы архитектурные компоненты Amazon Redshift?

Ниже приведены архитектурные компоненты Amazon Redshift:

  • Кластеры
  • Узлы
  • Срезы узлов
  • Хранилище
  • Внутренняя сеть
  • Базы данных

Давайте обсудим их один за другим:

Кластеры
Кластер — это фундаментальная и основная единица. Он состоит из нескольких узлов. Если кластер состоит из нескольких вычислительных узлов, дополнительный узел-лидер подключается для координации деятельности этих вычислительных узлов и управления внешней связью.

Узлы

Узлы в кластерах бывают двух типов. Это:

  • Лидерный узел
  • Вычислительный узел

Давайте разберемся в этом по одному:

Лидерный узел
Он управляет связью с клиентскими программами и координирует взаимодействие с вычислительными узлами. Узел-лидер играет жизненно важную роль в выполнении сложных запросов. Он компилирует код на основе плана выполнения, который распространяется по вычислительным узлам, и назначает части данных каждому отдельному вычислительному узлу.

Вычислительный узел
Вычислительные узлы являются основой архитектуры Amazon Redshift. Они осуществляют как хранение, так и обработку данных. У них есть выделенные ресурсы, такие как память и процессор.

Срезы узлов
Вычислительные узлы дополнительно делятся на срезы. Эти фрагменты работают вместе для обработки назначенных рабочих нагрузок и достижения параллелизма для улучшения обработки запросов.

Хранилище
Хранение данных в Amazon Redshift управляется «Redshift Managed Storage (RMS)». Он имеет возможность масштабировать хранилище независимо, используя хранилище «Amazon S3». RMS использует высокопроизводительное локальное хранилище на базе SSD в качестве кэша первого уровня, что оптимизирует производительность.

Внутренняя сеть
Эта внутренняя сеть в Amazon Redshift помогает обеспечить быструю и безопасную связь между ведущими и вычислительными узлами. Эта сеть недоступна напрямую для клиентских приложений.

Базы данных
Кластеры имеют одну или несколько баз данных. Данные из этих баз данных находятся на вычислительных узлах. Клиентские приложения взаимодействуют с ведущим узлом. Вычислительный узел управляет выполнением запросов на всех вычислительных узлах.

Все дело в Amazon Redshift и его архитектурных элементах. В этой статье подробно объяснены рабочие компоненты Amazon Redshift.

Заключение

Архитектура Amazon Redshift является основой ее возможностей. Лидерный узел контролирует и управляет вычислительными узлами, а срезы узлов помогают в параллельной обработке. Redshift Managed Storage использует хранилище на базе SSD для повышения производительности. В этой статье объясняется архитектура системы хранилища данных Amazon Redshift.