Цели
понимать ключевые концепции и архитектуру DataStax Enterprise;
проектировать модели данных для Cassandra;
разрабатывать запросы на языке CQL;
работать с данными Cassandra из программ на Java;
обрабатывать в Spark данные, хранящиеся в Cassandra;
использовать возможности полнотекстового и графового поиска в DSE.
Целевая аудитория
Разработчики, архитекторы, разработчики баз данных.
Предварительная подготовка
Базовые навыки программирования на Java. Умение работать в командной оболочке Unix/Linux (bash). Опыт работы с базами данных желателен, но не обязателен.
В курсе изучается DataStax Enterprise – масштабируемая высокопроизводительная платформа распределенного хранения и обработки данных на основе Apache Cassandra. Изучаются основы архитектуры Cassandra 3.0+ , разработка концептуальных, логических и физических моделей данных, а также дополнительные компоненты платформы – аналитика, полнотекстовый поиск, работа с графами, средства управления кластером OpsCenter. Рассматриваются все необходимые технические подробности для использования Cassandra для масштабируемого хранения данных в проектах на Java, а также для мониторинга, конфигурирования и настройки производительности.
Описание
DataStax Enterprise – коммерческий дистрибутив, построенный на основе Apache Cassandra, добавляющий возможности полнотекстового поиска (Solr), аналитической обработки данных (Spark) и работы с графами.
Cassandra – распределенная отказоустойчивая масштабируемая нереляционная система управления базами данных, с равноправными узлами, очень быстрая на запись и просто быстрая на чтение, автоматически восстанавливающаяся при сбоях. Для доступа к данным имеется SQL-подобный язык. Курс посвящен изучению принципов, на которых она построена, методов создания баз данных для нее, написанию запросов на языке CQL и доступа к данным из прикладных программ.
Рассматриваются процессы чтения и записи данных, управления кластером, определения потребности в ресурсах, методы настройки производительности и мониторинга.