Казахстан, г. Алматы, ул. Шевченко 90, БЦ «Каратал», офис 53
Казахстан, г. Астана, ул. Иманова 19, БЦ Деловой Дом "Алма-Ата", офис 612

направление: Microsoft Power Platform and BI Analytics кол-во дней: 1
вендор: Microsoft кол-во часов: 8
код курса: DP-3011

Цель курса – предоставить участникам знания и практические навыки, необходимые для разработки и реализации аналитических решений с использованием Azure Databricks. Слушатели научатся интегрировать различные источники данных, применять методы анализа и визуализации данных, а также применять инструменты машинного обучения для получения инсайтов и поддержки принятия бизнес-решений.

Аудитория

Этот курс предназначен для специалистов по данным, аналитиков, дата-инженеров и разработчиков, которые хотят освоить платформу Azure Databricks и использовать её возможности для анализа большого объёма данных. Курс будет полезен также для ИТ-специалистов и руководителей, заинтересованных в внедрении решений по обработке и анализу данных для улучшения бизнес-процессов и принятия более обоснованных управленческих решений.

По окончании курса слушатели смогут:

  • Создавать рабочую область Azure Databricks
  • Определять основные рабочие нагрузки и роли пользователей для Azure Databricks
  • Описывать ключевые концепции решения на базе Azure Databricks
  • Описывать ключевые элементы архитектуры Apache Spark
  • Создавать и настраивать кластер Spark
  • Описывать примеры использования Spark
  • Использовать Spark для обработки и анализа данных, хранящихся в файлах
  • Использовать Spark для визуализации данных
  • Описывать основные функции и возможности Delta Lake
  • Создавать и использовать таблицы Delta Lake в Azure Databricks
  • Создавать таблицы каталога Spark для данных Delta Lake
  • Использовать таблицы Delta Lake для потоковых данных
  • Создавать и настраивать SQL-склады в Azure Databricks
  • Создавать базы данных и таблицы
  • Создавать запросы и панели мониторинга
  • Описывать, как блокноты Azure Databricks могут выполняться в конвейере
  • Создавать связанный сервис Azure Data Factory для Azure Databricks
  • Использовать активность блокнота в конвейере
  • Передавать параметры в блокнот

Необходимая подготовка

Для эффективного обучения на курсе слушатели должны обладать следующими знаниями и навыками:

  • Опыт программирования на Python или Scala
  • Глубокие знания SQL и обработки данных
  • Понимание концепций больших данных и распределенной аналитики
  • Знакомство с Azure Databricks и его экосистемой
  • Опыт работы с фреймворками для обработки данных
  • Знание принципов инженерии данных
  • Понимание архитектур данных в облаке
  • Опыт работы с ETL/ELT конвейерами данных
  • Знакомство с концепциями производительности и оптимизации

 

Модуль 1: Изучение Azure Databricks

Темы

  • Начало работы с Azure Databricks
  • Определение рабочих нагрузок Azure Databricks
  • Понимание ключевых концепций
  • Управление данными с помощью Unity Catalog и Microsoft Purview

Лабораторная работа: Исследование Azure Databricks

Модуль 2: Выполнение анализа данных с помощью Azure Databricks

Темы

  • Загрузка данных в Azure Databricks
  • Инструменты для анализа данных в Azure Databricks
  • Анализ данных с использованием API DataFrame

Лабораторная работа: Исследование данных с помощью Azure Databricks

Модуль 3: Использование Apache Spark в Azure Databricks

Темы

  • Знакомство со Spark
  • Создание кластера Spark
  • Использование Spark в блокнотах
  • Работа с файлами данных с использованием Spark
  • Визуализация данных

Лабораторная работа: Использование Spark в Azure Databricks

Модуль 4: Управление данными с помощью Delta Lake

Темы

  • Начало работы с Delta Lake
  • Управление ACID-транзакциями
  • Реализация соблюдения схемы
  • Версионирование данных и временные перемещения в Delta Lake
  • Целостность данных с Delta Lake

Лабораторная работа: Использование Delta Lake в Azure Databricks

Модуль 5: Создание конвейеров данных с помощью Delta Live Tables

Темы

  • Изучение Delta Live Tables
  • Загрузка данных и интеграция
  • Обработка в реальном времени

Лабораторная работа: Создание конвейера данных с помощью Delta Live Tables

Модуль 6: Развертывание рабочих нагрузок с помощью Azure Databricks Workflows

Темы

  • Что такое Azure Databricks Workflows?
  • Понимание ключевых компонентов Azure Databricks Workflows
  • Изучение преимуществ Azure Databricks Workflows
  • Развертывание рабочих нагрузок с использованием Azure Databricks Workflows

Лабораторная работа: Создание рабочего процесса Azure Databricks