Цель курса – предоставить слушателям знания и навыки, необходимые для проектирования и внедрения архитектуры Lakehouse с использованием Microsoft Fabric. Участники изучат основные принципы и подходы к интеграции различных источников данных, обеспечению хранения и обработки больших объемов данных, а также реализации аналитических решений на базе Lakehouse. Курс охватывает оснащение участников инструментами для оптимизации производительности и безопасности решений, а также управления жизненным циклом данных.
Аудитория
Этот курс предназначен для специалистов в области данных, включая аналитиков данных, инженеров по данным и облачным технологиям, архитекторов систем и ИТ-специалистов, которые занимаются разработкой и внедрением аналитических решений на базе Lakehouse. Он также будет полезен руководителям проектов и бизнес-аналитикам, стремящимся углубить свои знания в области обработки данных и создать эффективные решения для работы с большими объемами неструктурированных и структурированных данных.
По окончании курса слушатели смогут:
Необходимая подготовка
Для эффективного обучения на курсе слушатели должны обладать следующими знаниями и навыками:
Модуль 1: Начало работы с lakehouse в Microsoft Fabric
Темы
Лабораторная работа: Создание lakehouse в Microsoft Fabric
Модуль 2: Использование Apache Spark в Microsoft Fabric
Темы
Лабораторная работа: Анализ данных с помощью Apache Spark
Модуль 3: Работа с таблицами Delta Lake в Microsoft Fabric
Темы
Лабораторная работа: Использование дельта-таблицы в Apache Spark
Модуль 4: Загрузка данных с помощью Dataflows Gen2 в Microsoft Fabric
Темы
Лабораторная работа: Создание и использование Dataflow Gen2 в Microsoft Fabric
Модуль 5: Оркестрация процессов и перемещение данных с помощью Microsoft Fabric
Темы
Лабораторная работа: Загрузка данных с помощью конвейера