Казахстан, г. Алматы, ул. Шевченко 90, БЦ «Каратал», офис 53
Казахстан, г. Нур-Султан, ул. Иманова 19, БЦ Деловой Дом "Алма-Ата", офис 612

Даты проведения курса

Выберите удобное для вас число,
запишитесь на курс, заполнив простую форму

город: Нур-Султан
город: Online
записаться на курс
направление: BigData кол-во дней: 2
кол-во часов: 16

В курсе рассматриваются вопросы:

  • типы данных: структурированные и неструктурированные;

  • основные характеристики больших данных и способы их анализа;

  • основные понятия машинного обучения; 

  • основы статистического анализа, построение регрессионных зависимостей;

  • визуализация «больших данных»;

  • обзор классов задач, решаемых инструментами машинного обучения и ИИ: распознавание образов, звуков, текста, прогностика, анализ соцсетей;

  • специальности в области «больших данных» и формирование команд: аналитики данных, «ученые по данным», программисты по «большим данным», менеджеры по «большим данным» (CDO).

  • методы реорганизации работы компании при применении анализа «больших данных».

Предлагаемый курс позволит управляющему персоналу, менеджерам, разработчикам, другим сотрудникам, вовлеченным в аналитическую деятельность своей компании, ознакомиться с современными инструментами сбора, подготовки, обработки и анализа больших объемов разнородных данных.

По итогам курса Вы будете уверенно ориентироваться в мире «больших данных», машинного обучения и сможете организовывать команды для работы с «большими данными» и определите направление своего профессионального развития в этой области.

Вы научитесь:

  • понимать концепцию больших данных (Big Data);

  • применять стандартный CRISP-DM процесс для Вашей организации;

  • определять источники сбора информации и формировать требования к ним;

  • подбирать команду для работы с большими данными (Big Data);

  • знать основные современные инструменты анализа данных;

  • выбирать инструментарий для практической работы;

  • владеть базовыми понятиями математической статистики;

  • применять специализированные инструменты Excel – «Пакет анализа данных» и «Тренды»;

  • реорганизовывать управление процессами компании на основе анализа больших данных;

  • распознавать типовые задачи машинного обучения: анализ трендов, социальных сетей; распознавание графических, видео- и аудио-образов, текста; прогностика действий (на примере социальных сетей).

Предварительная подготовка:

Успешное окончание курса Microsoft Excel 2019/2016. Уровень 1. Работа с Excel 2019/2016 или эквивалентная подготовка.

Цель курса:

Цель курса - ознакомиться с современными подходами к анализу «больших данных». Полученные знания и навыки позволят слушателям повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших объемов данных: Data – Information – Knowledge – Wisdom: от данных - к мудрости в принятии решений!

Модуль 1. Очень большие данные.

  • Цели и задачи курса

  • Введение в большие данные

  • Почему нужно проводить анализ больших данных

  • Продвинутые задачи анализа данных: прогнозирование рынка, производства, спроса, поведения игроков. Анализ текстов, распознавание образов, распознавание речи.

Модуль 2. Начало работы с данными.

  • Описание стандартной методики CRISP-DM.

  • Типы исследований данных. Как проводится первичная работа с большими данными.

  • Описательное и ассоциативное исследование данных.

Модуль 3. Сегментирование и очистка данных.

  • Сортировка – смотрим на данные с разных углов.

  • Избавляемся от лишнего с помощью фильтрации.

  • Выделение важных полей. Условное форматирование.

Модуль 4. Визуализация данных и первичный анализ.

  • Визуальное представление данных с помощью диаграмм.

  • Сводные таблицы. Как выразить целый датасет в небольшой таблице.

  • Практика с тренировочным набором данных.

Модуль 5. Описательный анализ в «Analysis ToolPak». Основы математической статистики.

  • Основные описательные статистики.

  • Меры центральной тенденции.

  • Параметры рассеяния.

  • Распределение данных.

  • Составление гистограмм.

Модуль 6. Анализ данных с помощью пакета «Analysis ToolPak».

  • Однофакторный дисперсионный анализ (ANOVA).

  • Корреляция данных.

  • Регрессионный анализ.

  • Построение трендов и их анализ.

  • Проверка гипотез. F-Анализ. t-Анализ.

  • Практика с тренировочным набором данных.

Модуль 7. Продвинутый анализ больших данных.

  • Инструменты и платформы для анализа данных.

  • Machine Learning – как автоматизировать сложные задачи.

  • Дальнейшее развитие в области анализа данных: кто такие Data Engineer и Data Analyst.