Data Science: Машинное обучение в R

кол-во дней: 5

вендор: Data Science кол-во часов: 40

код курса: DS-02

Описание
Программа курса

Данный курс предназначен для изучения алгоритмов машинного обучения с практическим применением техник машинного обучения реализованных в R. Рассматриваются понятия data mining, измерения производительности и уменьшения размерности, регрессионные модели, байесовская модель, SVM и ассоциативные правила для анализа. После успешного завершения данного курса вы сможете понимать и объяснять принципы работы алгоритмов машинного обучения, и применять данные алгоритмы на реальных задачах в больших данных.

Аудитория

Специалисты по работе с большими данными, бизнес аналитики и руководители, желающие получить расширенную теоретическую и практическую подготовку по методам Data Mining для участия в проектах анализа больших данных.

Предварительная подготовка

Понимание основ статистики
Опыт работы c R-Studio или знания в рамках курса : Анализ данных и визуализация в R

1. Основы статистики и простая линейная регрессия

Что такое ваши данные?
Статистические выводы
Введение в машинное обучение
Простая линейная регрессия
Диагностика и трансформация
Коэффициент определенности

2. Множественная линейная регрессия и обобщенная линейная модель

Множественная линейная регрессия
Допущения и диагностика
Обобщенные линейные модели
Логистическая регрессия
Оценка максимального правдоподобия
Интерпретация модели
Оценка соответствия модели

3. Алгоритм ближайших соседей, наивный байессовский анализ и «проклятие размерности»

Алгоритм K-ближайших соседей
Выбор К и меры расстояния
Условная вероятность: теорема Байеса
Оценка Лапласа
Уменьшение размерности
Процедура PCA
Ridge и регрессия Лассо
Перекрестная проверка

4. Метод опорных векторов и модели деревьев

Деревья решений. Bagging
Случайные леса. Boosting
Важность переменной
Сортировка полей и поддержка векторного классификатора
Метод опорных векторов

5. Кластерный анализ и нейронные сети

Кластерный анализ
K-means кластеризация
Иерархическая кластеризация
Нейронные сети и персептроны
Сигмоидные нейроны
Сетевая топология и скрытые функции
Метод обратного распространения ошибки с градиентным спуском

Data Science: Машинное обучение в R

Записать на курс

Ваша заявка успешно отправлена!