Казахстан, г. Алматы, ул. Шевченко 90, БЦ «Каратал», офис 53
Казахстан, г. Астана, ул. Иманова 19, БЦ Деловой Дом "Алма-Ата", офис 612

29 января 2020

Аналитик big data обучениеЦенность аналитики растет вместе с ценностью данных, потому что это как раз тот инструмент, без которого ее не раскрыть. Основатель консалтинговой компании Zimana Пьер Дюбуа объясняет, что ключом к успешному внедрению инструментов предсказательной (прогнозной) аналитики является привлечение ИТ-команды, причем делать это нужно как можно раньше.

Прогнозная аналитика сегодня — это ключевой элемент для определения потребностей клиентов и бизнес-возможностей, которые можно почерпнуть из данных. Однако ее применение связано с рядом сложностей, и самая серьезная из них — создание качественной прогностической модели с описанием данных, их источников и важнейших взаимосвязей. Чтобы придать деталям связность, на ее создание потребуется выделить хорошие бизнес-ресурсы. Также помимо прочего важно задействовать ИТ-департамент — жизненно важный ресурс для быстрого выявления возможностей эффективной работы с данными. На этапе подготовки прогнозной модели аналитику нужно найти наилучший подход для ее реализации. Вместе с тем, когда на старте реализации проекта подключается ИТ-персонал, проще определить круг задач, которые могут быть не столь очевидны с самого начала.

Проведение цифровой инвентаризации

Наилучшие способы создания модели прогнозной аналитики связаны с рядом ключевых моментов на начальных этапах проекта. Предполагается, что изначально аналитик должен очертить круг вопросов, на которые прогнозная модель должна найти ответы при помощи данных. Фактически она должна отображать статистическую связь данных с поставленными целями. После постановки задачи аналитику следует обратиться к ИТ-специалистам с целью выяснить, имеются ли у них необходимые данные. Допустим, аналитику нужно выяснить, как пассажиры авиакомпании реагируют на изменение услуг, предлагаемых на рейсах, отталкиваясь от данных опроса. Для этого ему потребуется создать список данных и метаданных, которые касаются клиентской активности.

В свою очередь ИТ-команда может проверить их на предмет корректного отображения в БД или отзывчивости по API. Этот список — точка пересечения проекта с ИТ-ресурсами, она показывает степень их взаимодействия. Аналитические решения должны работать таким образом, чтобы потоки связующих данных можно было масштабировать для лучшего соответствия целям и ресурсам. На рынке технологий существует множество вариантов, и ИТ-специалисты могут подсказать, как их наилучшим образом использовать.

Определение качества данных

На втором этапе взаимодействия с ИТ нужно выработать детальный план решения проблемы с качеством прогнозной модели. Аналитику следует разобраться с тем, как выбросы (резко отличающиеся значения), аномалии и другие отклонения от нормы влияют на качество. ИТ-специалисты могут решить эти проблемы, которые, как правило, возникают при опросе запрашиваемых источников данных. Документирование аномалий способствует общему пониманию того, какие ошибки являются техническими, например, проблемы с датчиками, а какие связаны с реальной работой аналитического движка и быстро распознаются аналитиками. Чтобы поддерживать точность модели и решать проблемы по мере их появления, команде лучше всего действовать в тесном контакте.

Выберите лучшие функции по самой низкой цене

Подключение айтишников к команде аналитиков также может оказать благоприятное воздействие на прикладное обучение признакам. Конструирование признаков — это выбор переменных, которые, как предполагается, являются лучшими предикторами для вывода, который требуется получить от модели. Конструирование признаков является фундаментом для приложений машинного обучения.

За счет расширенного анализа прогнозной модели, обученной при помощи набора данных, проверенных в SPSS, или программного кода на языках R или Python, можно создавать метрики, которые позволяют пользователям сравнивать прогнозирующее влияние выбранных переменных. Переменные, которые статистически менее влиятельны, могут быть удалены. Анализ может носить повторяющийся характер, если переменные статистически близки с точки зрения принятия решения.

Помощь ИТ-специалистов на этапе конструирования пригодится тогда, когда существует сложность доступа к данным. Она заключается в том, что они могут предложить альтернативные способы. К примеру, предприятие может вести собственные базы данных, ведая их обслуживанием. ИТ-персонал может настроить права доступа к данным, которые будут являться переменной величиной. Близость данных особенно важна, если модель будет использоваться для машинного обучения. Чем эффективнее предприятие проведет подготовку по сокращению времени, которое необходимо для анализа данных на экспериментальной стадии, тем ему будет проще определить приоритетность необходимых ресурсов (в первую очередь это касается данных для анализа) и, в свою очередь, выделить затронутые бизнес-операции.

Анализ метрик позволяет узнать, какие сегменты клиентов влияют на увеличение расходов по категориям, с его помощью ритейлеры могут выяснить, какие продукты предлагать по акциям, тогда как сервисным фирмам он может подсказать, как повысить продажи за счет своих лучших клиентов. Отраслевой опыт и знания помогут определить влияние данных второй или третьей стороны на клиентскую модель для определения способности по удержанию клиентов на более длительное время. В этом контексте ИТ-подразделение могло бы помочь определить затраты на получение этих данных и подсказать, какие бизнес-операции анализ затронет.

Прогнозная аналитика предназначена для моделирования бизнес-решений и просмотра результатов. В свою очередь ИТ-отдел помогает выявить операционные компромиссы, которые влияют на моделируемые решения, сократить техническую задолженность, а также другие финансовые затраты, связанные с принятием решения. Конечным результатом является усовершенствованный процесс анализа, который действительно быстрыми темпами продвигает фирму на пути к пониманию своих клиентов.

Аналитик big data обучение

Источник: itweek.ru