Природа и сущность предиктивного анализа

Природа и сущность предиктивного анализа

До появления компьютеров, интернета и цифровых технологий сбор, хранение и обработка информации были тяжким и слишком затратным по времени занятием. Теперь все по-другому: информация собирается постоянно и с большой скоростью, стоимость хранения намного меньше, чем была раньше, да и времени столько уже не требуется. Понятие «Big Data» появилось как отображение возможностей хранения и анализа / обработки данных. Получение внутренних зависимостей, не видимых ранее, возможно только с использованием большого объема данных.

Сегодня все вертится вокруг данных и их использования, изучаются привычки, манеры поведения, зависимости между различными одушевленными и неодушевленными предметами. Чем больше данных, тем:

  • более точный результат их анализа возможен;
  • тем меньше зависимость от неточных значений и ошибок.

Сами по себе данные не дают нам информации о причинах их появления, а лишь указывают на значения, что уже достаточно для их дальнейшего анализа. Например, данные об активности банковских операций могут натолкнуть на мысль о финансовом здоровье рынка и отдельных слоев общества.

А можно ли предсказать будущее с достаточной точностью и вероятностью, как для индивида или производства, для общества или всего человечества? Да, можно, имея данные и соответствующие алгоритмы, используя предиктивную аналитику (predictive analytics).

Основная цель предиктивной аналитики – это понять поведение и предсказать действия людей в ответ на возникающие события. Такие алгоритмы достаточно динамичны, адаптируемы, могут основываться на машинном обучении, используя накопленную статистику и строя модели на основе полученных данных и сравнивая их с реальностью.

При всех прелестях такой обработки всегда будут возникать вопросы конфиденциальности, корректности использования предиктивной аналитики в отношении людей. Например, любое неверное предсказание может испортить жизнь человеку раз и навсегда, приписав ему неверный диагноз в результате неправильного анализа медицинских показателей. Анализ психоэмоциональных данных может отнести здорового человека к группе потенциальных преступников, которым он не является, а в конечном счете и сделать его таковым.

Корректность входящих данных и правильный их подбор, количество и сбалансированность приводят к более точному прогнозу.

Используя предиктивный анализ с элементами машинного обучения, мы пытаемся создать модель поведения, адаптируемую и развивающуюся, которая повысит степень предсказания.

Для процесса производства важно не только предсказывать значимые события в рамках предприятия, но и уметь предвидеть мелкие нарушения и ошибки. Интеллектуальные алгоритмы позволяют видеть не только удаленные события, но и решать проблемы всех уровней в краткосрочной перспективе. Нельзя забывать, что нужно быть аккуратным в машинном обучении, ведь мы можем и неправильно обучиться, что приведет к неправильным действиям. При этом негативные результаты полезны, ибо на них тоже можно учиться.

Нельзя полностью полагаться на предиктивные алгоритмы, иногда большого количества данных недостаточно. Нужен человек, обладающий знаниями и аналитическими способностями – тот, кто может поставить задачи, проанализировать отклонения и сами модели, скорректировать интеллектуальные алгоритмы и т.д.

Этапы предиктивной аналитики

1. Сбор данных позволяет направить потоки и разобрать данные из различных источников и различного типа. Это могут быть абсолютно разношёрстные данные, структурированные, получаемые из баз данных или разрозненные, находящиеся на различных ресурсах.

2. Очистка необходима для подготовки данных, оценки их целостности и доступности: отслеживание дублирования, некорректных значений, автоматическое исправление пропущенных величин и т.д.

3. Трансформирование (преобразование) обеспечивает агрегирование, объединение различных потоков данных, их параметризацию.

4. Интеллектуальный анализ использует различные методы и модели для получения основных зависимостей, скрытых значений и показателей из очищенных и преобразованных данных. На данном этапе возможно использование специальных языков программирования (Python, R) и различных математических алгоритмов Маркова, кластерного анализа и т.д.

Работе data-аналитика больше присущ бизнес-ориентированный подход, и она привносит человеческий фактор, нежели работа математической модели или научного алгоритма.

В итоге, использование данных, совместно с их анализом, статистики и машинного обучения создает предиктивную модель для прогнозирования будущих событий и вероятностей. Например: как долго производственная линия будет работать до начала необходимого обслуживания, или, какова вероятность снижения качества продукта. При такой модели в большинстве случаев ставятся бизнес цели, а сам процесс определяет, как их достичь.
Предиктивная модель может самообучаться с использованием различных входных данных и подходов, а в дальнейшем быть использована на актуальных значениях.

5. Визуализация представляет собой представление полученных результатов в виде удобочитаемых графиков, таблиц, диаграмм.

Когда предиктивные алгоритмы работают и модель отлажена, наступает черёд прескриптивной аналитики, которая полностью минимизирует факт участия человека и определяет процесс принятия решения, с учетом результатов предиктивной части.

Таким образом, благодаря возможностям машинного обучения, искусственного интеллекта, разного рода данных, предиктивная аналитика становится точным инструментом прогнозирования и обнаружения скрытых зависимостей и особенностей.

Наш совет начать с малого и внедрить небольшие предиктивные модели в вашем бизнесе с конкретной постановкой целей, получить результаты, а дальше масштабировать и совершенствовать, вовлекая все новые и новые бизнес-процессы. Наличие открытых площадок и облачных технологий позволяет с минимальными затратами начать этот процесс в вашей компании.

Gennady Bylov
Размещено 17 Февраль 2020 Кем Gennady Bylov, Country Sales Manager Russia & CIS, Rockwell Automation
  • Контакт:

Подписаться

Компания Rockwell Automation и наши партнеры обладают исключительным опытом в проектировании, реализации и поддержке проектов автоматизации.

Подписаться

Откройте для себя продукты, а также инновационные решения и инструменты, о которым мы рассказываем.