Где нужен ML, а где нет?
Сразу уточним: у DS\разработчиков - ML, а потребителям\управленцам более знаком AI.
С точки зрения менеджеров и продаж всё круто. Две буквы AI успешно завоёвывает инфополе.
Разработка, бытовая техника, потребительские рекомендации - везде появляется AI.
Может возникнуть чувство, что это некая волшебная таблетка.
Но давайте посмотрим на ML как на инструмент и попробуем оценить границы применимости.
Какие есть факторы?
1. Предсказуемость, интерпретируемость результатов работы
2. Существует ли процесс
3. Нужен ли творческий подход
4. Ограничения по железу
5. Ограничения по финансам
6. Самое главное: профит от внедрения должен превысить затраты
Некоторые примеры, когда ML не нужен
0. хорошо работает эвристика
Пример: Генри Форд говорил: любой цвет хороший, если он чёрный. Это позволило снизить издержки и выпустить самый доступный автомобиль.
Если мы не хотим давать пользователю слишком большой выбор, то можно выделить базовые несколько вариантов, которые покроют 90% потребностей.
1. задача решается алгоритмом и данные не меняются
Пример: парсинг автомобильных номеров. Мы знаем структуру, стандарты меняются крайне редко, вполне достаточно регулярного выражения + обработки ошибок.
2. процесс не описан
Пример: ответственности сотрудников размыты, каждый понимает процесс разработки по-своему. ML только добавит неопределённости.
Исключения: различные процессы в науке, которые не могут быть описаны алгоритмически из-за своей сложности.
Но и для их оптимизации в некоторых случаях достаточно генетических алгоритмов.
3. нет данных или они плохого качества
Пример: хотим выполнять рекомендации для покупателей, но у нас нет достаточной истории продаж, сезонности итп. Сначала необходимо построить минимальную ETL систему, собрать данные для анализа, провести аналитику, и только после этого решать: возможно, для целей бизнеса будет достаточно простой эвристики.
4. безопасность важнее
Пример: контроль второй руки на критичных действиях в банке.
Вполне возможно реализовать ML систему, которая будет выявлять злоумышленников, аномалии в поведении, автоматически включать период охлаждения...
Но за этим сразу тянутся вопросы точности и полноты, а также ответственности за неправильные решения.
Второй человек будет принимать решение дольше, но ответственность сразу на нём - поэтому выбор очевиден.
5. окупаемость и потенциальная экономия
Пример: вы делаете повторяющееся действие раз в 4 месяца, тратите на него 10 минут.
Если вы потратите 180 минут на внедрение ML, то они окупятся через 6 лет.
Пишите в комментарии, у кого были подобные ситуации?
Где нужен ML, а где нет?
Павел Алексеев