Блог Comindware

Почему данные – это НЕ новая нефть: пик экономики, основанной на применении искусственного интеллекта

Neil Ward-Dutton, MWD Advisors — директор службы исследований

У кого больше возможностей заработать на искусственном интеллекте и в чем они заключаются? Если пойти за деньгами, то куда они приведут?

Пару недель назад я написал в Twitter:

Размышляю про экономику ИИ в бизнесе. Есть подозрение: у средних и малых организаций возможностей намного меньше, чем у больших, при существующей технологии.

Я еще немного поразмышлял над этим.

Для начала, давайте проясним один момент. Я собираюсь использовать неоднозначный термин «ИИ», несмотря на то, что многих он раздражает. В данном случае я имею ввиду применение технологий машинного обучения (machine learning) и глубокого обучения (deep learning) для обнаружения закономерностей в данных, выделения категорий, оценок и прогнозирования.

Применение ИИ «из коробки»

Проблема в том, что не все ИИ-приложения одинаковы. Действительно, когда мы говорим об ИИ, мы имеем в виду специализированный искусственный интеллект: системы, созданные и обученные работать с определенными задачами.

Далее, возможности ИИ сильно варьируются от одной области к другой.

По сути, для некоторых областей применения подойдут универсальные обученные модели и алгоритмы, тогда как во многих других областях пользу принесут только специальным образом разработанные решения. Другими словами, для некоторых применений существует возможность обучить универсальную систему на базе широкого набора данных, что позволит ей хорошо работать с точки зрения разных пользователей. Но для многих приложений это очень далеко от реальности.

Хорошим примером универсально обучаемого применения является распознавание лиц: систему можно обучить на большой библиотеке изображений лиц, и после этого для распознавания вашего лица ей понадобится относительно небольшое дополнительное обучение. Данные для обучения получить легко: существуют десятки баз для обучения распознаванию лиц, которые доступны он-лайн бесплатно. (Если вы хотите узнать больше о распознавании лиц в общем, вам стоит ознакомиться с этим замечательным материалом).

Вы увидите, что для таких приложений создание коммерческого продукта достаточно очевидно: вы предоставляете решение, которое встраивается «как есть» в большую платформу, и готово.

То же можно в большей или меньшей степени сказать о применениях ИИ в области коммуникаций – распознавание речи, синтез речи, понимание естественного языка и тому подобное. Посмотрите наэту схему. Здесь я попытался показать, что разные ИИ-приложения требуют разных моделей внедрения.

Слева располагаются приложения более или менее универсальные; справа — те, которые должны быть намного более специализированным, чтобы приносить пользу.

Больше данных = лучше «упаковывается»

Для всех этих универсальных применений ключевым фактором является доступ к большим объемам данных для обучения.

А это в совокупности с возможностью широкого применения объясняет, почему операторы онлайновых платформ, ориентированных на конечных потребителей (Amazon, Google, Microsoft), с большой вероятностью и в ближайшем будущем будут снижать цену за эти услуги до нуля (уже можно увидеть, что Amazon делает с ценами на услуги ИИ, впервые анонсированные в 2016 году). Если вы продаете услуги универсального приложения ИИ как составляющую большого портфеля сервисов на базе прикладной платформы, то при очень высоких объемах цены естественным образом будут следовать за ценами комплекта.

Это также означает, что очень скоро ни IBM, ни кто-то другой из крупных поставщиков корпоративных систем (SAP, Oracle, Salesforce и т.д.) не смогут зарабатывать серьезные деньги на услугах из левой части графика.

Реальные деньги будут приходить из специализированных областей

Есть совершенно другие применения ИИ.

По мере того, как мы сдвигаемся вниз по графику от верхней точки слева, мы подходим к менее универсальным возможностям, которые можно применять во многих сценариях, но далеко не повсеместно. То, что имеет смысл для одного страховщика, желающего отсеять мошенников, можно частично распространить и на другого. Однако маловероятно, что можно полностью перенести и технологическое решение.

Один из способов «максимально упаковать» эти применения ИИ это их интеграция поставщиками в рамках облачных сервисов, которые сами по себе уже «упакованы» в какой-то мере (например, Einstein от компании Salesforce). В этом варианте, системы могут обучаться на (анонимных или мета-) данных, собираемых от широкого круга пользователей везде, где установлена система… так что даже если у одного пользователя недостаточно данных для обучения системы, данные, собираемые платформой в целом, дают необходимый объем.

Чем дальше мы перемещаемся по графику, тем в большей степени применения ИИ оказываются полезными только когда компоненты системы собираются под потребности пользователя, конфигурируются и обучаются в определенном окружении.

Для любого поставщика, который хочет играть на этом рынке, сложность состоит в том, как соединить в единое целое фреймворки, знания и консультирующий персонал, чтобы минимизировать объем работы (и время) на доработку под конкретного пользователя, необходимую чтобы решение представляло ценность для потребителя. В сегодняшнем мире с облачными технологиями в приоритете, мало организаций готовы ждать 9-12 месяцев или даже больше, чтобы получить то, что не гарантирует преимущество.

И все-таки, хвост – это хвост…

Последняя мысль, которую я хочу высказать, касается размера рынка для этих специализированных применений ИИ.

Нам никуда не деться от того факта, что, независимо от того, насколько универсальным является данное применение, чтобы сделать его действительно необходим доступ к значительному объему данных для обучения.

Малые и средние предприятия могут получить пользу от ИИ в верхней части кривой: там, где приложения можно упаковать и предложить широкой аудитории. А благодаря облачным сервисам, у них есть шанс получить пользу и от средней части графика.

Но извлечь пользу из применений, находящихся на «хвосте специализации», малым и средним предприятиям гораздо сложнее (особенно если эти применения нацелены на улучшение операций, используя данные от этих операций), потому что практически нет возможности получить достаточно данных.

Крупный банк будет взаимодействовать с десятками тысяч клиентов каждый месяц, и данные этого взаимодействия могут стать данными для обучения. Специализированная инженерная фирма работает максимум с десятком клиентов за месяц, это не даст достаточно топлива для ИИ.

Данные — это НЕ новая нефть

Я сбился со счета, сколько раз я видел презентации, где провозглашалось, что «данные – это новая нефть».

Да, на очень высоком уровне абстракции, обобщенные «данные» во все возрастающей степени становятся источником роста бизнеса и его конкурентного преимущества… Но когда дело доходит до конкретики и когда мы удаляемся от применений на универсальной верхней части кривой, эта аналогия начинает хромать.

Exit mobile version