Вы строите приложения ИИ задом наперед: проблема модельного продукта

Большинство разработчиков ИИ строят продукты задом наперед. Они начинают с базовой модели, обертывают ее в интерфейс, а затем задаются вопросом, почему пользователи не получают необходимых результатов.

Я вижу этот шаблон повсюду. Разработчики относятся к таким моделям, как API: подключите их, настраивают некоторые параметры и корабль. Но фонд модели — это не утилиты — это отправные точки, которые инженеры должны формировать, тренироваться и соответствовать конкретным проблемам, с которыми сталкиваются их пользователи каждый день.

Почему модели общих фундаментов терпят неудачу для корпоративных приложений

Рассмотрим разработчик в компании по финансовым услугам, пытающейся использовать GPT-4 для создания приложения для инвестиционных исследований. Модель может анализировать финансовые документы и ответить на вопросы о тенденциях рынка. Тем не менее, это не понимает разницы между обычным вызовом доходов, который сигнализирует о крупном стратегическом сдвиге для бизнеса. Это не может отличить регулирующие заявки, которые имеют значение для ваших внутренних групп соответствия от тех, которые этого не делают.

Openai обучил GPT-4 для широких возможностей на всех тысячах доменов. Но этой компании по финансовым услугам нужна модель, которая понимает нюансы финансового анализа, нормативных требований и конкретных рабочих процессов менеджеров портфеля в команде.

Корневая проблема: две разные цели дизайна

Две совершенно разные группы с различными моделями проектирования целей и приложениями ИИ конечного пользователя-исследователей и разработчиков продуктов. Исследователи в Major Model Labs оптимизируют широкие возможности по академическим показателям. Часто они используют те же наборы обучения, что и их конкуренты. Но разработчики создают приложения для конкретных потребностей клиентов и рынка — обслуживание клиентов для приложения для доставки продуктов питания, генеративный графический дизайн для платформы производительности, автоматизированный анализ конкурентов для исследования рынка.

По дизайну эти подходы смещены. Исследователь в Openai, DeepSeek, Meta или Anthropic не строит модель, так что, когда консультант Deloitte говорит «анализировать этот отчет», он знает, чтобы сравнить данные клиента с конкретными конкурентами; или модель, которая понимает разницу между «срочным» для представителя обслуживания клиентов, а также врача, поступающего по медицинской диагностике. Разработчики.

Модель — сырье. Собственные данные разработчиков — это то, что превращает их в продукт, который соответствует рабочим процессам пользователей и бизнес -требованиям.

Что это значит для вашей стратегии продукта искусственного интеллекта?

Чтобы достичь выравнивания моделей, разработчики должны расставить приоритеты:

Цикл обратной связи с данными: создание моделей, которые на самом деле учатся у пользователей

Приложения, которые работают, создают петли обратной связи, где каждое взаимодействие с пользователем делает модель лучше для определенной задачи. Когда пользователь исправляет вывод приложения, эта коррекция возвращается в обучение модели. Когда пользователи игнорируют определенные предложения, модель учится перестать их делать.

Цикл обратной связи с данными создает составные преимущества. Больше пользователей генерируют более эффективные данные обучения, что улучшает производительность модели, что привлекает больше пользователей. Вместо того, чтобы ударить по стенам по мере масштабирования, эти системы улучшаются.

Этот подход требует лечения модели как часть разработки продукта, а не управления поставщиками. Это означает управление производительностью модели в разных сегментах пользователей и решение новых задач, связанных с версиями моделей и развертыванием.

Состав модели: как ведущие компании объединяют несколько систем ИИ

Наиболее дифференцированные приложения ИИ составляют несколько моделей и модальности для решения проблем, а не полагаться на одну модель. Логистическая компания может объединить компьютерное зрение на сканирование пакетов с обработкой естественного языка для связи с клиентами, а затем прогнозное моделирование для оптимизации маршрута — все это работает в качестве единой системы.

Это требует инженеров, которые понимают модельную архитектуру и могут принимать стратегические решения о том, когда использовать поколение поиска, по сравнению с тонкой настройкой специализированной модели.

Приложения, которые выиграют, не являются привилегированными доступа к моделям с закрытым исходным кодом. Они те, которые имеют выделенные ресурсы для настройки моделей с открытым исходным кодом на ценные конечные продукты посредством тщательного выравнивания, сбора данных и итерационного улучшения.

Разработчики, которые решают эту проблему выравнивания рано, будут строить рва, которые невозможно воспроизвести. Те, кто не будет конкурировать с функциями, которые любой конкурент может скопировать, переключившись на последний API модели с закрытым исходным кодом.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Lin Qiao является генеральным директором и соучредителем Fireworks AI Platform Platform, который расширяет возможности разработчиков и предприятий, таких как Uber, Verizon, Cursor и понятие для создания высоко оптимизированных и готовых к производству приложений Genai. До создания фейерверков Лин был со-создателем и … Подробнее от Lin Qiao

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *