Как AgentKit OpenAI встраивает ChatGPT в любой веб-сайт

AgentKit — это комплексный набор инструментов, который позволяет разработчикам интегрировать агентов на базе ChatGPT в веб-сайты и приложения. Он был представлен на конференции OpenAI DevDay 2025 как способ создания ИИ-агентов, которые не только общаются, но и выполняют такие действия, как просмотр страниц, вызовы API и выполнение многоэтапных задач.

По сути, AgentKit предоставляет архитектуру и строительные блоки, необходимые для встраивания помощников на основе ChatGPT непосредственно в ваш продукт. В этой статье рассматривается архитектура AgentKit, включая его основные компоненты, и демонстрируется, как она позволяет легко встроить функциональность, подобную ChatGPT, в любой веб-сайт.

Основы OpenAI AgentKit

По своей сути AgentKit построен на прочной основе, состоящей из двух основных серверных компонентов: API ответов и SDK агентов. Они образуют механизм, обеспечивающий все функции AgentKit:

API ответов: Обрабатывает структурированные выходные данные и интерфейс вызова функций OpenAI (т. е. использование инструментов). Когда агенту необходимо использовать внешний инструмент или API, API ответов форматирует запрос, выполняет вызов функции и возвращает результаты в структурированном формате, понятном агенту. Это избавляет разработчиков от необходимости анализировать выходные данные или вручную обрабатывать ошибки интеграции инструментов.

Агенты SDK: Предоставляет среду выполнения и уровень оркестрации для агентов. Он управляет состоянием разговора на протяжении нескольких ходов, упорядочивает многоэтапные вызовы инструментов, обрабатывает повторные попытки и ошибки, а также обеспечивает соблюдение логики потока управления агента. Этот SDK позволяет агенту сохранять память и логические рассуждения на всех этапах без написания разработчиком шаблонного кода для связывания подсказок или отслеживания контекста. Agents SDK можно использовать непосредственно в коде для полного контроля или получить доступ через инструменты более высокого уровня, такие как визуальный конструктор.

На практике API Responses и SDK Agents означают, что разработчикам не нужно изобретать заново низкоуровневую инфраструктуру для управления диалогами или инструментов.

Все остальное в AgentKit построено поверх этих двух слоев. На практике эта архитектура означает, что разработчикам не нужно заново изобретать низкоуровневую инфраструктуру для управления диалогами или инструментов — эти возможности предоставляются «из коробки». Рабочие процессы AgentKit можно определить визуально или в коде, а платформа незаметно управляет потоковой передачей ответов, состоянием и инструментами. Эта архитектура ускоряет разработку за счет обработки общих шаблонов агентов и повышает надежность за счет предоставления протестированной среды выполнения со встроенной обработкой ошибок и проверками безопасности.

Безопасность и ограждения также являются неотъемлемой частью архитектуры AgentKit. Платформа включает в себя функции проверки входных данных, фильтрации выходных данных и маскировки PII (личной информации) для предотвращения вредоносных запросов и утечек конфиденциальных данных. Эти ограждения действуют как уровень безопасности вокруг агента, сканируя все, что входит в модель и выходит из нее. Хотя они и не являются надежными, они значительно снижают риски при развертывании агентов ИИ на реальных пользовательских данных, блокируя попытки взлома и удаляя личную информацию из журналов. Разработчики могут регулировать строгость ограждения в зависимости от варианта использования. Например, ужесточение ограничений для финансового чат-бота по сравнению с менее чувствительным внутренним инструментом. Такая конструкция, ориентированная на безопасность, гарантирует, что встроенные агенты ChatGPT ведут себя ответственно на веб-сайтах и ​​в приложениях.

Строительные блоки AgentKit

AgentKit предоставляет набор модульных компонентов, которые работают вместе, позволяя быстро создавать, развертывать и внедрять агенты на базе ChatGPT. Эти компоненты абстрагируют общие функции — такие как построение потоков диалога или подключение к источникам данных — поэтому вы можете сосредоточиться на логике вашего варианта использования, а не на инфраструктуре.

Ниже приведены основные компоненты и их функции:

Агент Строитель: Визуальный редактор рабочих процессов для разработки логики работы агента и потока разговоров. Вместо написания кода оркестрации разработчики могут перетаскивать на холст узлы, представляющие подсказки, вызовы инструментов, ветки и другие действия. Вы соединяете узлы, чтобы определить логику принятия решений агентом и настроить параметры каждого узла. Agent Builder поддерживает управление версиями и предварительные запуски, что означает, что вы можете безопасно изменять структуру своего агента. Вы можете тестировать новые версии рабочего процесса, не влияя на производство, и даже экспортировать визуальный поток в код, когда будете готовы его точно настроить или расширить в своей собственной базе кода. Этот визуальный подход значительно ускоряет создание прототипов сложных многоэтапных агентов, упрощая совместную работу над логикой агентов как разработчикам, так и неразработчикам.

Реестр соединителей: Библиотека готовых интеграций для подключения агентов к внешним системам и API. Реальным агентам часто необходимо получать данные или инициировать действия в других службах, таких как базы данных, приложения SaaS и внутренние API. Реестр соединителей предоставляет готовые соединители для таких распространенных служб, как Dropbox, Google Drive, SharePoint, Microsoft Teams и других.

Каждый соединитель поставляется с предварительно запрограммированным кодом для обработки аутентификации, вызовов API, ограничений скорости и ошибок, поэтому вы можете выбрать соединитель, настроить разрешения и подключить его к своему рабочему процессу без написания специального кода интеграции. Этот центральный реестр позволяет администраторам управлять доступом к данным в одном месте — вы можете контролировать, какие соединители включены, безопасно управлять учетными данными и централизованно отслеживать использование. Если необходимая интеграция недоступна, разработчики могут создавать собственные соединители, соответствующие одному и тому же интерфейсу, и использовать их в разных проектах. Реестр соединителей упрощает связывание вашего агента ChatGPT с остальной частью вашего технологического стека, что является критически важной возможностью для внедрения агента в реальные рабочие процессы бизнеса.

ЧатКит: Встраиваемый набор инструментов пользовательского интерфейса чата для развертывания интерфейса агента на вашем веб-сайте или в приложении. ChatKit обрабатывает весь интерфейс чата — отображение сообщений, потоковые ответы, поле пользовательского ввода, историю разговоров и т. д. — поэтому вам не придется создавать пользовательский интерфейс чата с нуля. Разработчики просто добавляют компонент ChatKit и направляют его на конечную точку API своего агента, мгновенно получая в своем продукте помощника в стиле ChatGPT. Это означает, что вы можете встроить помощника на базе ChatGPT непосредственно в любой веб-сайт или приложение с минимальными усилиями.

Внешний вид ChatKit легко настраивается, что позволяет вам согласовать дизайн виджета с фирменным стилем вашего сайта (цвета, шрифты, макеты). Под капотом он использует WebSockets для потоковой передачи ответов по токенам для обеспечения плавного и интерактивного взаимодействия. Используя ChatKit, разработчики встраивают помощников в стиле ChatGPT в веб-сайты и приложения, поэтому одинаковые возможности искусственного интеллекта сопровождают пользователей, где бы они ни работали.

Короче говоря, ChatKit обеспечивает интеграцию ChatGPT на любой сайт, предоставляя готовый интерфейс чата. Разработчики просто встраивают его и позволяют ему общаться с вашим сервером AgentKit. Это значительно сокращает время разработки интерфейса (экономит «недели» работы по созданию пользовательского интерфейса чата в реальном времени). При необходимости команды по-прежнему могут создавать собственный интерфейс для уникальных случаев использования, но ChatKit охватывает большинство сценариев диалогового агента.

Инструменты оценки и отслеживания: Создание агента ИИ — это итеративный процесс, и AgentKit включает в себя инструменты для оценки и отладки производительности агента. Платформа позволяет вам создавать наборы оценочных данных (наборы тестовых запросов и ожидаемых ответов или результатов) и запускать на их основе ваш агент для измерения точности, качества ответа и других показателей. Он поддерживает специальные «оценщики» — автоматические проверки или функции проверки человеком — для оценки ответов агента на предмет правильности, актуальности и безопасности. Это помогает определить, где агент может допускать ошибки.

AgentKit также предоставляет журналы трассировки для каждого разговора, показывая пошаговые рассуждения агента: какие инструменты он пробовал, какие данные получил и как решил сделать следующий шаг. Трассировка позволяет разработчикам проверять и отлаживать сложные многоэтапные рабочие процессы, воспроизводя то, что «думал» агент на каждом этапе. Эти функции оценки и отслеживания необходимы при встраивании агента ChatGPT в рабочий веб-сайт. Они дают разработчикам возможность видеть решения агента и систематически их улучшать. Фактически, AgentKit может даже автоматически предлагать быстрые улучшения на основе отзывов об оценке, ускоряя цикл доработки для вашего агента.

AgentKit поддерживает постоянное совершенствование агентов посредством обратной связи.

Циклы обучения и совершенствования с подкреплением: Помимо разовых оценок, AgentKit поддерживает постоянное совершенствование агентов посредством обратной связи. Разработчики могут определять функции вознаграждения или собственные показатели успеха и использовать их для точной настройки поведения агента с течением времени. Этот механизм точной настройки подкрепления использует сигналы обратной связи для корректировки стратегии агента.

AgentKit предоставляет инфраструктуру для сбора реальных отзывов пользователей, регистрации взаимодействий и выполнения итеративного переобучения без создания отдельного конвейера. Хотя разработчики должны тщательно определять, что означает «хорошее» поведение, этот цикл позволяет встроенному агенту стать умнее и лучше адаптироваться к вашему домену при взаимодействии с пользователями. С практической точки зрения, агент на вашем веб-сайте может постепенно научиться более точно обрабатывать запросы ваших пользователей, включая обратную связь, и все это управляется с помощью инструментов AgentKit.

Встроенные ограждения: Как упоминалось ранее, функции безопасности являются ключевым компонентом. AgentKit интегрирует OpenAI Guardrails, библиотеку безопасности с открытым исходным кодом, непосредственно в агенты, обеспечивая настраиваемые политики для фильтрации контента и безопасных действий. Вы можете разрешить охранникам автоматически проверять вводимые пользователем данные на предмет запрещенного контента или шаблонов, которые пытаются обмануть ИИ, и аналогичным образом очищать выходные данные агента.

Существуют варианты маскировки личных данных, предотвращения использования определенных инструментов (например, ограничение доступа агента к данным, доступным только для чтения, а не их удаление) и требование одобрения человека для важных действий. Эти ограждения настраиваются для каждого рабочего процесса и помогают гарантировать, что агент ChatGPT, встроенный в веб-сайт, работает в допустимых пределах, обеспечивая надежную помощь и не допуская нарушений. Например, бот службы поддержки клиентов может иметь строгие фильтры, чтобы не давать финансовых советов или раскрывать данные учетной записи, тогда как бот для внутренних исследований может иметь больше свободы. Объединяя функции защиты, AgentKit избавляет разработчиков от необходимости реализовывать собственные проверки безопасности и упрощает уверенное развертывание агентов.

Компоненты, работающие вместе

Все эти компоненты работают вместе. Когда вы встраиваете ChatGPT на веб-сайт с помощью AgentKit, вы используете Agent Builder (или код), чтобы определить, что должен делать агент, соединители для связи агента с необходимыми внешними данными/службами, ChatKit для размещения интерфейса чата на вашем сайте, чтобы пользователи могли общаться с агентом, а также Evals/monitoring для отслеживания и улучшения производительности агента.

Тяжелая работа, такая как управление состоянием диалога или внутренний вызов GPT-4/GPT-5, выполняется API-интерфейсом Responses и основой Agent SDK, поэтому вы можете сосредоточиться на создании функций, а не на сантехнике.

Заключение

AgentKit от OpenAI представляет собой значительный шаг в обеспечении повсеместного распространения искусственного интеллекта в стиле ChatGPT в повседневном программном обеспечении. Его архитектура абстрагирует тяжелую работу по созданию ИИ-агента в платформу, которую разработчики могут легко подключить к своим собственным продуктам.

Основные компоненты, такие как Agent Builder, Connector Registry и ChatKit, предоставляют высокоуровневый набор инструментов для разработки того, что должен делать агент, и его развертывания на любом веб-сайте или в приложении с минимальным пользовательским кодом. Реальные примеры использования показывают, что компании используют AgentKit для создания агентов, которые автоматизируют поддержку клиентов, повышают производительность инструментов и оптимизируют бизнес-процессы, и все это за счет внедрения возможностей ChatGPT там, где они нужны пользователям.

Для разработчиков AgentKit предлагает более быстрый и надежный путь от идеи до готового к использованию ИИ-агента, эффективно позволяя ChatGPT жить на вашем веб-сайте или в приложении в качестве полезного помощника, выполняющего действия. Благодаря встроенным циклам оценки и улучшения эти агенты могут постоянно совершенствоваться, превращая перспективу использования ИИ-помощника на каждом веб-сайте не просто в рекламу, а в достижимую реальность с помощью правильных инструментов.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Джанакирам MSV — главный аналитик Janakiram & Associates и внештатный преподаватель Международного института информационных технологий. Он также является сертифицированным облачным разработчиком Google, сертифицированным архитектором решений Amazon, сертифицированным разработчиком Amazon,… Читать далее от Джанакирама MSV

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *