IBM спонсировал этот пост.
Генеративный AI (Genai) уже преобразует то, как мы взаимодействуем с API, и в центре внимания переходит к следующему скачке в эволюции ИИ: агент AI.
Агент ИИ относится к интеллектуальным системам, которые могут рассуждать, планировать и действовать автономно. Эти агенты могут интерпретировать целей пользователей, обнаружить инструменты (API), причину о том, когда и как их использовать, а затем выполнять рабочие процессы. Это может изменить то, как API используются, документированы и выставлены.
Агент ИИ может принципиально изменять потребление API, обеспечивая естественное, автономное обнаружение и исполнение API, управляемое естественным языком.
Проблемы с потреблением API агентские адреса
API должны быть обнаруженными, описательными и с учетом контекста, чтобы агенты искусственного интеллекта работали правильно. Вот некоторые из проблем, которые могут возникнуть иначе, и потенциальные решения.
1. Неоднозначность в картировании намерений
Большинство пользователей не говорят в структурированных схемах API. Они выражают то, что хотят на естественном языке:
«Разместите заказ на два iPhone 16s для клиента Джона».
Традиционные интеграции API требуют явного знания, по которой конечная точка вызывает, какие параметры необходимы и какой формат требуется. Это может привести к трениям, ошибкам и медленной интеграции.
Agentic AI использует структурированные метаданные для решения этого, заземляя намерение естественного языка в исполняемые вызовы функций. Он может анализировать запрос пользователя, поиск соответствующих инструментов и генерировать правильный вызов API.
Пример
Агент отображает намерение с правильной функцией, основанной на семантическом соответствии с описанием инструмента и схемы.
2. Отсутствие структурированных, самоописанных APIS
Большинство API были построены для человеческих разработчиков: Swagger Specs, Docds и примеры. Тем не менее, агентам искусственного интеллекта нуждается в машиночитаемых схемах, чтобы рассуждать о возможностях, требованиях к вводу и ограничениям.
Агент AI работает, когда API обнажают следующее в структурированном формате:
- Имя функции и описание
- Входные параметры с типами и ограничениями
- Требования к аутентификации
- Выходная схема
- Ошибки и ограничения
Пример схемы инструментов
Эта структура позволяет агентам:
- Проверить входные данные перед выполнением.
- Создайте динамические пользовательские интерфейсы (UI).
- Выберите инструменты на основе контекста и типа задачи.
3. Неизвестный вызов инструмента и планирование
В традиционных рабочих процессах API вручную сшиваются в логику автоматизации. С агентом ИИ планирование и исполнение динамичны. Агент:
- Читает каталог инструментов.
- Соответствует цели текущего пользователя с наиболее релевантным инструментом.
- Заполняет параметры из контекста или подсказок.
- Аутентифицирует безопасность.
- Выполняет инструмент и наблюдает за результатами.
Пример
Пользовательская подсказка: «Войдите в билет для пользователя 1234, говоря, что их отправка не прибыла».
Вызов агента
4. Выбор правильного инструмента из аналогичных вариантов
API часто имеют совпадающие функциональность:
- GetWeathertoday против GetWeatherForeCast
- Searchflights против рекомендаций
Агенты используют семантическое сходство Чтобы выбрать правильный инструмент. Тем не менее, чрезмерное сходство может запутать агента.
Решение
- Используйте подробные, неопределенные описания.
- Включите возможности или теги намерений.
- Оценка инструмента релевантности на основе встраивания сходства плюс исторический успех.
Пример каталога с возможностями
Сопоставляя пользовательский ввод с возможностями, агенты могут устранение устранения устранения и выбора и выбрать более точно.
Как структурированные метаданные обеспечивают поведение динамического агента
Структурные схемы инструментов помогают агентам следующим образом:
Описание: Намерение заземления; Карты подсказывают использование. Параметры: проверка ввода, генерация пользовательского интерфейса, заполнение слот для подсказок. Auth: выполнение происходит только с действительными учетными данными. Возможности: включить многоэтажное планирование и цепочку совместимых инструментов. Пределы тарифов: пусть агент разум о политике повторения или доступности инструментов.
Эти метаданные являются основой для декларативная, самообвишаемая API, потребляемый агентами без ручного программирования.
Пример: сквозное планирование агентом
Пользовательская подсказка: «Перевести« Доброе утро »на испанский и отправьте его в качестве сообщения Карлосу».
Инструменты в каталоге:
Агент рассуждения
Давайте рассмотрим инструментальные звонки с участием больших языковых моделей (LLMS).
Вот пример http get endpoint от спецификации OpenAPI, чтобы получить подробную информацию о конкретном порядке на основе OrderNumber:
Вот пример модели модели протокола контекста (MCP) фрагмент сервера из приведенной выше спецификации, который возвращает подробности о конкретном порядке на основе OrderNumber:
Вот фрагмент кода для клиента MCP, обнаружив инструменты:
В этом примере показан MCP, вызывающий сервер MCP без участия LLM.
Источник: IBM.
А вот и агент по вызову с запросом пользователя, который использует LLM:
Запрос пользователя: «Получите данные заказа для номера заказа 1.»
Источник: IBM.
Добавьте еще один API заказа на сервер MCP. На этот раз сделайте описание немного более конкретным.
Клиент MCP теперь обнаруживает две конечные точки:
Источник: IBM.
На этот раз, для того же запроса пользователя, агент использует новый обновленный API:
Запрос пользователя: «Получите данные заказа для номера заказа 1.»
Источник: IBM.
Заключение
Метаданные влияют на то, как агенты выбирают API над другим. Настройка метаданных может иметь нежелательные последствия.
Агент AI быстро переопределяет способ использования API:
- API должен быть самоописанием, машиночитаемым и намеренным.
- Каталоги инструментов должны выставлять метаданные, такие как схема, параметры, возможности и ограничения.
- Агенты могут динамически рассуждать, планировать и вызывать API, разблокируя быстрые, умные и более автономные интеграции.
По мере того, как мы переходим в эпоху развития AI-коренного развития, проектирование для потребления в первую очередь не является обязательным-это основа для интеллектуальной автоматизации и адаптивных рабочих процессов в гибридных средах, а протоколы, такие как MCP, играют решающую роль в этой эволюции.
IBM работает над тем, чтобы обеспечить автономию, интеллект и сотрудничество в интеграцию предприятия. Узнайте больше о гибридной интеграции IBM Webmethods.
IBM помогает организациям преодолеть сложность ИТ-операций с помощью стратегии автоматизации, которая плавно соединяет приложения и системы с помощью API-управляемой автоматизации, обеспечивая динамическую, масштабируемую и интеллектуальную систему интеграции с помощью унифицированного опыта. Узнайте больше последних из IBM Trending Stories YouTube.com/thenewstack Tech Moving быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Назрул является главным архитектором для ИИ, интеграционной платформы IBM, где он стратегически направляет инновации и архитектурное превосходство в рамках инициатив, основанных на искусственном интеллекте организации. В своей нынешней роли Назрул имеет ключевое значение в управлении стратегическим направлением и инновациями … Подробнее от Назрул Ислам