Как агент AI меняет самоуничтожение API

IBM спонсировал этот пост.

Генеративный AI (Genai) уже преобразует то, как мы взаимодействуем с API, и в центре внимания переходит к следующему скачке в эволюции ИИ: агент AI.

Агент ИИ относится к интеллектуальным системам, которые могут рассуждать, планировать и действовать автономно. Эти агенты могут интерпретировать целей пользователей, обнаружить инструменты (API), причину о том, когда и как их использовать, а затем выполнять рабочие процессы. Это может изменить то, как API используются, документированы и выставлены.

Агент ИИ может принципиально изменять потребление API, обеспечивая естественное, автономное обнаружение и исполнение API, управляемое естественным языком.

Проблемы с потреблением API агентские адреса

API должны быть обнаруженными, описательными и с учетом контекста, чтобы агенты искусственного интеллекта работали правильно. Вот некоторые из проблем, которые могут возникнуть иначе, и потенциальные решения.

1. Неоднозначность в картировании намерений

Большинство пользователей не говорят в структурированных схемах API. Они выражают то, что хотят на естественном языке:

«Разместите заказ на два iPhone 16s для клиента Джона».

Традиционные интеграции API требуют явного знания, по которой конечная точка вызывает, какие параметры необходимы и какой формат требуется. Это может привести к трениям, ошибкам и медленной интеграции.

Agentic AI использует структурированные метаданные для решения этого, заземляя намерение естественного языка в исполняемые вызовы функций. Он может анализировать запрос пользователя, поиск соответствующих инструментов и генерировать правильный вызов API.

Пример

Агент отображает намерение с правильной функцией, основанной на семантическом соответствии с описанием инструмента и схемы.

2. Отсутствие структурированных, самоописанных APIS

Большинство API были построены для человеческих разработчиков: Swagger Specs, Docds и примеры. Тем не менее, агентам искусственного интеллекта нуждается в машиночитаемых схемах, чтобы рассуждать о возможностях, требованиях к вводу и ограничениям.

Агент AI работает, когда API обнажают следующее в структурированном формате:

  • Имя функции и описание
  • Входные параметры с типами и ограничениями
  • Требования к аутентификации
  • Выходная схема
  • Ошибки и ограничения

Пример схемы инструментов

Эта структура позволяет агентам:

  • Проверить входные данные перед выполнением.
  • Создайте динамические пользовательские интерфейсы (UI).
  • Выберите инструменты на основе контекста и типа задачи.

3. Неизвестный вызов инструмента и планирование

В традиционных рабочих процессах API вручную сшиваются в логику автоматизации. С агентом ИИ планирование и исполнение динамичны. Агент:

  • Читает каталог инструментов.
  • Соответствует цели текущего пользователя с наиболее релевантным инструментом.
  • Заполняет параметры из контекста или подсказок.
  • Аутентифицирует безопасность.
  • Выполняет инструмент и наблюдает за результатами.

Пример

Пользовательская подсказка: «Войдите в билет для пользователя 1234, говоря, что их отправка не прибыла».

Вызов агента

4. Выбор правильного инструмента из аналогичных вариантов

API часто имеют совпадающие функциональность:

  • GetWeathertoday против GetWeatherForeCast
  • Searchflights против рекомендаций

Агенты используют семантическое сходство Чтобы выбрать правильный инструмент. Тем не менее, чрезмерное сходство может запутать агента.

Решение

  • Используйте подробные, неопределенные описания.
  • Включите возможности или теги намерений.
  • Оценка инструмента релевантности на основе встраивания сходства плюс исторический успех.

Пример каталога с возможностями

Сопоставляя пользовательский ввод с возможностями, агенты могут устранение устранения устранения и выбора и выбрать более точно.

Как структурированные метаданные обеспечивают поведение динамического агента

Структурные схемы инструментов помогают агентам следующим образом:

Описание: Намерение заземления; Карты подсказывают использование. Параметры: проверка ввода, генерация пользовательского интерфейса, заполнение слот для подсказок. Auth: выполнение происходит только с действительными учетными данными. Возможности: включить многоэтажное планирование и цепочку совместимых инструментов. Пределы тарифов: пусть агент разум о политике повторения или доступности инструментов.

Эти метаданные являются основой для декларативная, самообвишаемая API, потребляемый агентами без ручного программирования.

Пример: сквозное планирование агентом

Пользовательская подсказка: «Перевести« Доброе утро »на испанский и отправьте его в качестве сообщения Карлосу».

Инструменты в каталоге:

Агент рассуждения

  • Обнаружение задания требует перевода → TranslateText.
  • Хранить вывод → Использовать в качестве входного ввода для sendmessage.
  • Составьте план:
  • Давайте рассмотрим инструментальные звонки с участием больших языковых моделей (LLMS).

    Вот пример http get endpoint от спецификации OpenAPI, чтобы получить подробную информацию о конкретном порядке на основе OrderNumber:

    Вот пример модели модели протокола контекста (MCP) фрагмент сервера из приведенной выше спецификации, который возвращает подробности о конкретном порядке на основе OrderNumber:

    Вот фрагмент кода для клиента MCP, обнаружив инструменты:

    В этом примере показан MCP, вызывающий сервер MCP без участия LLM.

    Источник: IBM.

    А вот и агент по вызову с запросом пользователя, который использует LLM:

    Запрос пользователя: «Получите данные заказа для номера заказа 1.»

    Источник: IBM.

    Добавьте еще один API заказа на сервер MCP. На этот раз сделайте описание немного более конкретным.

    Клиент MCP теперь обнаруживает две конечные точки:

    Источник: IBM.

    На этот раз, для того же запроса пользователя, агент использует новый обновленный API:

    Запрос пользователя: «Получите данные заказа для номера заказа 1.»

    Источник: IBM.

    Заключение

    Метаданные влияют на то, как агенты выбирают API над другим. Настройка метаданных может иметь нежелательные последствия.

    Агент AI быстро переопределяет способ использования API:

    • API должен быть самоописанием, машиночитаемым и намеренным.
    • Каталоги инструментов должны выставлять метаданные, такие как схема, параметры, возможности и ограничения.
    • Агенты могут динамически рассуждать, планировать и вызывать API, разблокируя быстрые, умные и более автономные интеграции.

    По мере того, как мы переходим в эпоху развития AI-коренного развития, проектирование для потребления в первую очередь не является обязательным-это основа для интеллектуальной автоматизации и адаптивных рабочих процессов в гибридных средах, а протоколы, такие как MCP, играют решающую роль в этой эволюции.

    IBM работает над тем, чтобы обеспечить автономию, интеллект и сотрудничество в интеграцию предприятия. Узнайте больше о гибридной интеграции IBM Webmethods.

    IBM помогает организациям преодолеть сложность ИТ-операций с помощью стратегии автоматизации, которая плавно соединяет приложения и системы с помощью API-управляемой автоматизации, обеспечивая динамическую, масштабируемую и интеллектуальную систему интеграции с помощью унифицированного опыта. Узнайте больше последних из IBM Trending Stories YouTube.com/thenewstack Tech Moving быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Назрул является главным архитектором для ИИ, интеграционной платформы IBM, где он стратегически направляет инновации и архитектурное превосходство в рамках инициатив, основанных на искусственном интеллекте организации. В своей нынешней роли Назрул имеет ключевое значение в управлении стратегическим направлением и инновациями … Подробнее от Назрул Ислам

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *