Хотите максимально использовать MCP? Вам следует проверить интервьюер Microsoft Research MCP.
Протокол контекста модели (MCP) быстро стал невероятно популярным открытым стандартом для подключения агентов ИИ с внешними данными и услугами. Это здорово, но как вы гарантируете, что ваши серверы могут работать должным образом с MCP? Введите интервьюер Microsoft Research MCP.
Интервьюер MCP является инструментом CLI с открытым исходным кодом (по лицензии MIT), предназначенным для того, чтобы помочь разработчикам создать и поддерживать серверы для MCP. В частности, это инструмент Python CLI, который позволяет вам поймать проблемы с сервером MCP до того, как ваши агенты будут пережить их.
Программа предоставляет автоматическую проверку, функциональное тестирование, агентскую оценку и подробную отчетность для реализаций MCP-сервера. Инструменты каталогизируют инструменты, подсказки, ресурсы и схемы возможностей сервера, используя статистику и прямое взаимодействие для выделения соответствия, обнаружения нарушений ограничений и выявления проблем с юзабилитими для агентских систем ИИ.
Его ключевые особенности:
- Проверка ограничений: автоматически осматривает серверы MCP на предмет соблюдения ограничений поставщиков (например, ограничения инструментов Openai и соглашений об именах), помогая разработчикам избежать ловушек развертывания.
- Функциональное тестирование: использует агенты с крупным языком модели (например, GPT-4.1) для создания и выполнения планов тестирования, которые интерактивно управляют инструментами, с подробным журналом успехов, ошибок и показателей производительности.
- Оценка LLM: необязательно применяет рубрики оценки естественного языка с помощью LLMS к удобству использования инструмента и функциональному выводу, совместимости агента всплывающего аппарата и обнаружении неоднозначных или вводящих в заблуждение метаданных инструмента.
- Генерация отчетов: выводит отчеты об отчете человека (и JSON), суммируя нарушения ограничений, статистику и качественные оценки рубрики для разработчиков и сопровождающих.
Согласно исследованию Microsoft исследования, что, по мере того, как «агенты простираются, мы ожидаем, что стратегии в значительной степени полагаются на вертикальную интеграцию, не будут хорошо стареться. Агенты разных разработчиков или компаний будут все чаще сталкиваться друг с другом и должны работать вместе для выполнения задач, в том, что мы называем как общество агентов».
Серверы MCP не знают, с какими клиентами или моделями они работают. Например, они не знают, какие LLM могут обрабатывать длинные контексты и большие пространства для инструментов лучше, чем другие, и могут реагировать совершенно по -разному на общие модели подсказки. Таким образом, в то время как MCP становится уровнем взаимодействия для подключения агентов LLM к бизнес-инструментам, хранилищами контента и платформам развития, интервьюер MCP позиционируется в качестве важнейшего валидатора и отладки. Автоматизируя проверки совместимости и оценку готовности к агенту, интервью позволит разработчикам уверенно публиковать и поддерживать серверы MCP, которые надежно работают среди различных агентских клиентов.
Другая проблема заключается в том, что большие инструменты агента могут снизить производительность на 85% для некоторых моделей. Видите ли, поскольку MCP не предлагает никаких руководств о том, сколько токенов произведет звонок для инструментов, ответы агентов могут перегружать окно контекста LLM. В экстремальном высоком классе один инструмент вернул в среднем 557 766 токенов. Этого более чем достаточно, чтобы затопить практически любое контекстное окно LLM. Инструмент интервьюера MCP, отслеживая внешние свойства серверов MCP, может помочь избежать замедления MCP или даже откровенных неудач.
Это все хорошо, но Microsoft Research напоминает нам, что интервьюер MCP остается экспериментальным проектом. На данный момент вы должны вручную просмотреть ее результаты и не использовать их в производстве. Команда поощряет отзывы и взносы сообществ с открытым исходным кодом и MCP, чтобы усовершенствовать возможности тестирования, отчетность и стандарты безопасности. Тем не менее, если интервьюер MCP превратится в сильную, надежную программу, он может стать неотъемлемой частью любого серьезного развертывания MCP.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Стивен Дж. Воган-Николс, известный как SJVN, пишет о технологиях и технологии, так как CP/M-80 был передовой операционной системой ПК, 300BPS был быстрым подключением к Интернету, WordStar был современным текстовым процессором, и нам понравилось. Подробнее от Стивена Дж. Вогана-Николса