AWS решает проблему искусственного интеллекта «слишком много информации»

Киро из AWS позволяет пользователям предоставлять агентам специализированные знания, не погружая их в контекст.

Новая система полномочий компании, представленная на этой неделе на конференции AWS re:Invent, динамически загружает знания и инструменты платформы только тогда, когда они нужны разработчикам. Вместо того, чтобы заранее впихивать все возможные определения инструментов в контекстное окно ИИ-агента, полномочия активируются в зависимости от того, над чем вы на самом деле работаете, заявили в компании.

«Мы наблюдали за разработчиками в течение прошлого года, начиная с MCP. [Model Context Protocol] было объявлено, и мы заметили, что в контекст добавлялось множество серверов MCP, и контекст становился все больше и больше», — сказал Амит Патель, генеральный менеджер и директор по агентному искусственному интеллекту в AWS, в интервью The New Stack. «Не все инструменты, которые были в этих инструментах MCP, были необходимы для работы, которую пытался выполнить разработчик».

Проблема перегрузки контекста

Проблема связана с тем, как традиционно работают серверы MCP. Подключите пять серверов MCP к своей среде разработки, и вы сможете загрузить более 100 определений инструментов, прежде чем написать одну строку кода. По словам компании, это может занять более 50 000 токенов — примерно 40% типичного контекстного окна — еще до того, как вы начнете первое приглашение.

Собственный MCP-сервер AWS иллюстрирует проблему. Он предоставляет более 150 инструментов, охватывающих сервисы от Aurora до DynamoDB и S3. Загрузите этот сервер, и каждое из этих определений инструментов окажется в контексте вашего агента, независимо от того, работаете ли вы с базами данных, хранилищем или чем-то еще, заявили в компании.

Силы решают эту проблему посредством активации на основе ключевых слов. Упомяните в разговоре «базу данных» или «postgres», и мощь Supabase загрузит ваши инструменты и лучшие практики. Переключитесь на работу по развертыванию, и мощность Netlify активируется, а Supabase деактивируется. По словам AWS, базовое использование контекста остается близким к нулю до тех пор, пока вам действительно не понадобятся конкретные инструменты.

Что делает силу

Каждый модуль включает в себя три компонента: конфигурацию сервера MCP, управляющий файл POWER.md, который действует как руководство по подключению агента, и дополнительные перехватчики, которые активируются по событиям IDE или командам с косой чертой.

Файл POWER.md включает в себя заголовок с ключевыми словами, запускающими активацию, этапы адаптации для первоначальной настройки и карту управляющих файлов для конкретных рабочих процессов. Когда вы пишете политики безопасности на уровне строк (RLS) в Supabase, агент загружает документацию, специфичную для RLS. По данным AWS, когда вы переключаетесь на Edge Functions, он загружает другой контекст.

«Мощность — это, по сути, комбинация серверов MCP, управляющих файлов и агентских перехватчиков — трех функций, которые есть у нас в Kiro», — объяснил Патель. «Вы можете объединить эти три вещи вместе и определить это как нечто, что вы можете использовать непосредственно сами или поделиться с сообществом».

«Как справедливо отмечает AWS, использование серверов MCP для оснащения LLM конкретным контекстом, рекомендациями, ресурсами, ограничениями и т. д. при создании сложного программного обеспечения, программного обеспечения, которое часто зависит от обширной и сложной цепочки инструментов, немного похоже на чтение всей энциклопедии каждый раз, когда вы хотите что-то поискать», — сказал The New Stack Брэд Шиммин, аналитик The Futurum Group.

«То, что здесь делает AWS, мы чаще всего наблюдаем у поставщиков агентских инструментов. Google Gemini CLI, например, включает расширения; OpenCode делает то же самое с плагинами», — сказал Шиммин. «Все дело в том, чтобы «активировать» соответствующую информацию в нужное время, добавлять ее в контекстные окна только тогда, когда это необходимо… и, предположительно, удалять ее после этого. Я не уверен, что идея AWS с Киро Пауэрсом продвинулась вперед и покончила со всеми различными методами и инструментами, доступными для разработчиков, но мне нравится, на что они указывают здесь с POWERS.md как стандартным способом упаковки, активации и передачи знаний».

Дэвид Миттон, генеральный директор Arcjet, поставщика инструментов безопасности для разработчиков, отметил важность контекстных ограничений.

«Kiro Powers ощущается как расширение VS Code для агентов искусственного интеллекта: вы получаете знания в конкретной области именно тогда, когда вам это нужно», — сказал он. «Загрузка и выгрузка по требованию на самом деле заключается в обходе ограничений контекста LLM. Вместо того, чтобы засорять контекстное окно каждым инструментом и инструкциями, вы платите стоимость каждого токена только за те, которые актуальны».

Более того: «Приятно видеть конкуренцию с Клодом Скиллсом», — сказал Миттон. «Очевидно, что именно в этом направлении развиваются инструменты на основе MCP: расширения, которые можно перемещать между редакторами и агентами, вместо того, чтобы загружать все возможные инструменты одновременно».

Партнеры по запуску и экосистема

Киро совместно с партнерами запустил возможности, охватывающие жизненный цикл разработки приложений: Datadog, Dynatrace, Neon, Netlify, Postman, Supabase, Strands Agents и Amazon Aurora. Компания позиционирует это как «швейцарский армейский нож возможностей», доступный через установку в один клик.

Разработчики могут просматривать возможности в Kiro IDE или на kiro.dev и устанавливать их без редактирования файлов конфигурации JSON или запуска установки из командной строки. Если для силы требуются ключи API или переменные среды, она предложит вам это при первом использовании.

Система также поддерживает полномочия, созданные сообществом, импортированные из URL-адресов GitHub, а также полномочия частных групп из локальных каталогов или частных репозиториев. Киро подчеркивает, что каждый может создавать и делиться полномочиями, используя свои инструменты, сказал Патель.

Хотя в настоящее время возможности работают только в Kiro IDE, компания стремится к перекрестной совместимости с другими инструментами разработки искусственного интеллекта, включая Kiro CLI, Cline, Cursor и Claude Code. Цель состоит в том, чтобы компании написали один файл POWER.md, который будет работать с любым помощником по кодированию на базе искусственного интеллекта.

Помимо упаковки

Киро рассматривает возможности как нечто большее, чем просто формат упаковки — они позиционируют его как модель непрерывного обучения агентов ИИ. По мере развития инфраструктур и создания внутренних инструментов агентам нужны способы расширения своих возможностей, не начиная с нуля.

«Нео не выучил кунг-фу однажды и не остановился», — написал AWS в своем блоге, имея в виду фильм «Матрица». «На протяжении всей «Матрицы» он загружал новые возможности по мере необходимости».

Идея состоит в том, что когда Supabase отправляет обновленные шаблоны RLS, агенты автоматически получают их. Когда ваша команда создает внутреннюю систему проектирования, вы представляете ее как силу, и каждый агент разработчика знает, как ее использовать, говорят в компании.

Пауэрс появляется одновременно с объявлением Киро о трех «пограничных агентах» — автономных агентах для разработки программного обеспечения, безопасности и DevOps, которые могут работать без вмешательства человека. В то время как эти агенты решают крупномасштабные, многодневные задачи, полномочия направлены на противоположный конец спектра: целенаправленную, конкретную работу по разработке, где важны точность и эффективность токенов.

«На одном конце спектра находятся огромные задачи, требующие дней и часов, которые требуют обучения и масштабирования», — сказал Патель во время брифинга. «Но с другой стороны, разработчики работают над конкретными задачами, где они должны быть целенаправленными и точными. Для этого и нужны полномочия».

Система полномочий доступна в Kiro IDE. Кросс-совместимость с другими инструментами разработки запланирована, но пока недоступна, сообщили в компании.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Дэррил К. Тафт освещает DevOps, инструменты разработки программного обеспечения и вопросы, связанные с разработчиками, в своем офисе в Балтиморе. Он имеет более чем 25-летний опыт работы в бизнесе и всегда ищет новые новости. Он работал… Узнайте больше от Дэррила К. Тафта.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *