Рэг уже мертва? Это был насмешливый вопрос, который недавно был задан Доуве Киела, генерального директора контекстуального ИИ. И Киела знает кое-что о тряпке (поколение-поиск, поколение,-он возглавил команду в Meta, которая представила эту технику в исследовательской статье в мае 2020 года.
Конечно, пост Киелы был реакцией на текущий ажиотаж вокруг модельного протокола контекста (MCP), который (неправильно) рекламировался как тряпичный убийца. Но, как указала Киела в интервью с новым стеком, RAG может использоваться с MCP-что-то, что его собственная компания, основанная на тряпке, контекстуальная AI, регулярно делает.
Дорога к тряпкому агентам
Во -первых, как Киела и его коллеги из мета, чтобы изобретать тряпку? Он сказал мне, что это отслеживает его докторскую работу по языку заземления в реальном контексте, который впоследствии продолжался в Facebook AI Research. Там он и его команда исследовали, как модели искусственного интеллекта могут оставаться в соответствии с развивающейся наземной истиной — как Википедия — без постоянной переподготовки. С появлением ранних языковых моделей и векторных баз данных они объединили два: поиск (R) из векторной базы данных и генерации (G) через языковую модель. Это привело к технике RAG, позволяя генеративному ИИ ссылаться на внешние знания.
«И поэтому я думаю, что это просто очень интуитивно понятный способ сделать это так, чтобы Genai-генеративные модели-могли работать над данными о земле истине без необходимости обучения на нем»,-сказал он.
После того, как Рэг начал набирать обороты, Киела решила покинуть Meta и начать свою собственную компанию на основе Rag в начале 2023 года. Теперь контекстуальное искусство маркирует себя как «самый быстрый способ создать точные, масштабируемые тряпичные агенты».
Я спросил, является ли термин «тряпичные агенты» недавним дополнением, учитывая нынешнюю шумиху, окружающую агентов. Киела ответила, что да, формулировка агентов была добавлена в 2024 году.
«То, как работают наши системы, мы раньше называли их приложениями, но это звучит довольно пассивно, и то, что действительно заставляет его работать в современной парадигме, гораздо более активно. Вот почему это агент».
Рабочий спектр тряпичной работы: статический к агенту
Агенты ИИ обычно рассматриваются как автономные программные приложения — они выходят и делают что -то от имени человеческого пользователя. Итак, «Ag Agent» также в основном автономным?
Киела ответила, что существует спектр между статическими рабочими процессами Rag и более продвинутыми агентскими системами. По его словам, типичный тряпичный трубопровод является своего рода статическим агентом: он планирует стратегию поиска, получает соответствующие данные, повторно оценивает результаты и отправляет их в модель заземленного языка, обученную для Rag для получения ответа. Хотя это несколько агрессивно — поскольку он принимает решения о том, как и как получить — это все еще фиксированный процесс.
Напротив, он продолжил, полностью агентская система динамически генерирует исполняемый код (например, Python) во время выполнения, позволяя ей адаптировать свои стратегии поиска и рассуждения на основе промежуточных результатов. Это может включать в себя повторное поиск или корректировка своего подхода по мере необходимости. Ключевым инновацией, по словам Киелы, является не автономия, а активное рассуждение во время тестирования-то, что он назвал «Время испытания».
«Вокруг него много пуха, много шумиха», — сказал он, имея в виду агентские системы в 2025 году. «Многие люди говорят:« О, это должно быть похоже на это активно, и это предпринимает действия, или это автономно, или… но на самом деле важно то, что это активно ».
Я попросил его уточнить, что он подразумевает под «активными причинами», на которые он ответил, что агент «задумывается, что мне нужно делать теперь?»
Тряпка и MCP
Точно так же, как агентские системы — все в этом году, как и MCP. Но MCP иногда говорят, как будто это замена для тряпки. Итак, давайте рассмотрим определения.
В его «Рэг мертва еще?» Пост, Киела определила тряпку следующим образом:
«Проще говоря, RAG расширяет базу знаний языковой модели, получая соответствующую информацию из источников данных о том, что языковая модель не была обучена и вводив ее в контекст модели».
Что касается MCP (а средняя буква означает «контекст»), согласно документации Anpropic, он «обеспечивает стандартизированный способ подключения моделей искусственного интеллекта к различным источникам и инструментам».
Это то же определение, не так ли? Не согласно Киеле. В своем посте он утверждал, что MCP дополняет тряпку и другие инструменты искусственного интеллекта: «MCP упрощает интеграцию агентов с помощью Rag Systems (и другими инструментами)».
MCP «не такой революционный, как многие люди делают это».
— Douwe Kiela, генеральный директор контекстуального ИИ
В нашем разговоре Киела добавила дальнейший (хм) контекст. Он объяснил, что MCP-это протокол связи, сродни отдыху или мыло для API, основанного на JSON-RPC. Это позволяет различным компонентам, как ретривер и генератор, говорить на одном языке. MCP не выполняет сам поиск, отметил он, это просто канал, через который взаимодействуют компоненты.
«Поэтому я бы сказал, что если у вас есть векторная база данных, а затем вы сделаете это доступным через MCP, а затем вы позволите языковой модели использовать ее через MCP, то есть тряпку», — продолжил он. «Так что это в основном… вы используете поиск, чтобы увеличить генератор. Так что это тряпка. Просто то, как эти две части разговаривают друг с другом, через MCP, а не то, что вы делаете со стандартной тряпкой, которая просто входит в контекст […] более прямо ».
Киела добавила, что MCP «не такой революционный, как многие люди делают это, потому что у нас уже были стандартизированные коммуникации API — но это хороший, чистый способ сделать это».
«У нас есть свои собственные серверы MCP, поэтому люди могут получить доступ к нам через MCP».
— Киела
Что касается контекстных клиентов ИИ, Киела говорит, что MCP является лишь одним из способов получить доступ к внешнему контенту для своих моделей.
«У нас есть свои собственные серверы MCP, поэтому люди могут получить доступ к нам через MCP», — сказал он. «Мы можем позвонить MCP от нашего агента. Это не был стандартным способом, это только один из способов взаимодействия с этими системами».
Затем я спросил о Agent2agent (A2A), открытый протокол, разработанный Google, который позволяет агентам разговаривать друг с другом. Киела ответила, что контекстуальный ИИ является одним из партнеров Google для этого, поэтому они также поддерживают A2A.
«Так что я думаю, что это отличная идея. Это в основном на один уровень выше, верно. Итак, MCP для: как агенты используют инструменты? А затем A2A больше: как агенты разговаривают с агентами?»
Тряпка, тряпка и еще тряпка
В конечном счете, контекстуальный ИИ — это компания, ориентированная на то, чтобы привлечь технику RAG на предприятия во всех различных облигациях. Похоже, что внезапное появление MCP в этом году поставило компанию в защитный режим — или, по крайней мере, объясняет, что было вынуждено объяснить, почему MCP не является заменой тряпки.
Помимо этого, контекстуальное ИИ имеет множество продуктов Rag, например, проводящего инструкции, выпущенного в марте, и новый анализатор документов для Rag, выпущенный только в этом месяце. Киела говорит, что подобные продукты делают свою платформу более модульной.
«Вы можете использовать наши самоуверенные API для простой тряпки в коробке, — сказал он, — но вы также можете использовать отдельные компоненты, чтобы улучшить ваши существующие тряпичные трубопроводы».
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Ричард Макманус — старший редактор нового стека и пишет о тенденциях разработки веб -и приложений. Ранее он основал ReadWriteWeb в 2003 году и встроил его в один из самых влиятельных технологических новостей в мире. С самого раннего … Подробнее от Ричарда Макмануса