MongoDB спонсировал этот пост.
В то время как крупные языковые модели (LLMS) имеют огромное обещание для создания приложений ИИ и агентских систем, обеспечение того, чтобы они генерировали надежные и надежные результаты, остаются постоянной проблемой. Эффективное управление данными — особенно то, как данные хранятся, получены и доступны — имеет решающее значение для преодоления этой проблемы. Поигрыватель-аугимент (RAG) стал широко принятой стратегией, обосновывая LLMS во внешних знаниях, помимо их первоначальных данных обучения.
Стандартная или базовая реализация RAG обычно опирается на векторный подход. Несмотря на то, что он эффективен для получения контекстных релевантных документов и ссылок, Vector Rag сталкивается с ограничениями в других ситуациях, особенно когда приложения требуют надежных возможностей рассуждений и способности понимать сложные отношения между различными понятиями, распространяющимися по крупным базам знаний. Это может привести к выходам, которые разочаровывают или даже вводят в заблуждение конечных пользователей.
Чтобы учесть эти ограничения, изменение архитектуры RAG, известной как GraphRAG, впервые представленное Microsoft Research, получила тягу. GraphRAG интегрирует графики знаний с LLMS, предлагая различные преимущества по сравнению с традиционной векторной тряпкой для определенных вариантов использования. Понимание относительных сильных и слабых сторон векторной тряпки и графрага имеет решающее значение для разработчиков, стремящихся создать более надежные приложения ИИ.
Тряпка: базовый подход, основанный на встраивании
В стандартной Vector Rag System базовые данные, используемые для увеличения знаний о LLMS, обрабатываются первым разделением на куски. Используя модели встраивания, эти куски затем трансформируются в численные векторы, известные как встраивание. Затем поиск выполняется путем поиска кусков, векторные встроения, похожие на встраивание запроса пользователя. Этот процесс эффективно идентифицирует части текста, которые семантически или контекстуально связаны с вводом.
Рисунок 1. Архитектура стандартной векторной реализации RAG.
Этот подход, основанный на внедрении, является мощным для многих задач, таких как поиск соответствующих документов или отрывков по конкретной теме. Он рассматривает каждый документ или кусок как изолированную часть информации и в первую очередь опирается на семантическое сходство, полученное векторными представлениями.
Однако эта зависимость исключительно на семантическое сходство может стать ограничением. Информация, которая включает в себя сложные логические связи между различными организациями, такими как люди, организации и концепции, может не иметь сильного семантического совпадения.
Кроме того, разбивая большие документы или базы знаний на более мелкие куски, векторный подход может непреднамеренно потерять «общую картину», такую как всеобъемлющая структура, иерархия и связи между различными частями информации. Это затрудняет векторную тряпку для обработки запросов, которые требуют понимания взаимосвязи между различными частями извлеченной информации.
Например, отвечая на вопрос: «Какие темы рассмотрены в плане 2026 года?» может быть сложным для векторной тряпки. Даже если документ содержит разделы, в которых обсуждаются различные темы, ключевые слова запроса могут не иметь сильного семантического сходства с конкретной терминологией, используемой для этих тем в документе, особенно если они разбросаны по большой базе знаний.
Точно так же запрос, как «Какова роль Джейн Смит в проектах ACME по возобновляемой энергии?» становится проблематичным, если отношения между «Джейн Смит», «ACME» и «Проекты возобновляемой энергии» упоминаются в разрозненных частях базы знаний. Векторная тряпка, рассматривая эти упоминания как изолированные куски, изо всех сил пытается соединить точки, необходимые для предоставления точного, синтезированного ответа.
Создание этих логических связей в разных сущностях, часто называемых многопользовательским поиском или рассуждением,-это то, где тряпка на основе вектора часто терпит неудачу.
GraphRAG: подключение точек с графами знаний
GraphRAG опирается на фундамент, созданный RAG, но вводит критическое улучшение: интеграция графа знаний. График знаний — это структурированный способ представления информации. Он состоит из организаций, которые являются ключевыми предметами, такими как люди, места, организации или концепции, и отношения, которые определяют, как эти сущности связаны. Думайте о графике знаний как о карте, которая явно показывает, как разные части информации связаны друг с другом.
Рисунок 2. Визуализация графа знаний, основанная на странице Wikipedia от MongoDB.
Внедряя график знаний в процесс поиска, GraphRAG выходит за рамки обработки данных как изолированных единиц. Вместо этого он рассматривает, насколько различные части знаний связаны и связаны с помощью структуры графика. Эта структура позволяет системам на основе LLM с использованием GraphRAG для извлечения связанных объектов и разума по сравнению с их взаимосвязи, что приводит к более всесторонним ответам на сложные вопросы и улучшает актуальность информации.
GraphRAG улучшает архитектуры RAG несколькими ключевыми способами:
В то время как GraphRAG предлагает значительные преимущества, он также поставляется со своим собственным набором проблем. Достижение лучшей точности, чем тряпка на основе векторов с графиком, часто зависит от валяки использования.
Основной проблемой с GraphRAG является создание самого графа знаний. Это часто включает в себя дополнительный шаг, на котором LLM используются для извлечения сущностей и отношений из исходных данных, а затем структурировать их в формат графика. Качество графа знаний в значительной степени зависит от используемой модели. Рекомендуется полагаться на Frontier LLMS. Модели рассуждений, хотя и более дорогие, имеют тенденцию обеспечивать еще лучшие результаты. Более того, поддержание и обновление графика по мере появления новых данных является постоянным операционным бременем.
В отличие от относительно легкого и быстрого процесса внедрения и индексации данных для тряпки на основе векторов, создание и обновление графа знаний часто зависит от точного понимания LLMS, отображать сложные отношения и интегрировать их в существующую структуру графика. Каждый раз, когда новые данные должны быть добавлены в график знаний, данные, извлеченные LLM, должны быть проверены на существующих данных графика и соответствующим образом обновлены, что может быть вычислительно интенсивным.
Рисунок 3. Архитектура реализации графрага.
Принужденная добавленная сложность траверса графика также может представлять проблемы, связанные с задержкой ответа и масштабируемости по мере роста базы знаний. В отличие от Vector Crat, получение информации теперь включает навигацию по соединениям в графике, что может быть более интенсивным, чем простой поиск сходства, особенно для многопользовых запросов. Задержка тесно связана с такими факторами, как глубина обхода, необходимую для ответа на запрос, и конкретная стратегия поиска. Эти аспекты должны быть тщательно рассмотрены и оптимизированы в зависимости от требований приложения.
К гибридным подходам и единым платформам
Graphrag дополняет традиционные методы RAG, позволяя более глубоко понимать сложные иерархические отношения. Это также позволяет обеспечить более эффективную информационную агрегацию между разрозненными точками данных, подключенными к отношениям.
Многие передовые тряпичные и агентские системы вводят гибридные подходы, которые сочетают в себе сильные стороны как графрага, так и на основе встраивания поиска вектора. Например, система может использовать векторный поиск начального семантического поиска высокого уровня соответствующих семантических узлов, а затем использовать график знаний, чтобы понять отношения внутри или между полученными документами или объектами, чтобы синтезировать окончательный ответ.
Реализация этих сложных вариаций тряпки, включая графраг и различные гибридные подходы, часто выгодно из базы данных, которая может обрабатывать различные модели данных единым образом. Это включает в себя поддержку различных типов данных, графические структуры и векторные возможности для поиска сходства. Единый подход может упростить общую архитектуру, уменьшить эксплуатационные накладные расходы и оптимизировать опыт разработки, устранив необходимость синхронизации данных между разнородными системами, оптимизированными только для одного типа данных.
Вот почему Mongodb Atlas отлично подходит для решения этих различных вариантов использования: он предлагает надежные возможности поиска, начиная от полнотекстового и семантического поиска до графика, предоставляя комплексную и гибкую базу данных для создания расширенных приложений искусственного интеллекта.
Проверьте документацию MongoDB, чтобы узнать, как реализовать тряпку и графы на основе вектора с помощью MongoDB.
Создание надежных приложений ИИ
Vector Rag обеспечивает прочную базовую линию для повышения производительности LLM, заземляя ответы в контекстуальных данных посредством семантического сходства, но борется со сложными отношениями и мультихоп-рассуждениями. GraphRAG рассматривает эти недостатки путем явного моделирования отношений с использованием графиков знаний, что приводит к повышению точности и лучшей объясниемости, при одновременном введении дополнительных оперативных соображений.
В конечном счете, выбор между тряпкой и графиком на основе векторов или принятием гибридного подхода зависит от конкретных требований применения ИИ и характера базы знаний. По мере того, как системы ИИ становятся более сложными и требуют более глубокого, более тонкого понимания сложной информации, такие подходы, как графраги и гибридные паттерны, станут все более важным для создания действительно надежных приложений и агентов с использованием LLM.
Штаб -квартира в Нью -Йорке, MongoDB — это компания Data Data Platform, позволяющая новаторам создавать, трансформировать и разрушать отрасли, выпуская мощность программного обеспечения и данных. Узнайте больше последних из MongoDB Trending Stories YouTube.com/ThenewStack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Thibaut Gourdel является менеджером по маркетингу технического продукта в MongoDB, где он фокусируется на интеграции MongoDB с фреймворками ИИ для поддержки и ускорения принятия разработчиков. С опытом работы в области разработки данных, интеграции и применения ИИ, Тибо приносит опыт в практической … Подробнее от Thibaut Gourdel