Компания Salesforce Data Cloud спонсировала этот пост.
Прошло менее трех лет с момента первого выпуска ChatGPT. Первоначальные модели больших языков (LLM) были популярны, но далеко не точны. Таким образом, генерация с расширенным поиском (RAG) возникла как подход, который заметно улучшает результаты генеративного ИИ за счет автоматической подачи текущих и соответствующих запатентованных данных в LLM.
RAG включает структурированные данные из электронных таблиц и реляционных баз данных, а также неструктурированные данные из электронных писем, PDF-файлов, чатов, социальных сетей и многого другого. Он предварительно обрабатывает и индексирует эту информацию и использует инструменты семантического поиска для получения того, что необходимо для конкретного запроса, обращаясь к внутренним пулам данных в дополнение к более общим данным LLM, чтобы предоставить гораздо более релевантные ответы.
…84% лидеров в области данных и аналитики говорят, что их стратегии обработки данных нуждаются в полном пересмотре, чтобы их амбиции в области ИИ были успешными.
Дополнение LLM более надежными внутренними данными обеспечивает лучший результат ИИ, поскольку можно использовать более свежую информацию из проверенных источников. Но RAG далека от совершенства.
Ему мешают сложные, неструктурированные данные, такие как таблицы, диаграммы, электронные письма и сообщения в социальных сетях. Например, он может неправильно интерпретировать форматирование определенных типов неструктурированной информации и давать ошибочные ответы. В других случаях RAG может выдавать слишком общие, слишком подробные или неполные ответы.
Это серьезно ограничивает ценность, которую организации могут извлечь из своих огромных хранилищ неструктурированных данных. Ставки высоки: согласно новому отчету Salesforce, 84% руководителей данных и аналитики говорят, что их стратегии обработки данных нуждаются в полном пересмотре, чтобы их амбиции в области ИИ были успешными. Эту проблему необходимо решить, если мы хотим широко и эффективно внедрить автономные агенты ИИ.
Понимание ограничений RAG
Почему RAG склонен неверно интерпретировать некоторые формы неструктурированной информации? Используемые им механизмы поиска создают несколько проблем:
Плохое дробление: Простые методы разделения документов могут отделить связанную информацию, например таблицы, от их текста, что приведет к потере контекста. Этот процесс игнорирует внутреннюю структуру документа (заголовки, пункты списка), рассматривая его как простой поток текста. Например, таблица может быть отделена от пояснительного текста, что сделает полученные данные бесполезными.
Семантические пробелы: Хотя семантический поиск находит схожие концепции, он может потерпеть неудачу при неоднозначных запросах, воспринимать их слишком буквально или давать сбои, когда ответ требует многошагового рассуждения в нескольких документах. Система может получить нерелевантный фрагмент, который семантически похож, но фактически неверен. Например, он может получить ключевые слова, но из неправильной части документа или из совершенно не связанного с ним документа.
Проблемы с нетекстовыми данными: RAG с трудом справляется с обработкой нетекстовых элементов, таких как таблицы и диаграммы. Он также может неправильно интерпретировать отсканированные документы из-за ошибок в процессе оптического распознавания символов (OCR).
Галлюцинации: Неполные или противоречивые полученные данные могут привести к тому, что LLM «галлюцинирует» или даст противоречивые ответы. Это не редкое явление; 89% руководителей данных и аналитики, использующих ИИ в производстве, говорят, что сталкивались с неточными или вводящими в заблуждение результатами ИИ. Поскольку руководители считают, что более четверти (26%) данных их организации ненадежны, корень проблемы становится ясен. А отсутствие возможности отслеживания в конвейере RAG затрудняет проверку источника информации.
Непрерывность: RAG склонен рассматривать преобразование и предварительную обработку данных как разовые задачи, а не как непрерывный процесс.
По сути, традиционные реализации RAG недостаточны для обработки сложных данных реального мира. Это вызывает стратегический сдвиг. Вместо погони за более крупными моделями сейчас основное внимание уделяется созданию единой базы данных, необходимой для того, чтобы сделать их по-настоящему полезными. Эта единая основа является первым важным шагом на пути к созданию точного, безопасного, контекстуального и готового к использованию на предприятии искусственного интеллекта. Это не означает, что индустрия отказывается от RAG. Вместо этого компания разрабатывает передовые системы для комплексной обработки неструктурированных данных. Возможность обработки этих форматов является решающим фактором в современной конкурентной среде.
Важность непрерывных экспериментов с RAG
Чтобы дать более актуальные и точные ответы, мы должны экспериментировать, чтобы улучшить неструктурированную производительность. Для этого мы должны научиться лучше всего применять LLM на ключевых этапах RAG и оптимизировать метаданные, чтобы повысить точность ответов. Это жизненно важно как для немедленной выгоды, так и для долгосрочных инноваций. В некоторых случаях может потребоваться удаление тегов HTML. В других случаях сглаживание структур данных может быть лучшим способом обработки таблиц, диаграмм и сложного форматирования в документах.
Таким образом, эксперименты с RAG требуют уточнения того, как структурированные и неструктурированные данные обрабатываются и используются для максимизации их ценности. Это предполагает построение «графиков значимости», которые показывают, как соединяются различные объекты данных, что позволяет ИИ давать персонализированные рекомендации и находить наиболее релевантную информацию для любого заданного запроса.
Вместо погони за более крупными моделями сейчас основное внимание уделяется созданию единой базы данных, необходимой для того, чтобы сделать их по-настоящему полезными.
Вместо того, чтобы просто использовать LLM для получения ответа, LLM вводятся на ключевых этапах RAG, чтобы каждый шаг выполнялся более разумно и точно. Это превращает RAG из простого поиска в персонализированные рекомендации по данным, основанные на наиболее актуальной информации для данного запроса.
Но экспериментирование — это не разовая сделка. Непрерывное преобразование данных и корректировка предварительной обработки могут иметь большое значение для обеспечения высочайшего качества данных, поступающих в модели ИИ. Благодаря этому результаты ИИ становятся более точными и эффективными. Этот непрерывный процесс обучения предполагает постоянное тестирование того, как преобразуются документы, анализируется контент и предварительно обрабатываются данные.
Ключевые варианты использования Agentic RAG
Новый подход к RAG использует агентов на базе искусственного интеллекта для повышения уровня процесса поиска информации. Эти агенты быстро учатся направлять запросы пользователей к наиболее подходящим источникам данных, анализировать запросы и уточнять их для повышения точности и релевантности. Они создают подробные планы действий и могут выполнять эти планы для достижения определенных целей или выполнения конкретных задач с обоснованным бизнес-контекстом.
Специализированные ИИ-агенты повышают гибкость и могут работать в широком спектре разнообразных приложений и внутренних команд (продажи, маркетинг, финансы и т. д.). Они могут учиться, адаптироваться, совершенствовать и улучшать актуальность результатов с течением времени. Поскольку они легко масштабируются, они подходят для крупных корпоративных приложений. А их мультимодальный характер означает, что они могут интерпретировать и создавать контент в широком диапазоне модальностей, включая текст, изображения, аудио и видео.
Варианты использования включают в себя:
- Отвечать на вопросы плавно, точно и эффективно в режиме реального времени с помощью виртуальных помощников или чат-ботов.
- автоматизация задач поддержки клиентов, таких как решение общих запросов, планирование встреч и предоставление технической помощи.
- автоматизация процессов поиска, очистки и интеграции, которые упрощают управление и анализ огромных наборов данных.
- Повышение уровня достоверности предсказаний и прогнозов с помощью приложений бизнес-аналитики, используемых в исследованиях рынка, конкурентном анализе и выявлении тенденций.
- Помощь исследователям в обзорах литературы, глубоком погружении в большие наборы данных и выработке гипотез путем предоставления актуальной и структурированной информации.
Устранение разрыва: от анализа данных к действиям в реальном времени
Что, если исчезнет разрыв между знанием наших данных и действиями на их основе? Что, если бы каждое наше понимание могло мгновенно превратиться в действие? Мы можем добиться этого, создав автономных агентов на основе LLM и RAG. Эти системы создают слой интеллектуального контекста, позволяющий вашим данным, бизнес-логике и данным о клиентах наконец говорить на одном языке.
Такое единое понимание позволяет агентам использовать всю глубину данных вашего предприятия — триллионы записей и сигналов в реальном времени, которые раньше улавливались на информационных панелях. Результатом являются высокоавтономные агенты, которые обеспечивают тонкое взаимодействие с учетом специфики бизнеса. Так мы устраняем отставание, которое приводит к упущенным возможностям, гарантируя, что каждое взаимодействие основано на интеллектуальный контекст — именно тогда, когда это важнее всего.
Узнайте больше об агентских возможностях Salesforce Data 360 и о том, как они выводят RAG на новый уровень за счет улучшения логики, доверия и точности.
Salesforce помогает организациям любого размера переосмыслить свой бизнес в мире искусственного интеллекта. С помощью Agentforce, надежной платформы Salesforce, организации могут объединять людей и агентов для достижения успеха клиентов на основе искусственного интеллекта, данных и действий. Посетите www.salesforce.com для получения дополнительной информации. Узнайте больше Последние новости из облака данных Salesforce ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Рахул Аурадкар — исполнительный вице-президент и генеральный директор подразделения Unified Data Services & Einstein в Salesforce, где он отвечает за предложения продуктов Salesforce Data Cloud и Einstein. Узнайте больше от Рахула Аурадкара