Дэвид против Голиафа: Используйте тактику по размеру при строительстве агентов ИИ

В последние месяцы были достигнуты замечательные достижения в агентах браузера общего назначения, работающих на крупных языковых моделях (LLMS). Лидеры отрасли, такие как Openai и Anpropic, выпустили эти агенты, операторы и компьютерные использование, соответственно, для общественности. Эти инструменты браузера продемонстрировали впечатляющие возможности, от бронирования бронирования ресторанов до ответа на различные и сложные вопросы.

Агенты браузера общего назначения, несмотря на их гибкость, не выполняют структурированные, повторяемые деловые задачи. Точная аналитика, автоматизированные рабочие процессы и надежное обогащение данных критически зависят от последовательно структурированных данных. Без предсказуемой структуры извлеченные данные быстро становятся ненадежными, строго ограничивая ее практическую ценность для нижестоящих процессов, необходимых для деловых и технических приложений.

Почему общие агенты борются со шкалами

Несколько ключевых вопросов ограничивают эффективность агентов AI общего назначения, таких как оператор Openai и использование компьютера Клода, при применении к крупномасштабным задачам извлечения данных:

  • Отсутствие структуры: Агенты обычно производят выходы, которые не постоянно структурированы. Поскольку большинство из них были построены с вопросом, отвечающим в качестве основного направления, их результаты, как правило, форматированы параграфом или слабо организованы.
  • Ограниченное покрытие веб -сайта: Существующие тесты для оценки этих агентов обычно включают только узкий набор веб -сайтов, часто смоделированных или плотно контролируемых сред. В результате агенты общего назначения изо всех сил пытаются адаптироваться к сложности, изменчивости и беспорядке веб-сайтов реального мира.
  • Модель лени: Откройте оператор AI или компьютер Claude, часто останавливает выполнение преждевременно после извлечения только частичных данных (например, одна страница списков). Например, для конкретных задач с несколькими страницами данных эти модели сохранят частичную информацию на первой странице и завершают выполнение.

Ключевое понимание: все проблемы имеют структуру

В Бардине наш подход к веб -агентам в основном отличается. Вместо того, чтобы конкурировать лицом к лицу с крупными поставщиками моделей, создавая все более крупные и более дорогие вычислительные модели, мы решили использовать неотъемлемая структура реальных веб-задач. Построив миллионы автоматизаций для командных и корпоративных клиентов, мы узнали, что многие важные деловые задачи — такие как извлечение публикаций работ, мониторинг обновлений блога компании или анализ отзывов клиентов — в значительной степени полагаются на структурированные данные.

Более того, мы заметили, что веб -сайты, представляющие эти данные, последовательно используют повторяющиеся HTML -структуры.

Признавая и эксплуатируя эту основную структуру, как в самих бизнес -проблемах, так и на веб -сайтах, представляющих данные, мы поняли, что могли бы создать значительно более эффективный, точный и масштабируемый агент ИИ, не прибегая к грубому вычислительной силе.

Bardeenagent: новый подход к созданию агентов браузера

Наше решение, Bardeenagent, реализует этот структурированный подход через двухэтапный процесс выполнения:

  • Захватить структуру экстракции (один раз)
  • Во -первых, Bardeenagent перемещается с желаемыми данными на веб -странице и использует LLM для определения и записи, как извлечь один элемент данных. Этот шаг генерирует надежные селекторы CSS и структурированный сценарий извлечения, по сути, создавая повторный «рецепт» для сбора аналогичных данных.

  • Повтор с точностью (много раз)
  • Вместо того, чтобы неоднократно вызывать дорогой вывод AI для каждого последующего элемента данных, BardeEnagent Replays этот записанный сценарий извлечения на нескольких страницах или точках данных. Этот подход резко уменьшает вычислительные накладные расходы и повышает надежность.

    Почему это работает: эффективность с помощью повторного использования

    Этот структурированный подход является мощным, потому что он обеспечивает следующее:

    • Последовательность: Структурированные сценарии надежно извлекают данные, обеспечивая согласованные выходные форматы.
    • Масштабируемость: После того, как структура запечатлена, извлечение быстро и эффективно масштабируется до сотен или тысяч точек данных.
    • Эффективность стоимости и времени: Меньше вызовов ИИ означает резко снижение затрат и более быстрое извлечение данных.

    Реальные приложения и результаты: представление Weblists

    Чтобы оценить эффективность Bardeenagent в извлечении структурированных данных, мы оценили, насколько хорошо агенты браузера LLM выполнялись на нашем новом эталонном эталоне Weblists, состоящих из вариантов использования, запрашиваемых реальными корпоративными клиентами. Это включает в себя сценарии, такие как:

    • Отслеживание Работа Чтобы определить рост или тенденции найма конкурентов
    • Мониторинг Блоги компании и обновления продукта для подготовки информированных охватов продаж.
    • Извлечение отзывы клиентаS для надежного конкурентного анализа.

    При оценке Bardeenagent против других методов на эталоне Weblists результаты были ясны: наша оценка продемонстрировала, что структурированный подход Bardeenagent значительно превосходит существующие современные агенты, включая Уилбура (ранее опубликованный агент Бардин), агент-E и ощутимость. Bardeenagent достиг 66,2% отзывов, более чем удвоение производительности лучшего методаПолем Кроме того, структурированный метод также переведен непосредственно в экономическую эффективность: Bardeenagent достигает примерно в 3 раза меньшую стоимость за извлеченный ряд по сравнению с конкурирующими решениями.

    Другой подход

    Общий ИИ впечатляет, но когда структура и точность результатов имеют значение для вашего бизнеса, вам нужен другой подход. Bardeenagent рассматривает этот пробел, используя неотъемлемая структура веб -данных, позволяя предприятиям и исследователям эффективно и надежно извлекать ценную информацию в масштабе.

    Прочитайте нашу полную техническую статью и сообщение в блоге здесь, если вы хотите выйти за рамки общих ограничений ИИ и познакомиться с структурированной веб -интеллектом.

    Если вы заинтересованы в проверке того, как ваш собственный агент сравнивает или изучает этот подход дальше, обратитесь к нам по адресу ml@bardeen.AI. Мы рады сотрудничать и поддерживать более широкое сообщество ИИ.

    Владелец TNS, Insight Partners, также инвестирует в Бардин. В результате Бардин получает предпочтение в качестве участника.

    Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Паскаль является соучредителем и генеральным директором Bardeen. Подробнее от Паскаля Вайнбергера

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *