Компания по разработке программного обеспечения Fractional AI считает, что крупнейшими победителями искусственного интеллекта будут компании, не являющиеся компаниями, которые используют Generative AI, чтобы сделать их операции более эффективными и улучшить свои продукты.
С этой целью дробный ИИ создал агент ИИ для компании по интеграции данных с открытым исходным кодом Airbyte, которая строит разъемы для интеграций API. Но вместо того, чтобы потратить несколько дней, чтобы вручную, эти разъемы, созданные AI-созданным AI, производятся всего за минуты.
«Мы очень быстро росли, и это было весело», — сказал новый стек Крис Тейлор, генеральный директор Fractional AI. «Было очень весело [working] На многих крутых проектах на переднем крае ».
Airbyte — это механизм интеграции данных с открытым исходным кодом для перемещения данных на склады, озера данных или базы данных. Он часто используется для извлечения данных из программного обеспечения в качестве сервисных продуктов, которые, конечно, требуют разъемов с этими API SaaS.
Например, если кто -то хотел объединить данные о продажах Shopify с помощью поддержки клиентов Zendesk, Airbyte может быть использован для настройки конвейера данных для извлечения данных клиента из Shopify и билетов на поддержку клиентов из Zendesk для загрузки всего этого в хранилище данных.
У Airbyte уже была библиотека разъемов, чтобы поддержать эту интеграционную работу, но компания предполагала, что упростила создание еще тысячи разъемов для продуктов SaaS.
«Их программное обеспечение-это вытягивание данных из сторонних инструментов SaaS и перемещение данных в хранилища данных»,-сказал новый стек Эдди Зигель, технический директор Fractional AI. «Им необходимо создать интеграцию с каждым сторонним инструментом SaaS Typle, который может существовать».
Airbyte называет решение AIS Assistant, и оно работает хорошо. С момента выпуска инструмента в его библиотеке было добавлено значительно больше разъемов.
Изображение предоставлено дробным ИИ
Строительство APIS Pre-AI
Строительство решения Airbyte не было так просто, как передача документации API на инструмент AI. Airbyte хотел автоматизированное решение, которое сканировало бы документацию API, которое, как правило, несколько случайно структурировано.
«Мы поняли, что эти документы API, ориентированные на разработчика, являются чрезвычайно сложными веб-сайтами»,-сказал Сигель. «Это те страницы, которые Google не очень хорошо индексирует; они очень динамичны. Они не разработаны кем -то, кто хочет, чтобы он был хорошо проиндексирован».
Документация API не стандартизирована и часто может быть толстым и плотным материалом для чтения. Пополнение эти документы оказалось неожиданно сложной проблемой, которая должна была решить, прежде чем он мог даже включить ИИ.
«Они не делают его очень легко читаемым веб -сканерами», — сказал Зигель.
Из -за размер окна контекста он добавил: «Процесс настройки ползания, возможно, был на порядок более сложный, чем мы ожидали, входящее на сторону ИИ».
После того, как документация пройдет, разработчики сталкиваются с большим количеством ручного кодирования. Занимая много времени, сложный процесс перемещал технические таланты от работы с более высокой стоимостью, как было отмечено тематическое исследование на веб-сайте дробного ИИ.
Рабочий процесс ИИ/разработчика
Полученный рабочий процесс позволяет пользователям вводить URL -адрес для API, с которым они пытаются интегрироваться. Строитель разъема ИИ ползет эти документы API, а затем предварительно поглощает все поля о разъеме, таких как база URL и аутентификация API.
Затем строитель разъема ИИ представляет полный список потоков для этого API — например, для Shopify, потоки могут включать «заказы», «выполнения» и «скидки».
Затем пользователь выбирает интересующие потоки, и для каждого выбранного потока строитель предварительно засоветует каждое поле (страдание, путь URL и т. Д.) Для этих потоков в пользовательский интерфейс Airbyte Connector Builder. Затем пользователь может просмотреть проект ИИ и внести изменения или исправления, прежде чем завершить разъем.
Итак, Basicall, y Ultimate Workflow для инструмента AI имеет пять частей:
ИИ помогает под капюшоном
Под капюшоном помощник ИИ использует GPT-4O. Команда изучила 4o-mini и тонкую версию 4o-mini, но только в итоге использовала 4o-mini для интеграционных тестов. Клод также был рассмотрен, но GTP-4O было выбрано из-за его строгих структурированных выходных возможностей, отметилось тематическое исследование.
Дробный ИИ использовал комплект разработки программного обеспечения OpenAI (SDK) для объединения подсказок.
Первым шагом является чтение документов API. Система ИИ начинается с «есть ли спецификация OpenAPI?» Если это так, он может вытащить параметры аутентификации непосредственно из спецификаций OpenAPI.
Но если нет спецификации OpenAPI, дробный ИИ сканирует документацию API с использованием инструмента поиска ИИ Jina AI и FireCRAWL, который представляет собой службу API, которая принимает URL, заполняет его и преобразует его в чистую отметку или структурированные данные.
«Наконец, если мы не сможем извлечь информацию, используя спецификацию OpenAPI, FireCRAWL или JINA, мы используем комбинацию услуг», такую как Serper, Web Scraper и недоумение, поисковая система AI, «как последняя попытка найти соответствующую информацию для ввода в более поздние LLMS»,-говорилось в изучении тематического исследования.
Вторым шагом является извлечение соответствующих разделов разъема API. Если документ настолько велик, что он превышает окно контекста, дробный ИИ использует встроенные функциональность Apeplai Augmented Generation (RAG) для извлечения разделов в документацию, связанную с аутентификацией.
Для небольших документов дробный поток построил поток, чтобы сначала извлекать ссылки из HTML, затем спросите LLM, который ссылки выглядят связаны с аутентификацией, а затем внедряет содержание соскобных страниц в будущие подсказки.
Наконец, процесс включает в себя анализ и подсказка точных деталей из кусков HTML. Задача заключалась в принуждении выхода LLM в точный формат, необходимый для спецификации конструктора разъема. Решение Фракции заключалось в том, чтобы «запрашивать структурированный вывод, чтобы определить метод аутентификации в конкретном формате для заполнения строителя разъемов».
Другими инструментами, используемыми в окончательном решении, были Langsmith, которая представляет собой платформу, которая помогает разработчикам создавать, отлаживать, тестировать и контролировать приложения LLM для наблюдения и экспериментов. Фракционирование также использовало встроенный векторный магазин Openai, где требовалась тряпка, и Redis был использован для кэширования и блокировки.
«Мы используем каталог существующих разъемов Airbyte в качестве контрольных показателей для измерения точности конструктора AI-контакта и улучшения качества»,-отметилось тематическое исследование фракционного ИИ.
Хотя тематическое исследование не подробно описывает данные тестирования, он отмечает, что подготовка его «предприняла значительные усилия… и должна быть значительной целью для любого прикладного проекта ИИ».
В последнем анализе фракционное исследование ИИ заявило, что «много мест с высоким уровнем роя, где правильные приложения ИИ могут значительно повысить производительность разработчиков».
«И инженер, и проблема с искусственным интеллектом: этот проект является хорошим напоминанием о том, что проблемы, связанные с ИИ в производство, не являются чистыми проблемами от Wrangling LLMS», — написала команда. «В этом случае качественное ползание — такая же старая задача, как Google — предложил серьезную задачу».
Наша цель в Tabnine-создать и предоставить и доставлять рабочий процесс разработки с AVEPOM-ASISTOM, который дает возможность всем создателям кода, на всех языках, от концепции до завершения. Узнайте больше последних из Tabnine Trending Stories YouTube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Loraine Lawson — ветеран -репортер, который в течение 25 лет освещал технологические проблемы от интеграции данных до безопасности. Прежде чем присоединиться к новому стеку, она работала редактором Banking Technology Site Bank Automation News. Она … читайте больше от Лорейн Лоусон