Starburst добавляет ИИ к своим федеративным платформам Lakehouse Data Lakehouse

Starburst, компания, стоящая за двигателем запроса Trino с открытым исходным кодом, и платформы Starburst Galaxy/Starburst Enterprise, которые его используют, объявили в понедельник добавление нескольких функций искусственного интеллекта к этим платформам, в частном предварительном просмотре.

Лидерская команда Starburst, в том числе генеральный директор Джастин Боргман, вице -президент AI/ML Products Matt Fuller, и старший менеджер по маркетингу продуктов Ник Кесслер, проинформировали новый стек, чтобы объяснить, как работают функции и почему платформы Starburst являются особенно хорошими, для которых можно их реализовать.

Особенности, одновременно простые и мощные, падают на четырех областей: поиск искусственного интеллекта, функции AI SQL, управление доступом модели ИИ и новый агент AI Starburst. Я расскажу о каждом из них и о том, как они работают вместе; Я закончу, обсуждая, почему такие возможности имеют решающее значение для использования ИИ на предприятии.

Рабочие процессы ИИ Starburst и функциональность агента

Поиск искусственного интеллекта, функции SQL и управление доступом модели

Давайте начнем с поиска ИИ.

Vector Search стал функцией настольных ставок на платформах баз данных и двигателях запросов, поэтому приятно видеть, что Starburst добавляет его на свои платформы. Реализация довольно проста: клиенты настраивают Starburst для использования конкретной службы и модели искусственного интеллекта для генерации векторных вторжений, а затем могут использовать функцию Generate_embedding () в обновлении SQL или вставки команд для генерации вставки и хранить их в столбцах таблицы Apache Aceberg Table Array (Double).

Функция просто просит пользователя указать столбец не векторизованного источника для встраивания и псевдоним модели встраивания. После этого столбец с вторжениями может использоваться в векторных поисках, используя сходство косинуса, точечное продукт или подходы к евклидовым расстояниям, для выбора строк, векторизованное содержание которых достаточно аналогично тем, которое используется в поиске.

Starburst также добавил полнотекстовый поиск и говорит, что две методологии поиска могут быть использованы вместе для корреляции результатов поиска на основе AI с более обычным поиском ключевого слова по индексированным текстовым столбцам.

Далее находятся функции AI SQL, которые позволяют подсказывать LLM в пределах запросов SQL. Это может позволить, например, запрашивать таблицу, содержащую кредитные приложения, возвращая результат, набор как сводчики приложений, так и предварительные оценки риска для каждого, включая классификацию с высоким/умеренным/низким риском и объяснение естественного языка, чтобы оправдать его.

Starburst поддерживает подсказку свободной формы, используя функцию resmpt () и функции, специфичные для задачи, такие как вышеупомянутая классификация, перевод, извлечение контента, суммирование и маскирование. Функции, специфичные для конкретной задачи, используют инженерную инженерию, поставляемую Starburst, в то время как функция Free-Form ropply () позволяет пользователям делать свои собственные.

Конечно, DIY -эксплуатация в чужих руках может генерировать свои результаты и большие счета за вывод, чтобы загрузить. Следовательно, Starburst также предоставляет управление доступом модели, которое позволяет настраивать соединение с конкретными развертываниями LLM, гарантирует, что только определенные пользователи могут использовать их, и предоставляет расширенные параметры конфигурации, включая максимальные ограничения токенов. ИИ это круто, но ИИ не свободен. Таким образом, Starburst также предоставляет модель мониторинга, что позволяет отслеживать показатели использования токенов, объем запроса и видимость стоимости, пользователем или командой.

Агент Звезд

Наконец, и не в последнюю очередь, есть агент моделей ИИ, который люди звездочки назвали «мембраной» на естественном языке вокруг платформ компании. Но агент не просто естественный переводчик на кв. Например, его разговорной интерфейс позволяет создать документацию продуктов данных, включая технические метаданные, бизнес -метаданные, примеры использования и примеры запросов. Все это расширяет возможности запросов естественного языка, которые также поддерживаются агентом ИИ, позволяя ему рассуждать над подсказкой и данные, давая результаты, которые являются более точными и точными.

Кстати, сам агент ИИ использует возможности, предоставляемые поиском ИИ, функциями SQL и управлением доступом к модели, которые мы уже обсуждали, на что Starburst в совокупности называется его «рабочими процессами искусственного интеллекта». Компания также заявляет, что как агент AI, так и возможности рабочего процесса AI, способствуя использованию вниз по течению, включая использование инструментами бизнес -аналитики, приложениями и другими агентами.

Еще один драгоценный камень здесь: поскольку Starburst Enterprise-это платформа, управляемая клиентом, которая может работать локально, его можно сочетать с частными LLMS и запатентованными данными, которые также могут быть локальными, чтобы поддержать то, что Starburst называет Air-агенты AI. Учитывая исключительно облачную ориентацию так много платформ Data+AI, эта возможность заслуживает внимания и облегчает принятие предприятий эти новые возможности ИИ.

Также облегчение этого принятия является сущностью платформ Starburst и самого Trino: возможность управлять и запросить озеро данных клиента, а также подключение к данным и запросу и запросы в любом количестве внешних баз данных, либо посредством выделенных, либо федеративных запросов.

Starburst считает, что его способность прокси и брокера все данные клиента делают его логичным местом, из которого можно основать все ИИ клиента, будь то статистическое/на основе машинного обучения, генеративное или агентное. Хотя уникальная пригодность Starburst к этой роли открыта для дебатов, идея и подход довольно звучат: платформа, которая обеспечивает Nexus для всех ваших данных-будь то структурированная, полуструктурированная или неструктурированная-является разумным местом для размещения и выполнения вашей рабочей нагрузки ИИ.

Собрание данных, аналитики и искусственного интеллекта

Все это направляет инвентаризацию того, где мы находимся в мирах ИИ, данных, агентов и пересечений между ними. С тех пор, как появился Juggernaut of Chatgpt, мы увидели волну генеративной технологии ИИ, которая была направлена ​​на то, чтобы сделать темные данные — часто неструктурированные и жить внутри документов и медиа -файлов, доступных для обучающих моделей, разговорного запроса и вывода понимания.

Это было захватывающим и новаторским, но это также открыло гиперболические претензии и неземную эйфорию. Наряду с этим произошло иррациональное приостановление неверия, относительно риска галлюцинаций Геная и неэнергинического производства. И затем есть технологический стек Ragtag, необходимый для внедрения добыченного поколения, который, несмотря на свое благословшее имя, показала сложность Рубе Голдберг и, как следствие, хрупкие архитектуры.

Genai также был сильно отозван от всех структурированных данных и аналитических технологий, которые создали бизнес-культуру, управляемую данными, и самого аппетита для ИИ. В то время как способность векторизировать и запросить неструктурированные данные действительно является прорывом, результирующая неявная клевета структурированных данных была абсурдной, и препятствие для того, чтобы сделать Genai по -настоящему основным.

Что требуется, так это способ освоить как структурированные, так и неструктурированные данные в тандеме, поэтому он может рассуждать, предсказывать и отвечать на широкие вопросы таким образом, чтобы это было разумным, надежным и, да, рутиной. Агентное движение привело к тому, что в реализации функциональности искусственного интеллекта в дискретных развертываниях, сравнимых с вызовами удаленной процедуры и старыми объектами программного обеспечения.

Упаковка AI функциональности в сервисам, подлежащие обращению в конечную точку, которые принимают входные данные, условно обрабатывают их, а затем возвращают выходы и/или предпринимают действия, это то, что нам нужно. При всем этом мы можем сделать то, что сделал Starburst: добавить такой интеллект в базы данных, API и вызовы функций SQL-EmbedDable. Хотя это может удалить некоторые из «мистических» качеств искусственного интеллекта, это также делает его более действенным, повторяемым, строгим и готовым к критически важным нагрузкам на предприятие.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *