Snowflake, Salesforce запустите новый стандарт для объединения данных для искусственного интеллекта

Поставщик услуг бизнес-аналитики Snowflake начал инициативу, нейтральную, чтобы создать стандарт для добавления контекстной информации к структурированным и неструктурированным данным BI.

Будучи встроенным в YAML (вероятно) и в конечном итоге управляемый автономной организацией, открытая семантическая развязка (OSI) стремится стать «универсальной структурой семантических данных», позволяя различным организациям обмениваться данными на своих платформах, используя общий набор определений.

До сих пор снежинка, Salesforce, DBT Labs возглавляют усилия. Другие партнеры в проекте включают BlackRock, Mistral AI и Relationalai и Tableau. Проект объявил о своей хартии во вторник.

Растущая потребность в универсальном стандарте данных для ИИ

Несмотря на то, что у нас уже есть множество стандартов обмена данными, появляющаяся популярность агентов искусственного интеллекта создала новые потребности в стандартизации.

«Каждый клиент, с которым я разговариваю, пытается выяснить, как удовлетворить сумасшедший спрос на агент, и как это сделать таким образом, чтобы не создавать беспорядок», — сказал Джош Клар, который управляет управлением продуктом для облака снежинок.

По его словам, конфликтующие определения уже давно стали проблемой для пространства BI, но теперь, когда агентское развитие — это то, что спрос на какое -то единство взлетело.

«Вам нужно иметь единственную семантическую модель, в идеале, которая находится на том слое, который обеспечивает совместимость со всеми различными партнерами», — сказал Клар.

К настоящему времени большинство организаций имеют несколько источников данных, в нескольких форматах, что затрудняет поиск и рассчитывание систем ИИ. У клиента Snowflake есть медиана из пяти различных BI -инструментов.

Концепции и формулы, такие как «AD Entry», «Active Customer» и «валовая маржа прибыли», все могут быть определены по -разному в разных системах. OSI предоставит стандартное определение для всех.

«Таким образом, вместо LLM необходимо выяснить, как вычислить маржу прибыли, вы просто даете ему имя метрики, в которой с ней связан фактический расчет, и LLM просто знает, как составить маржу прибыли», — сказал Клар.

«Затем, когда я нахожусь в таблице или мысли, я прошу прибыли, и расчеты соответствуют».

Представление открытого семантического обмена (OSI)

Обязанность недавно запущенной рабочей группы OSI заключается не в том, чтобы предоставить определения, а скорее создать формат для определения определений различными способами. Это зависит от конечных пользователей, чтобы определить метрики и их определения.

По словам Клара, фактическая спецификация OSI еще не опубликована. Группа должна встать и работать в первую очередь.

Скорее всего, формат, на котором они будут основывать OSI, будет YAML, широко используемый язык конфигурации с некоторыми основными возможностями программирования. По его словам, многие участники группы уже используют YAML для различных задач.

В заявлении прессы BlackRock заявила, что OSI будет работать со своей платформой Aladdin, где он будет объединять процесс управления инвестициями с общим языком данных для государственных и частных рынков.

«Это Розетта Стоун для бизнес -данных», — говорится в заявлении Саутарда Джонса, директора по продукту Southard Jones.

Как структура OSI направлена ​​на стандартизацию определений

Инженеры снежинки основывают идею семантического слоя на своей собственной платформе AI и бизнес -аналитики (BI), называемой Semantic Views, которая помогла клиентам примирить несколько источников данных. Они могут запускать инструменты BI и сохранять каталоги данных, но очень мало этого было на самом деле перекрестно.

«Вопрос о совместимости действительно начал выходить из разговоров с клиентами», — сказал Клар.

Файл семантического определения будет состоять из ряда других атрибутов, включая указатели на базовые таблицы, совместные ключи и отношения. Он также может включать набор метрик, синонимов и метрик для этого определения, а также пользовательские инструкции для ИИ.

Роль поставщиков и сообщества с открытым исходным кодом

В настоящее время рабочая группа не имеет планов построить двигатель времени выполнения. Это была бы работа поставщика, чтобы предоставить. Например, с самим снежинками компания имеет услугу для предоставления OSI-подобных определений в материализованные представления.

Группа планирует создать репозиторий с открытым исходным кодом для сохранения самой спецификации, а также преобразователей, которые могут внести вклад разных партнеров.

Это также приглашает другие организации присоединиться. «Мы хотим, чтобы как можно больше участников участвовали», — сказал он.

Группа OSI — не единственная попытка дать AI больше метаданных для работы. Создатель формата синдикации RSS помог поставщику «действительно простое лицензирование», файл Robots.txt-подобного, чтобы обеспечить единый способ выражения контента, авторского права и лицензирования веб-скребков.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Joab Jackson является старшим редактором нового стека, охватывающего облачные нативные вычисления и системы системы. Он сообщил об инфраструктуре и развитии ИТ в течение более 30 лет, в том числе в IDG и государственных компьютерных новостях. До этого он … читал больше от Джоаба Джексона

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *