Что DocumentDB означает для открытого исходного кода

Есть как минимум три причины, по которым сообщество открытого исходного кода обращает внимание на DocumentDB. Во-первых, он сочетает в себе мощь двух популярных баз данных: MongoDB (DocumentDB, по сути, является версией MongoDB с открытым исходным кодом) и PostgreSQL. Расширение PostgreSQL делает функциональность документов MongoDB доступной для Postgres; шлюз преобразует API MongoDB в API PostgreSQL.

Во-вторых, бессхемное хранилище документов совершенно бесплатно и доступно по лицензии MIT. В базе данных используется ядро ​​Microsoft Azure Cosmos DB для MongoDB, которое на протяжении многих лет развертывалось во многих производственных средах. В августе Microsoft передала DocumentDB в дар Linux Foundation. Оператор DocumentDB Kubernetes, позволяющий решению работать в облаке, на периферии или локально, был анонсирован на KubeCon + CloudNativeCon NA в ноябре.

В-третьих, DocumentDB расширяет ряд жизненно важных вариантов использования генеративных моделей, интеллектуальных агентов и мультиагентных экземпляров. Эти приложения предполагают использование базы данных для истории сеансов для агентов, истории разговоров для чат-ботов и семантического кэширования для векторных хранилищ.

По словам Картика Ранганатана, генерального директора компании Yugabyte, которая входит в руководящий комитет проекта DocumentDB, эти и другие применения хранилища документов получают огромную выгоду от его реализации без схемы. «Mongo предоставляет базовую функциональность базы данных, на которую способен движок», — сказал Ранганатан. «А еще есть языки, которые дают разработчику возможность моделировать эти вещи».

Свободен от ограничений схемы

Соединение технологии MongoDB с технологией PostgreSQL столь примечательно, потому что оно эффективно сочетает в себе реляционные возможности последней, которые Ранганатан назвал «полусхематическими», с отсутствием проблем со схемой, характеризующими первую. Свобода поддержки вышеупомянутых вариантов использования агентных и генеративных моделей без ограничений схемы необходима для максимизации ценности этих приложений. С помощью DocumentDB пользователи могут воспользоваться этим преимуществом на базовом уровне базы данных.

«Поскольку все становится агентным, важно предоставить эту возможность там, где вы будете создавать эти приложения, а не использовать отдельный способ сделать это», — сказал Ранганатан. Например, если бы инженер создавал профиль пользователя для приложения, отсутствие схемы было бы ему только на руку, поскольку он мог реализовать несколько полей для номера мобильного телефона, номера офиса, номера факса и всего остального, о чем он думал во время кодирования. «Для этого не нужна строгая схема», — сказал Ранганатан. «Вы хотите просто создавать эти поля на лету».

Мультиагентные развертывания

Отсутствие схемы и общая адаптируемость формата документа особенно полезны для ситуаций, в которых агенты сотрудничают. Для этих приложений DocumentDB может функционировать как средство предоставления истории сеансов для различных действий и взаимодействий, происходящих между агентами и ресурсами, а также между агентами друг с другом.

«Для любого агента или любой последовательности операций, над выполнением которых вы работаете с агентом, очень важно, чтобы агент помнил, что он сделал», — сказал Ранганатан. Каждая из операций, выполняемых агентами индивидуально или коллективно, может храниться в DocumentDB и служить памятью для агентов.

Без такой структуры агенты постоянно перезапускали бы свои задачи. По словам Германа Эйхбергера, главного менеджера по разработке программного обеспечения в Microsoft, пригодность DocumentDB для этого варианта использования выходит за рамки памяти. «По мере развития событий у нас будет несколько агентов, которые вместе будут работать над транзакциями», — сказал Эйхбергер. «И они не согласны с чем-то, поэтому у них будут откаты. Мы считаем, что сделать это в документе будет лучше, потому что они все смогут работать над одним и тем же документом, и когда они будут довольны, зафиксировать его». Такая утилита мало чем отличается от того, как люди работают в Google Docs.

Чат-боты и семантическое кеширование

Существует множество способов, с помощью которых DocumentDB поддерживает другие приложения генеративных моделей, включая поисково-дополненную генерацию (RAG), развертывание векторных баз данных и чат-ботов. В этих случаях хранилище документов также может предоставлять централизованную форму памяти для ботов, общающихся с сотрудниками или клиентами. Таким образом, разработчики этих систем могут избежать ситуаций, в которых «если вы забудете все, о чем мы только что говорили, и просто ответите на следующий вопрос, это будет совершенно вырвано из контекста и бессмысленно», — заметил Ранганатан.

DocumentDB также может обеспечить уровень семантического кэширования, который сохраняет основное значение жаргона, местоимений и других аспектов эпизодической памяти, поэтому интеллектуальные боты могут быстро извлекать эту информацию для более своевременных и разумных ответов. В DocumentDB такое семантическое понимание и возможности памяти встроены в основной ресурс, на который полагаются инженеры — базу данных.

«История того, о чем мы говорили, становится чрезвычайно важной», — сказал Ранганатан. «Есть разные способы решения этой проблемы, но это должно быть в контексте экосистемы разработчиков. Поэтому вместо того, чтобы предлагать один способ решения и просить всех интегрировать его таким образом, просто укажите способ, которым человек ожидает создания приложения ИИ».

Чего ожидают разработчики

Благодаря DocumentDB разработчики получают полную гибкость в создании приложений так, как им хочется. Хранилище документов доступно через PostgreSQL, который обладает широкими возможностями расширения и поддерживает множество рабочих нагрузок, в том числе связанных с векторными базами данных и другими платформами для реализации генеративных моделей.

Более того, они не ограничены никакими ограничениями схемы, что стимулирует творческий подход и средства создания приложений, ориентированные на разработчиков. Наконец, он предоставляет агентам надежный механизм сотрудничества друг с другом, сохраняет историю действий, которые были выполнены для выполнения задачи, и приходит к консенсусу перед ее выполнением.

Тот факт, что DocumentDB бесплатен, а также создан по просьбе сообщества открытого исходного кода для этих приложений интеллектуальных агентов и т. д., потенциально может расширить масштабы этих развертываний. «Благодаря ИИ рост будет экспоненциальным, но вы не сможете достичь этого за один раз», — сказал Ранганатан. «Вы дойдете до этого с помощью серии быстрых итераций. Математически это можно представить как 1,1 в 365-й степени. Это улучшение на 10% каждый день, что равно 10 в 17-й степени, огромному числу».

DocumentDB, возможно, не несет единоличной ответственности за такие достижения в области статистического ИИ, но, возможно, он внес свой вклад в современное улучшение этой технологии.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Джелани Харпер работала аналитиком, руководителем исследований, консультантом по информационным технологиям и журналистом более 10 лет. За это время он помог множеству поставщиков и публикаций в области управления данными разработать стратегию, разработать, составить и разместить… Подробнее от Джелани Харпер

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *