Ваша инфраструктура данных с открытым исходным кодом готов к агентскому ИИ

Instaclustr спонсировал этот пост.

По мере того, как инженерные лидеры участвуют в строительстве агентских решений для ИИ, многие планируют покупки крупной инфраструктуры. Большинству они не нужны. Полностью открытые платформы данных, уже запускающие их приложения, могут питания, способные AI -агентам с целевыми обновлениями. В частности, для долгосрочных бюджетов, стратегия должна заключаться в том, чтобы расширить то, что у вас есть, где бы ни было, а не разорвать и заменить.

Агент ИИ выглядит новым, но его инфраструктурные модели нет. Агентам нужны потоковые входы, прочное и масштабируемое хранение, поиск с низкой задержкой и упругой вычислитель для моделей. Это те же шаблоны, с которыми Apache Kafka, Kubernetes, Postgres, Cassandra и Opensearch работают каждый день. Лифт находится в оптимизации специфичных для искусственного интеллекта, а не в замене стека.

Проверка реальности для агента

Агенты принимают события, получают контекст, решают, действуют и изучают. Это отображает чистоте на сегодняшние строительные блоки с открытым исходным кодом. Кафка перемещает события в режиме реального времени, поэтому агенты реагируют с контекстом. Kubernetes организует взрывоопасные рабочие нагрузки без отходов. Postgres (с PGVector!) Добавляет поиск сходства вектора для поиска поколения (RAG) и семантических поисков. Cassandra 5.0 добавляет нативную индексацию вектора в глобальном масштабе.

OpenSearch приносит векторный поиск в знакомый поиск и аналитический слой. (OpenSearch K-NN обеспечивает векторный поиск через поле KNN_Vector и поддерживает общие методы, такие как иерархический судоходство, небольшой мир или HNSW.) Результатом является путь к агентскому ИИ, который использует платформы, которые уже работают ваши команды.

Ничто из этого не требует запатентованной платформы «AI-i-reade», а скорее четкие узоры и плотные интерфейсы. Сохраняйте инфраструктуру, которую вы знаете, добавьте векторные возможности, где это необходимо, и настройте потоковую передачу и хранение для шаблонов доступа ваших агентов.

Компонируемый план, который вы можете построить сегодня

Назовите меня предвзятым, но композиционным ударом монолитным. В идеале вы хотите собрать минимальный набор проверенных компонентов и масштабировать каждый по своей собственной кривой.

Общий план может выглядеть следующим образом: кафка или другие потоковые земли из приложений, устройств и услуг. Уровень обработки функций или обработки событий обогащает эти события. Postgres или Cassandra хранят как эксплуатационные данные, так и встраивание. Индексы OpenSearch Индексы и векторы для быстрого поиска. Kubernetes планирует агентские услуги, поиск работников и модели. Все наблюдается и ориентировано на политику.

Этот подход поддерживает многие типы агентов без восстановления фондов. Агент поддержки использует одни и те же потоки и векторные хранилища в качестве агента мошенничества или агента по анализу документов. Вы меняете подсказки, правила поиска и политики, но вы не меняете основную инфраструктуру.

Компонируемый также снижает риск. Вы можете добавить пилотного агента без необходимости связываться с критическими системами. Вы можете отказаться без переговоров по поставщикам и, что важно, вы можете поменять компонент при изменении ваших потребностей.

Безопасность вы можете проверить

Агенты будут обрабатывать данные клиента и критически важные решения, и вам нужна прозрачность и контроль. Правый слой данных с открытым исходным кодом дает вам обоих. Вы можете проверить пути кода, обеспечить соблюдение политики и доказать элементы управления. Kubernetes дает на основе ролевых и сетевых политик; Кафка поддерживает шифрование и мелкозернистое разрешение; Postgres и Cassandra обеспечивают сильное шифрование, роли и регистрацию аудита; и OpenSearch интегрируется с общими поставщиками аудиторов и контролем доступа.

Стоя нулевого доверия подходит естественно. Оцените каждую службу, модель и агент как неуверенные по умолчанию, обеспечивая наименьшую привилегию на каждом уровне. Поддерживайте полную регистрацию и очищают видимость в потоках данных. Когда вы владеете стеком, вы можете ответить на регулирующие органы и совет по специфике, а не полагаться на гарантии поставщиков.

Начните с вертикального среза

В идеале, прежде чем начать агент -проект искусственного интеллекта, вы должны инвестировать свой стек против жизненного цикла агента. В зависимости от того, какие проекты данных с открытым исходным кодом вы уже развертываете, у вас может быть от 70 до 80% от того, что вам нужно. Затем добавьте векторные возможности, где они приносят немедленную ценность. Начните с самых высоких путей поиска и наиболее распространенных типов контента.

Я бы начал с выбора одного из вариантов использования, который доказывает шаблон. Хорошие первые цели могут включать в себя поиск поддержки клиентов, поиск по продажам или помощники по внутренним знаниям. Создайте небольшой вертикальный срез, который заканчивает конец к концу (охватывая приглашение, поиск, агент и один путь действия). Измерить задержку, точность поиска и скорость инцидентов. Настройка и повторить.

Кодифицируйте безопасность с 1 -го дня, привязывая сеансы, обеспечивая соблюдение аутентификации между каждой службой и в поисках регистрации и действиями подробно. Определите, что агент никогда не должен делать, и держать людей в петле, где суждение или риск высоки.

Вы также можете избежать блокировки, выбрав управляемые услуги для вашего стека с открытым исходным кодом, когда они имеют смысл, без контроля над проприетарной платформой, которая диктует вашу архитектуру. Всегда держите свои параметры открытыми и портативными данными.

Преимущество быть готовым сейчас

Agentic AI становится ближе, когда у вас уже есть стек данных с открытым исходным кодом, который у вас уже есть, может сделать большую часть тяжелой работы. Нажмите на него сейчас, чтобы отправить быстрее, тратить меньше и сохранить контроль над своими данными и рисками.

Instaclustr обеспечивает надежность в масштабе с помощью интегрированной платформы данных с открытым исходным кодом, таких как Apache Cassandra®, Apache Kafka®, Apache Sparktm, Elasticsearchtm, Redistm, Apache Zookeepertm и Postgresql®. Узнайте больше последних из Instaclustr Trending Stories YouTube.com/ThenewStack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Бен Слейтер является вице -президентом и генеральным менеджером в Instaclustr от NetApp, которая предоставляет управляемую платформу вокруг технологий данных с открытым исходным кодом. До Instaclustr Бен был в Accenture более десяти лет, где работал над хранилищем данных, … читайте больше от Бена Слейтера

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *