Deep Infra создает облако вывода AI для разработчиков

Вывод на крупные языковые модели (LLMS) не дешево. Возможно, не удивительно, что, хотя гиперсвалики получают большую часть MindShare, когда дело доходит до обучения и развертывания этих моделей, существует целый класс поставщиков, таких как Lambda и Hyperstack, которые фокусируются исключительно на предоставлении доступа по графическим процессорам по требованию для GPU для того, что обычно является гораздо […]

Continue reading


Descope приносит Oauth к агентам ИИ и серверам MCP

С момента запуска в 2022 году Descope удалось сделать себе имя, предлагая простую в использовании услуги идентификации клиентов и управления доступом. Используя услугу компании без кода/низкого кода, ее SDK и API, разработчики могут легко создавать и настроить, как пользователи испытывают опыт регистрации и входа в систему для своих внешних приложений с акцентом на стандарт OAuth. […]

Continue reading


Два старшекурсника создали речевую модель AI для конкурирующего Notebooklm

Пара старшекурсников, ни с обширной экспертизой AI, скажем, что они создали открыто доступную модель ИИ, которая может генерировать клипы в стиле подкаста, аналогичные Notebooklm Google. Рынок синтетических речевых инструментов огромный и растущий. ElevenLabs — один из крупнейших игроков, но нет недостатка в претендентах (см. Playai, Sesame и так […]

Continue reading


Безопасность контейнеров и ИИ: разговор с основателем Chainguard

Chainguard спонсировал этот пост. В этом эпизоде ​​«Новые производители стеков» издатель TNS и основатель TNS Алекс Уильямс догнал Ville Aikas-основатель Chainguard и самопровозглашенный «первый участник Kubernetes до того, как это были даже Kubernetes». Обсуждение, записанное в Kubecon + CloudNativecon Europe, в Лондоне, варьировалось от исторического контекста безопасности контейнеров (и ранних предположений о безопасном поведении, которое […]

Continue reading


По словам некоторых экспертов, в краудсорсингах

Лаборатории ИИ все чаще полагаются на краудсорсинговые бенчмаркинг -платформы, такие как Chatbot Arena, чтобы исследовать сильные и слабые стороны их последних моделей. Но некоторые эксперты говорят, что есть серьезные проблемы с этим подходом с этической и академической точки зрения. За последние несколько лет лаборатории, включая Openai, Google и Meta, обратились к […]

Continue reading


Solo.io жертвует Kagent CNCF, представляет McP Gateway

Примерно через две недели после представления Kagent, рамки с открытым исходным кодом для агентов искусственного интеллекта, работающего в Kubernetes, создатель проекта пожертвовал его в Облачный вычислительный фонд (CNCF). Solo.io объявил об этом шаге ранее в апреле в Kubecon + CloudNativecon Europe, в Лондоне. Этот шаг является отражением статуса Кагента как мгновенного удара с разработчиками. «Для […]

Continue reading


Крыло: стартап не удался, но язык имеет потенциал

Если бы «Dev Ops был ребенком»,-написал Элад Бен-Исраэль, генеральный директор Wing Cloud, это было бы сочетание инфраструктуры и кода времени выполнения на одном языке. Крыло было «языком программирования для облака». Я использовал прошлое время здесь, потому что выключение крыла неделю назад. Поскольку это был проект с открытым исходным кодом, мы надеемся, что идеи будут жить, […]

Continue reading


Неделя в обзоре: Google теряет основной антимонопольный случай

Добро пожаловать в неделю в обзоре! На этой неделе у нас есть множество вещей: антимонопольные судебные процессы против Google и Meta; Грок теперь может помнить; Генеральный директор Bolt Райан Бреслоу хочет сделать свой след; И гораздо больше. Удачных выходных! Все закончилось: Google нарушил антимонопольные законы на рынке рекламных технологий, судья […]

Continue reading


Nitrux, Debian Linux Distro с современными приложениями

Nitrux — это распределение Linux, о котором вы, вероятно, не слышали, — это позор, потому что это выдающаяся операционная система с некоторыми уникальными функциями. Разработанный Ури Эррера и основанный на Debian, Nitrux был первоначально выпущен в 2015 году как вилка Chromiumos (версия Google Chrome OS от Google), но в конечном итоге превратилась в свою собственную […]

Continue reading


Учебное пособие: вывод без сервера с помощью GPU без сервера с помощью Google Cloud Run

Недавно Google Cloud запустила поддержку графического процессора для платформы Cloud Run без сервера. Эта функция позволяет разработчикам ускорить без сервера вывод моделей, развернутых в Cloud Run. В этом уроке я проведу вас по этапам развертывания модели Llama 3.1 большой языковой модели (LLM) с параметрами 8B на сервисе облачного прогона на основе графического процессора. Мы будем […]

Continue reading