ЛАС-ВЕГАС – Вчера AWS анонсировала Nova Forge, новый способ для предприятий настраивать семейство моделей большого языка Nova (LLM) Amazon с использованием собственных данных. Сегодня компания удовлетворяет очень похожую потребность, добавляя возможности настройки модели в свои сервисы искусственного интеллекта Amazon Bedrock и SageMaker.
Как рассказал мне в интервью перед сегодняшним анонсом Свами Сивасубраманиан, вице-президент AWS по агентному искусственному интеллекту, настройка бессерверной модели в SageMaker использует другой подход, чем тот, который компания использует в Nova Forge.
Настройка модели искусственного интеллекта SageMaker
По своей сути SageMaker всегда создавал модели машинного обучения (с базовыми моделями, добавленными к ним совсем недавно) на основе собственных данных компании, а затем помогал им развертывать эти модели и управлять ими на протяжении их жизненного цикла.
«Это отличается от Нова-Кузницы, где вы, будучи инженером, ничего не знающим о [supervised fine-tuning]РЛ [Reinforcement Learning] или что-то из этого, вы можете поговорить с агентом и сказать: «Вот мой вариант использования». Вот набор данных, который у меня есть. Как мне его настроить?» И он проведет вас через весь путь от контролируемой тонкой настройки RL до того, как это сделать. И тогда это положит начало всему этому от начала до конца».
В рамках этого процесса инструмент даже сгенерирует собственные синтетические данные.
Для разработчиков, которым нужен больший контроль, существует также второй агентный подход (AWS описывает его как «самоуправляемый» подход). Разработчики получают больше контроля над каждым этапом процесса, но, как отмечает AWS, им по-прежнему не придется управлять какой-либо инфраструктурой, в которой выполняются эти процессы, и вместо этого они смогут сосредоточиться на поиске правильных методов настройки и их настройке.
Сивасубраманиан подчеркнул, что раньше эта возможность была доступна только специализированным ученым в области искусственного интеллекта и была недоступна для большинства разработчиков. Он также отметил, что это полностью бессерверный продукт — как и остальная часть SageMaker.
Тонкая настройка армирования на коренных породах
Что касается Bedrock, полностью управляемого сервиса AWS для доступа к моделям фундаментов от Amazon, Anthropic, Mistral и других, основное внимание уделяется точной настройке арматуры (RFT). Как и в случае с Nova Forge, AWS утверждает, что разработчикам по-прежнему сложно настроить конвейеры обучения и инфраструктуру для эффективного использования этого метода для настройки моделей для конкретных случаев использования.
Точная настройка подкрепления, по сути, включает в себя настройку модели для хорошей работы при выполнении заданной задачи, когда другая модель оценивает каждый ответ, а затем эти ответы включаются в веса модели. Как и в случае с другими методами RL, это система, основанная на вознаграждении, в которой модель оценки обеспечивает эти оценки и вознаграждения.
Для этого сервиса разработчики могут выбирать различные функции вознаграждения — на основе искусственного интеллекта, на основе правил или готовый к использованию шаблон — и Bedrock будет выполнять процесс тонкой настройки.
«Не требуется докторская степень в области машинного обучения — только четкое представление о том, как выглядят хорошие результаты для бизнеса», — отмечает AWS в своем пресс-релизе.
AWS утверждает, что для своих клиентов, использующих этот метод, она наблюдает повышение точности в среднем на 66% по сравнению с базовыми моделями, при этом модели становятся проще и быстрее в использовании.
Соревнование
Стоит отметить, что AWS не первая компания, предлагающая на рынке многие из этих функций. Vertex AI от Google предлагает пакет настройки модели, который предлагает немало вариантов обучения с подкреплением. Аналогичным образом, компания Microsoft AI Foundry также предлагает услуги по тонкой настройке.
ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Прежде чем присоединиться к The New Stack в качестве старшего редактора по искусственному интеллекту, Фредерик был корпоративным редактором в TechCrunch, где освещал все, от появления облака и первых дней Kubernetes до появления квантовых вычислений…. Подробнее от Фредерика Лардинуа