Обычно я смотрю на программные инструменты больших языковых моделей (LLM), которые могу протестировать немедленно, но этот пост начался из-за программного обеспечения, которое я не смог протестировать. Я смотрел, как обстоят дела у Solver, так называемого «самоуправляемого» инструмента кодирования искусственного интеллекта, после нашей статьи год назад. И я заметил, что оно пропало — продано NVIDIA. В прошлом году Solver уже использовал агентный подход, поэтому он был на шаг впереди. Но чего от этого хочет NVIDIA?
Фразы «NVIDIA — производитель аппаратного обеспечения» обычно было бы достаточно, чтобы умерить мой энтузиазм по поводу дальнейшего изучения чего-либо. Но, конечно же, чипы NVIDIA являются сердцем революции искусственного интеллекта, и, следовательно, это первая компания в мире, стоимость которой составляет 4 триллиона долларов. Так что стоит посмотреть, чем он занимается, даже если ваши интересы связаны с миром разработки программного обеспечения.
В последнее время NVIDIA совершает много покупок, в том числе таких инвестиций в собственную экосистему, которые приводят к росту цен на акции без действительного дохода, который мог бы это поддержать. Еще больше замутив ситуацию, NVIDIA также объявила, что вложит 100 миллиардов долларов в OpenAI. Но на какой другой мир он делает ставку? Разгадка кроется в запыленном термине «вертикальная интеграция».
Понимание вертикальной интеграции в сфере искусственного интеллекта
Давайте посмотрим на типичную настройку агентного CLI, которую я регулярно просматриваю. Я начинаю с терминала (обычно Warp), затем устанавливаю на него целевое агентское приложение CLI (например, Claude Code). При запуске он запрашивает, возможно, LLM Claude Sonnet, взаимодействуя через Anthropic, который запускает свои модели в облаках AWS. Это отношение ко всему как к компоненту цепочки. Вы надеетесь на возможность использовать лучшее в своем классе или, по крайней мере, самое доступное. Обычно выдвигают аргумент, что после обучения модели ее можно будет запускать на более дешевых чипах и в товарном облаке, что дает нам горизонтальный или модульный рынок.
Для сравнения: вертикальная интеграция — это то, что делает Apple. Она производит собственное оборудование, собственные чипы, собственную операционную систему и неохотно позволяет людям писать программные приложения для своей собственной экосистемы. По крайней мере, это повышает надежность и безопасность.
Что не так с горизонтальным рынком ИИ? В эпоху агентов мы больше не задаем чат-боту одноразовый вопрос. Несколько агентов работают параллельно, что усложняет взаимоотношения с LLM (или LLM). По словам основателя и генерального директора NVIDIA Дженсена Хуанга, истинное ограничение ресурсов больше не ограничивается стоимостью одного чипа; это то, сколько токенов вы можете сгенерировать на киловатт, потому что ограничивающим фактором теперь является мощность. Каким бы образом вы ни добывали электричество, просто прокачивать его через одно большое помещение — задача непростая. Вскоре ограничивающим фактором вполне может стать вода.
Преимущество NVIDIA: модель фабрики искусственного интеллекта
Именно в этом заключается преимущество NVIDIA: в наличии множества самых мощных чипов, которые генерируют наибольшее количество токенов на киловатт. Для обслуживания множества различных типов запросов (коротких или глубоких) у NVIDIA есть программный уровень, который оптимизирует работу моделей искусственного интеллекта на потенциально сотнях или тысячах графических процессоров, динамически распределяя ресурсы в зависимости от потребностей рабочей нагрузки на своих фабриках искусственного интеллекта или серверах данных.
Но нам не нужно вдаваться в подробности, потому что интегрированного примера Apple MacBook достаточно для демонстрации. MacBook просто более эффективен, потому что операционной системе не нужно делать обоснованные предположения об оборудовании. Он может мгновенно остановиться и перезапуститься без загадочных механизмов «сна» или «гибернации», которые работают непоследовательно. Спросите любого компьютерного геймера о том, что он никогда не узнает, насколько хорошо его последняя игра будет работать на его компьютере, пока он ее не запустит.
Фабрики искусственного интеллекта NVIDIA предназначены для промышленного использования. Идея состоит в том, что они могут обучаться для конкретного сектора, а затем обрабатывать запросы на вывод. Но давайте представим, что подходящая фабрика в конечном итоге станет доступной для последующих разработчиков.
Будущее агентских стартапов и роль NVIDIA
Так как же будет работать будущий агентный CLI на фабрике искусственного интеллекта?
Вероятно, у вас будет учетная запись на местной «фабрике искусственного интеллекта» или, возможно, более комплексная сделка через NVIDIA. И должна быть только одна купюра, размер которой можно точно отследить (или предсказать) в режиме реального времени.
Если бы ваш код находился в репозитории, видимом для NVIDIA, это позволило бы сканировать проект и изолировать ветки для параллельного выполнения. Преимущество владения GitHub остается за Microsoft (и, как следствие, за OpenAI). В любом случае проект будет отсканирован локально и отправлен на «фабрику искусственного интеллекта» или прочитан через общий репозиторий. Одним из преимуществ вертикальной интеграции является то, что ваш запрос проходит меньше рук. Очевидно, вам придется доверять NVIDIA, но, возможно, никому другому. NVIDIA должна решить, насколько это важно для ее клиентов.
NVIDIA может предлагать различные услуги в зависимости от диапазона чипов, доступных для вашей учетной записи. Чем шире предлагаемый диапазон, тем легче будет перебросить мелких агентов на более дешевые LLM, что может позволить пользователю получить долю от экономии.
Теперь я ожидал бы, что API будет доступен, но соблазн разработать (или купить) агентный CLI в стиле Claude Code был бы слишком велик. Конечно, именно здесь мы начали разговор о Solver.
Заключение
То, что происходит за кулисами, не должно иметь большого значения для разработчика программного обеспечения, но преимущества агентной эры тесно связаны со скоростью генерации токенов и параллельной работы.
В какой-то момент расцвет агентского стартапа должен достичь зимы. Когда это произойдет, NVIDIA, безусловно, окажется в числе компаний, которые смогут собрать все кусочки. Конечно, у него нет никаких связей с сообществом разработчиков за пределами специализированной платформы CUDA. Так что, если бы все развивалось таким образом, я бы ожидал увидеть выпуск бета-инструментов, пока эра агентов все еще наслаждается летом.
ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Дэвид работал профессиональным разработчиком программного обеспечения в Лондоне в компаниях Oracle Corp. и British Telecom, а также консультантом, помогающим командам работать более гибко. Он написал книгу о дизайне пользовательского интерфейса и с тех пор пишет технические статьи. Подробнее Дэвид Истман