Генеральный партнер Andreessen Horowitz и член правления Mistral Anjney «Anj» Midha впервые шпионил за потрясающим выступлением Deepseek шесть месяцев назад, рассказывает он TechCrunch.
Именно тогда DeepSeek представила Coder V2, который соперничал с GPT4-Turbo от Openai для задач, специфичных для кодирования, согласно документу, опубликованной в прошлом году. По его словам, это ставит DeepSeek на путь выпуска улучшенных моделей каждые пару месяцев. R1 — его новая модель рассуждений с открытым исходным кодом, которая облегчила технологическую индустрию для предложения производительности отраслевого стандарта за небольшую часть стоимости.
Несмотря на распродажу акций NVIDIA, Midha говорит, что R1 не означает, что основополагающие модели ИИ останут тратить миллиарды на чипы графических процессоров и создавать больше центров обработки обработки данных.
Это означает, что они будут делать больше с вычислительной мощностью, которую они могут получить.
«Когда люди похожи на, хорошо, Андж, Мистраль собрал миллиард долларов», — говорит он. «Значит ли DeepSeek, что весь этот миллиард долларов совершенно ненужны? Нет, на самом деле, для них чрезвычайно ценно иметь возможность взглянуть на повышение эффективности Deepseek, усваивать их, а затем бросить на него миллиард долларов ».
Он добавляет: «Теперь мы можем получить в 10 раз больше вывода от одного и того же вычисления».
Это не значит, что Мистраль безнадежно стоит за конкурентами Openai и Anpropic, утверждает он. Каждый из них поднял гораздо больше миллиардов, чем Мистраль. Openai, как сообщается, ведет переговоры, чтобы поднять еще один потрясающий 40 миллиардов долларов.
Мистраль остается конкурентоспособным с ними, потому что это открытый исходный код, говорит он. И его логика действительно имеет заслуги. Открытый исходный код дает компании доступ к существенно бесплатному техническому труду от тех, кто хочет помочь, потому что они используют проект. Соперники с замкнутым исходным кодом охраняют свои секреты и должны платить за все труды, а также вычислить власть.
«Вам не нужно 20 миллиардов долларов. Вам просто нужно больше вычислить, чем любое другое приложение с открытым исходным кодом. Итак, Мистраль позиционируется [well]Полем У них самый вычислительный поставщик с открытым исходным кодом », — сказал Мидха о своей портфельной компании.
Llama Facebook, крупнейший соперник Model AI с открытым исходным кодом для Mistral, также получит гораздо больше инвестиций. Генеральный директор Марк Цукерберг в среду сказал, что он все еще планирует потратить «сотни миллиардов долларов» в целом на ИИ. Это включает в себя 60 миллиардов долларов в 2025 году на капитальные затраты, в основном центры обработки данных.
Программа обмена кислородными графическими процессорами A16Z «Overbookinged»
Мидха, который также является членом правления генератора изображений ИИ, и 3D -производителя модели Лумы (и ангел в наряде ИИ, Антропические, одиннадцатые и другие) есть еще одна причина, по которой он не видит голода ИИ на графических процессорах в ближайшее время Полем
Он является лидером кислородной программы A16Z. Группы, в частности, современные H100 NVIDIA, стали настолько дефицитным товаром, что фирма ВК взяла дело в свои руки около полутора лет назад. Он купил их для своих портфельных компаний.
Кислород сейчас «перебронирован. Я не могу выделить достаточно, — смеется Мидха. Мало того, что его стартапы нуждаются в графических процессорах для обучения моделям искусственного интеллекта, но и им нужно еще больше, чтобы запустить свои постоянные продукты искусственного интеллекта для клиентов.
«Теперь есть этот ненасытный спрос на вывод, для потребления», — объясняет он.
Вот почему он думает, что инженерные прорывы Deepseek также не изменят Stargate. Это крупное партнерство Openai на 500 миллиардов долларов, объявленное ранее в этом месяце с SoftBank и Oracle для центров обработки данных искусственного интеллекта.
Основное изменение DeepSeek использует признание национальными государствами, что ИИ является следующей основополагающей инфраструктурой, такой как электричество и Интернет. Мидха хочет, чтобы они рассмотрели «независимость инфраструктуры», как он ее называет. Они хотят полагаться на китайские модели, с ее цензурой и когтями в их данных? Или они хотят западных моделей, которые следуют западным законам и этике и соблюдают соглашения НАТО?
Он, очевидно, отстаивает западных наций, используя западные модели, как его парижский Мистраль. Сотни компаний разделяют эту проблему и уже заблокировали DeepSeek, который является как потребительским приложением, так и моделью с открытым исходным кодом.
Не все покупают в этом страхе перед китайскими моделями с открытым исходным кодом. Компании могут запускать их на местном уровне в своих собственных центрах обработки данных. А DeepSeek уже доступен в качестве безопасного облачного сервиса от американских компаний, таких как Microsoft Azure Foundry, поэтому разработчикам не нужно использовать облачный сервис DeepSeek.
На самом деле, бывший генеральный директор Intel, Пэт Гелснджер — кто -то, хорошо знакомый с Китаем — сказал TechCrunch, что его стартап Gloo создает услуги AI в своей собственной версии DeepSeek R1 вместо выборов, таких как Llama или Openai.
Но если кто -то хочет отказаться от своих планов центра обработки данных в свете DeepSeek, Midra смеется и имеет запрос: «Если у вас есть дополнительные графические процессоры, отправьте их в ANJ».
У TechCrunch есть информационный бюллетень, ориентированный на AI! Зарегистрируйтесь здесь, чтобы получить его в своем почтовом ящике каждую среду.