Сразу после окончания саммита AI AI в Париже соучредитель и генеральный директор Anpropic Дарио Амодеэй назвал это событием «упущенной возможностью». Он добавил, что «больше внимания и срочности необходимы на нескольких темах, учитывая темпы, в которых технология продвигается» в заявлении, опубликованном во вторник.
Компания искусственного интеллекта провела мероприятие, ориентированное на разработчиков в Париже в партнерстве с французской стартап-пыли, и TechCrunch имел возможность взять интервью у Amodei на сцене. На этом мероприятии он объяснил свою линию мысли и защищал третий путь, который не является чистым оптимизмом, ни чистой критикой по темам инноваций и управления ИИ соответственно.
«Раньше я был нейробиологом, где я в основном смотрел в реальных мозгов для жизни. И теперь мы заслуживаем жизни искусственных мозгов. Таким образом, в течение следующих нескольких месяцев у нас будет несколько захватывающих достижений в области интерпретации — где мы действительно начинаем понимать, как работают модели », — сказал Amodei TechCrunch.
«Но это определенно гонка. Это гонка между тем, чтобы сделать модели более мощными, что невероятно быстро для нас и невероятно быстро для других — вы не можете замедлиться, верно? … Наше понимание должно идти в ногу с нашей способностью строить вещи. Я думаю, что это единственный способ », — добавил он.
С момента первого саммита ИИ в Блетчли в Великобритании тон дискуссии вокруг управления ИИ значительно изменился. Отчасти это связано с нынешним геополитическим ландшафтом.
«Я здесь не здесь, чтобы поговорить о безопасности ИИ, которая была титулом конференции пару лет назад», — заявил во вторник вице -президент сша JD Vance на саммите ACT Action на конференции. «Я здесь, чтобы поговорить о возможности ИИ».
Интересно, что Amodei пытается избежать этого антагонизации между безопасностью и возможностями. На самом деле, он считает, что повышенное внимание уделяется безопасности является возможность.
«На первоначальном саммите, Великобритании Саммит Блетчли, было много дискуссий по тестированию и измерению для различных рисков. И я не думаю, что эти вещи вообще замедлили технологию », — сказал Амодеэй на антропном мероприятии. «Во всяком случае, выполнение такого рода измерения помогло нам лучше понять наши модели, что, в конце концов, помогает нам производить лучшие модели».
И каждый раз, когда Amodei делает некоторый акцент на безопасность, он также любит напоминать всем, что Anpropic все еще очень сосредоточен на создании моделей Frontier AI.
«Я не хочу ничего делать, чтобы уменьшить обещание. Мы предоставляем модели каждый день, на которых люди могут строить, и которые используются для выполнения удивительных вещей. И мы определенно не должны перестать делать это », — сказал он.
«Когда люди много говорят о рисках, я как бы раздражался, и я говорю:« О, чувак, никто действительно не сделал хорошую работу, действительно выложив, насколько великой может быть эта технология », — добавил он позже в разговор.
Затраты на обучение DeepSeek «просто не точны»
Когда разговор перешел к недавним моделям китайского производителя LLM Deepseek, Amodei преуменьшал технические достижения и сказал, что он чувствовал, что общественная реакция была «неорганической».
«Честно говоря, моя реакция была очень мало. Мы видели V3, которая является базовой моделью для DeepSeek R1, еще в декабре. И это была впечатляющая модель », — сказал он. «Модель, которая была выпущена в декабре, была на такой очень нормальной кривой снижения затрат, которую мы видели в наших моделях и других моделях».
Что было примечательно, так это то, что модель не выходила из «трех или четырех пограничных лабораторий», базирующейся в сша, которые он перечислил Google, Openai и Anthropic как некоторые из Frontier Labs, которые обычно толкают конверт с новыми выпусками модели.
«И это было вопросом геополитической заботы для меня. Я никогда не хотел, чтобы авторитарные правительства доминировали в этой технологии », — сказал он.
Что касается предполагаемых затрат на обучение DeepSeek, он отклонил идею о том, что обучение DeepSeek V3 было в 100 раз дешевле по сравнению с затратами на обучение в сша «Я думаю [IT] просто не точнее и не основано на фактах », — сказал он.
Предстоящие модели Клода с рассуждением
В то время как Amodei не объявил о какой -либо новой модели на мероприятии в среду, он дразнил некоторые предстоящие релизы компании — и да, она включает в себя некоторые способности рассуждений.
«Как правило, мы сосредоточены на попытке сделать нашу собственную душераздирающую модели, которые лучше дифференцированы. Мы беспокоимся о том, чтобы убедиться, что у нас достаточно емкости, чтобы модели стали умнее, и мы беспокоимся о вещах безопасности », — сказал Амодеей.
Одна из проблем, которые пытается решить антроп, — это загадка выбора модели. Например, если у вас есть учетная запись Chatgpt Plus, может быть трудно понять, какую модель вы должны выбрать во всплывающем окне выбора модели для вашего следующего сообщения.
То же самое относится и к разработчикам, использующим API -интерфейсы модели большой языка (LLM) для своих собственных приложений. Они хотят сбалансировать вещи между точностью, скоростью ответов и затратами.
«Мы были немного озадачены идеей, что существуют нормальные модели и есть модели рассуждений и что они вроде как отличаются друг от друга», — сказал Амодеей. «Если я разговариваю с вами, у вас нет двух мозгов, и один из них отвечает сразу же, а другой ждет дольше».
По его словам, в зависимости от ввода, должен быть более плавный переход между предварительно обученными моделями, такими как Claude 3.5 Sonnet или GPT-4O, и модели, обученные обучению подкреплением, и которые могут создавать цепь (COT), такие как Operai O1 или Deepseek’s R1.
«Мы думаем, что они должны существовать как часть единой непрерывной сущности. И мы, возможно, еще не там, но Антропик действительно хочет переместить вещи в этом направлении », — сказал Амодеей. «У нас должен быть более плавный переход от этого к предварительно обученным моделям, а не« Вот что-то А и есть вещь »»,-добавил он.
Поскольку крупные компании по искусственному искусству, такие как Anpropic, продолжают выпускать лучшие модели, Amodei считает, что откроет некоторые отличные возможности для нарушения крупных предприятий мира в каждой отрасли.
«Мы работаем с некоторыми фармацевтическими компаниями, чтобы использовать Claude для написания клинических исследований, и они смогли сократить время, необходимое для написания отчета о клинических исследованиях с 12 недель до трех дней», — сказал Амодеэй.
«Помимо биомедицинского, есть юридические, финансовые, страховые, производительность, программное обеспечение, вещи вокруг энергии. Я думаю, что там будет — в основном — ренессанс разрушительных инноваций в пространстве приложений ИИ. И мы хотим помочь этому, мы хотим поддержать все это », — заключил он.
Прочитайте наше полное освещение саммита Action Intelligence Action в Париже.