Проект Атома Натана Ламберта ищет американских моделей ИИ с открытым исходным кодом

4 июля Натан Ламберт запустил «American Deepseek Project», план по противодействию широким языковым моделям AI с открытым весом (LLMS) из Китая DeepSeek при поддержке американской «полностью открытой модели в масштабе и производительности современных (общедоступных) пограничных моделей в течение двух лет».

Это проблема, дорогая его сердцу. Ламберт-бывший ученый-исследователь «Обнимающего лица» (который также работал в Google DeepMind и Facebook AI Research), и в настоящее время является лидером после обучения в некоммерческом Институте AI (AI2). «Я хочу сделать это в AI2, — написал Ламберт в своем блоге, — но для этого требуется гораздо больше, чем мы, чтобы это произошло. Нам нужны адвокаты, сверстники, советники и вычислять».

«Наша стратегия никогда не заключалась в том, чтобы не обращаться за широкой общественной поддержкой», — сказал Ламберт TNS в электронном интервью на прошлой неделе, — но вместо этого нацелиться на ключевых людей в AI/ML [machine learning] сообщество. У нас были многочисленные профессора, основатели и влиятельные голоса в знаке ИИ, а также некоторые сюрпризы, такие как руководители Openai C-Suite. Мы также поговорили с некоторыми ключевыми политиками DC ». («Существует много возможностей для получения и распределения этих ресурсов по нескольким заинтересованным сторонам»,-объясняет сайт, в том числе частные компании, филантропические учреждения, государственные учреждения, партнерские отношения частного сектора, «и потенциально новые модели государственно-частного партнерства, аналогичные тем, как финансируются другие критические национальные проекты инфраструктуры».)

Сайт Ламберта сказал, что он выполняет инициативу «внеклассные занятия» с его работой над информационным бюллетенем AI-исследований.

По иронии судьбы, на следующий день после запуска Lambert’s Project Openai выпустил свои новые модели GPT-OSS Open-Weight-по лицензии Apache 2.0-которые сайт проекта признает «положительным шагом». А в прошлое воскресенье, 17 августа, Nvidia выпустила новый набор данных и модели для поддержки разработки высококачественного распознавания речи и перевода AI для 25 европейских языков.

«Оба были отличными шагами вперед», — сказал мне Ламберт на прошлой неделе, добавив, что «дополнительно, в экосистеме Open Model было объявлено более 150 миллионов долларов сша».

Но сайт Ламберта по-прежнему утверждает, что «он не в полной мере решает фундаментальную проблему», утверждая, что «один модельный релиз не устанавливает устойчивую инфраструктуру, исследовательскую культуру и долгосрочные обязательства, необходимые для конкуренции с систематическими усилиями, такими как DeepSeek».

Чтобы конкурировать с открытыми моделями Китая, Ламберт сказал, что Америке «нуждается в комплексном подходе к открытию развития ИИ, а не только случайными выпусками».

‘Серьезная вычислительная сила’

Ламберт сказал, что его цели аналогичны национальному пилоту ресурсов по исследованию искусственного интеллекта, возглавляемом Национальным научным фондом сша и 12 другими федеральными агентствами и 26 неправительственными партнерами, чтобы «сделать финансируемые правительством, промышленность и другие ресурсы в поддержку национального сообщества исследований и образования».

Но Ламберт сказал, что его проект остается «сосредоточенным на построении правильных моделей; мы очень глубоко считаем, что не все« открытые »модели создаются одинаково, и мы должны убедиться, что не только калибр моделей, выполненных в Америке, соответствуют иностранным альтернативам, но также и о том, что решения, принятые полностью открытыми моделями.

«Наше видение — это экосистема открытой модели без компромисса — мы хотим, чтобы американские истинные открытые модели возглавляли мир».

The Washington Post отмечает «амбициозную» кампанию Ламберта, предусмотренную проектом, включает в себя «доступ к серьезной компьютерной мощности, причем более 10 000 ультрасовременных чипов графических процессоров, используемых для питания корпоративного развития искусственного интеллекта»-и стоимостью 100 миллионов долларов.

Скриншот из резюме Atom Project.

«Многое из этого является проблемой координации»,-сказал Ламберт The Washington Post, отметив, что на существующие американские усилия по открытым моделям повлияли отсутствие финансирования, в том числе Bloom и Pythia Huging Face от Eleutherai, Think Think. «В стране есть группы людей, которые делают это, но они не смогли масштабироваться».

И, в конце концов, Ламберт предвидит не только открытые веса, но и модель, которая разделяет свои данные, код обучения и журналы — все знания и материалы, необходимые для полного обучения модели ИИ. Это может даже включать промежуточные контрольно -пропускные пункты и базовые модели, а также, конечно, разрешительные лицензии.

Официальный веб -сайт проекта Atom теперь может похвастаться впечатляющим списком «известных подписавших», которые поддерживают свою цель создания действительно открытых американских моделей «и обеспечить, чтобы Соединенные Штаты поддерживали свое лидерство в ИИ».

  • Клемент Деланги, обнимающий генеральный директор лица
  • Oleksii Kuchaiev, директор Nvidia по прикладным исследованиям
  • Джейсон Квон, директор по стратегии OpenAI
  • Майлз Брундаж, бывший глава политических исследований в Openai
  • Souum Chinda, соавтор Pyech Pych.

Открыто для победы?

«Если вы считаете, что LLM с открытым исходным кодом собираются опередить другие LLMS, то это может быть большое значение», — сказал аналитик TNS Лоуренс Ххт, добавив: «Я не думаю, что есть какие -либо основания думать, что это вероятный результат». В конце июля отчета Menlo Ventures показано, что 13% рабочих нагрузок искусственного интеллекта сегодня используют модели с открытым исходным кодом, «немного снизившись с 19% шесть месяцев назад». Хехт признает «который может измениться очень быстро», и существует вероятность того, что модель с открытым исходным кодом может в будущем получить критическую массу пользователей. Но, с другой стороны, в мире сегодняшнего дня, «Chatgpt не является открытым исходным кодом, и у него уже есть критическая масса пользователей».

Ламберт возражает, что когда дело доходит до открытых моделей, «есть и другие отчеты, которые показывают гораздо более высокие цифры принятия».

Респонденты в опросе, проведенной глобальной консалтинговой фирмой Mackinsey & Company, обнаружили, что 63% организаций заявили, что они использовали открытые модели.

В другом посте в блоге в мае Ламберт также отмечает нежелание развернуть открытые модели Китая в предпринимательских решениях, предполагая, что проблема заключается в «информационных опасностях косвенного влияния китайских ценностей на западные бизнес -системы», а также вопросы о том, были ли доказаны, что они безопасны для работы. Но сайт проекта выдвигает еще один аргумент: Америка «должна вести исследование искусственного интеллекта во всем мире, и мы должны инвестировать в создание инструментов, которые наши исследователи должны выполнять свою работу здесь, в Америке: набор ведущих, открытых моделей фонда, которые могут восстановить силу исследовательской экосистемы». (Это «приведет к исследованию фундаментальных достижений искусственного интеллекта», а также обеспечит America’s AI Stack и максимизирует свою долю рынка ИИ.)

«Лидерство АМЕРИКА по ИИ было создано глобальным центром и ведущим продюсером открытых исследований ИИ», — объяснил веб -сайт, — исследование, которое приводилось непосредственно к таким инновациям, как Transformer Architecture, CHATGPT и новейшие инновации в моделях и агентов рассуждения ». Таким образом, отсутствие открытых моделей приведет к отсутствию лидерства — и последующие последствия, которые последуют.

«Лидерство искусственного интеллекта все чаще связана с экономической конкурентоспособностью, военными возможностями и технологическим суверенитетом. Страны, которые ведут в ИИ, будут иметь значительные преимущества во всем, от экономической производительности до оборонных возможностей, что делает это критической проблемой национальной безопасности».

Веб-сайт называет модели открытого языка «решающими для долгосрочной конкуренции в американской промышленности», поскольку закрытые лаборатории искусственного интеллекта «могут охватывать только многие потенциальные идеи… более широкое открытое исследовательское сообщество сосредоточено на инновациях, которые будут преобразующими в 2, 5, 10 или более годах».

Аналитик TNS Хехт считает, что важность фундаментальных исследований ИИ раздувается, поскольку на практике «в последние годы он занял второе место для инженерных решений».

Но проект Atom утверждает, что закрытые модели, такие как CHATGPT и Claude, «ограничивают исследования несколькими критическими способами: вы не можете осмотреть их архитектуру, изменить их поведение, определять их для конкретных задач или понимать их процесс обучения. Исследователи нуждаются в полном доступе к весам моделей и коду для проведения значимых исследований безопасности ИИ, развития новых возможностей и создания существующей работы».

Openai’s GPT-SSS

На следующий день после объявления о проекте Atom Lambert обнаружил, что пишет сообщение в блоге о двух новых моделях GPT-OSS Open-Weight, выпущенных по лицензии Apache 2.0. Ламберт назвал релиз «драматическим изменением в производительности и стратегии с открытой модели» и «основным моментом для экосистемы… Я бы дал Openai очень сильную оценку по их первому открытому релизу за некоторое время — они определенно слушали отзывы, данные сообществом».

«Это феноменальный шаг для открытой экосистемы, особенно для Запада и ее союзников, который наиболее известный бренд в пространстве ИИ вернулся к открыто выпуску моделей. Это момент и может стать началом поворотного момента внедрения и влияния открытых моделей по сравнению с Китаем. сша и его союзники больше не будут выходить за рамки, которые, как мы позаботятся, что мы станут в будущем. Для всех вариантов использования в порядке месяцев, а не лет ».

Новые модели Openai раскрыли «гораздо больше их технического стека, чем любой выпуск на сегодняшний день», пишет Ламберт, и они были «размером для эффективного работы по ряду оборудования от потребительских графических процессоров до облака». Но Lambert Notes Openai не выпустила данные обучения модели, базовую модель, код или технический отчет. И он указывает, что «многие люди шумит по поводу создания открытых моделей», но всегда как вторичная цель. «Цель проекта Atom — дать выход для таких людей, как я, которые хотят сделать этот проект своим приоритетом номер один.

«Модели, которые разработаны из первых принципов, которые будут модифицируемыми, интерпретируемыми и расширяемыми, — это то, что позволит родиться новое десятилетие исследований искусственного интеллекта. Это требует базовых моделей, деталей обучения, удобных размеров и других мелких деталей, которые отсутствуют во многих недавних выпусках открытых моделей, включая OpenAI».

И какая бы ни была форма, в будущем, Ламберт видит большее движение, в котором мы все можем принять участие. «Призыв к действию здесь прост», — написал Ламберт в своем блоге 4 июля. «Подумайте, как вы можете немного изменить свое принятие решений, чтобы сделать американский Deepseek более вероятным.

«Этот подход преуспевает в том же духе, имея одну модель в конце, как и в том, что сообщество формирует лучшие привычки и нормы, связанные с тем, как модели искусственного интеллекта задуманы, построены, делятся и используются».

И сайт проекта Atom по -прежнему просит своих посетителей «подумать о том, как ваш опыт или ресурсы могут способствовать созданию потребностей в инфраструктуре Америки».

Аналитик TNS Лоуренс Ххт внес свой вклад в этот пост.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Дэвид Кассель — гордый житель района залива Сан -Франциско, где он освещал технологические новости более двух десятилетий. За эти годы его статьи появлялись повсюду от CNN, MSNBC и The Wall Street Journal Interactive … Подробнее от Дэвида Касселя

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *