DeepSeek: Все, что вам нужно знать о приложении AI Chatbot

DeepSeek стал вирусным.

Китайская лаборатория AI Deepseek ворвалась в основное сознание на этой неделе после того, как его приложение Chatbot поднялось на вершину диаграмм Apple App Store (и Google Play, а также). Модели AI Deepseek, которые были обучены с использованием вычислительных методов, заставили аналитиков Уолл-стрит-и технологов-чтобы спросить, смогут ли сша сохранить свое лидерство в гонке ИИ и будет ли вы поддержат спрос на чипы искусственного интеллекта.

Но откуда взялся DeepSeek, и как она так быстро поднялась до международной славы?

Deepseek’s Trader Origins

DeepSeek поддерживается высококачественным капитальным управлением, китайским количественным хедж-фондом, который использует ИИ для информирования о своих торговых решениях.

Энтузиаст ИИ Лян Вэнфенг стал соучредителем «Высокоуров» в 2015 году. Венфенг, который, как сообщается, начал заниматься торговлей, в то время как студент из Университета Чжэцзян, запустил управление капиталом с высоким содержанием капитала в качестве хедж-фонда в 2019 году на разработке и развертывании алгоритмов ИИ.

В 2023 году High-Flyer основал Deepseek как лабораторию, посвященную исследованию инструментов ИИ, отдельно от его финансового бизнеса. С высоким содержанием в качестве одного из его инвесторов, лаборатория развернулась в своей собственной компании, также называемой DeepSeek.

С первого дня DeepSeek создал свои собственные кластеры центра обработки данных для обучения модели. Но, как и другие компании по искусственному искусству в Китае, DeepSeek пострадал от запретов на экспорт сша на оборудовании. Чтобы обучить одну из своих более поздних моделей, компания была вынуждена использовать чипы Nvidia H800, менее мощную версию чипа, H100, доступной для американских компаний.

Говорят, что техническая команда Deepseek искажает Янг. Сообщается, что компания агрессивно набирает докторскую степень докторской степени исследователей ИИ из ведущих китайских университетов. DeepSeek также нанимает людей без какого -либо фона компьютерных наук, чтобы помочь своей технологии лучше понять широкий спектр предметов, согласно New York Times.

Сильные модели Deepseek

Deepseek представила свой первый набор моделей-Deepseek Coder, Deepseek LLM и Deepseek Chat-в ноябре 2023 года. Но только в прошлой весне стартап выпустил свой семейство следующего поколения Deepseek-V2 моделей, индустрия искусственного интеллекта начала обращать внимание.

DeepSeek-V2, система общего назначения текста и анализа, хорошо выполнялась в различных критериях ИИ-и была намного дешевле запускаться, чем сопоставимые модели в то время. Он вынудил внутреннюю конкуренцию Deepseek, в том числе Bytedance и Alibaba, снизить цены на использование некоторых из их моделей и сделать других совершенно свободными.

DeepSeek-V3, запущенный в декабре 2024 года, только добавил к известности Deepseek.

Согласно внутреннему тесту DeepSeek, DeepSeek V3 превосходит как загружаемые, открыто доступные модели, такие как Meta Llama и «закрытые» модели, к которым можно получить только через API, такие как GPT-4O Openai.

Не менее впечатляющей является модель Deepseek R1 «рассуждения». Выпущенный в январе, DeepSeek утверждает, что R1 выступает так же, как и O1 Operai, на ключевых тестах.

Будучи моделью рассуждений, R1 эффективно проверяет факты, что помогает ему избежать некоторых ловушек, которые обычно отключают модели. Модели рассуждений занимают немного больше времени-обычно до минуты дольше-чтобы прийти к решениям по сравнению с типичной моделью, не являющейся рычагом. Плюсом является то, что они, как правило, более надежны в таких областях, как физика, наука и математика.

Однако есть недостаток R1, Deepseek V3 и других моделей Deepseek. Будучи китайскими, разработанным ИИ, они подвергаются сравнению интернет-регулятора Китая, чтобы гарантировать, что его ответы «воплощают основные социалистические ценности». Например, в приложении DeepSeek’s Chatbot R1 не будет отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.

Разрушительный подход

Если DeepSeek имеет бизнес -модель, неясно, что это такое модель. Компания оценивает свои продукты и услуги значительно ниже рыночной стоимости — и дает другим бесплатно.

Как говорит DeepSeek, прорывы эффективности позволили ему поддерживать экстремальную конкурентоспособность затрат. Однако некоторые эксперты оспаривают цифры, которые предоставила компания.

Как бы то ни было, разработчики обратились к моделям Deepseek, которые не являются открытым исходным кодом, так как фраза обычно понята, но доступна по разрешающим лицензиям, которые позволяют использовать коммерческое использование. По словам Клема Деланги, генерального директора Hugging Face, одной из платформ, размещенных моделей Deepseek, разработчики обнимающего лица создали более 500 «деривативных» моделей R1, которые собрали 2,5 миллиона загрузок вместе вместе.

Успех DeepSeek против более крупных и более известных конкурентов был описан как «обновленный ИИ» и «переоцененный». Успех компании был, по крайней мере, отчасти ответственен за то, что цена акций Nvidia снизилась на 18% в январе, а также за то, что вы получили публичный ответ генерального директора Openai Сэма Альтмана.

Microsoft объявила, что DeepSeek доступен на своей Foundry Azure Foundry, платформе Microsoft, которая объединяет услуги искусственного интеллекта для предприятий под одним баннером. Когда его спросили о влиянии DeepSeek на расходы на ИИ Meta во время его вызова за прибыль в первом квартале, генеральный директор Марк Цукерберг сказал, что расходы на инфраструктуру искусственного интеллекта будут оставаться «стратегическим преимуществом» для Meta.

Во время выговора Nvidia в четвертом квартале генеральный директор Дженсен Хуанг подчеркнул «отличные инновации» Deepseek, заявив, что это и другие «рассуждающие» модели отлично подходят для Nvidia, потому что им нужно гораздо больше вычисления.

В то же время некоторые компании запрещают DeepSeek, как и целые страны и правительства, включая Южную Корею. Штат Нью -Йорк также запретил DeepSeek использоваться на государственных устройствах.

Что касается того, что может сохранить будущее Deepseek, это не ясно. Улучшенные модели являются данными. Но правительство сша, по -видимому, растет осторожность в отношении того, что оно считает вредным иностранным влиянием.

У TechCrunch есть информационный бюллетень, ориентированный на AI! Зарегистрируйтесь здесь, чтобы получить его в своем почтовом ящике каждую среду.

Эта история была первоначально опубликована 28 января 2025 года и будет обновлен регулярный запас.

Разработка сайтов в Гомеле

Похожие записи

Geothermal может привести почти все новые центры обработки данных до 2030 года

Lucid Motors выигрывает аукцион банкротства для фабрики и других активов Никола.

Полное предложение Elon Musk, чтобы купить Openai раскрывает пять ключевых деталей

Законодатели США призывают британский шпионский суд провести секретное слушание Apple «Бэкдор» на публике

Конан О’Брайен комментирует ИИ во время его первого монолога на Оскаре

Отчет: стартап Ильи Сатскевера в переговорах с сборщиком средств примерно при оценке в 20 миллиардов долларов

Ключевой исследователь DeepMind Robotics покинул Google, а Nvidia уже поддержал свой Stealth Startup

CHATGPT может быть не таким мощным, как когда-то предполагалось

Некоторые функции Alexa+, как сообщается, не прибудут в течение нескольких месяцев

После привлечения 1 миллиарда долларов Fintech Varo закрывает еще 29 миллионов долларов, заменяет генеральный директор основателя

Rivian Elects Cohere генерального директора по своему совету по последнему сигналу, производитель EV оптимистичен по искусству AI

a16Z поддерживает решение нанять Даниэля Пенни

Вам тоже может быть интересно:

OpenAI выпускает новые модели, обученные разработчикам

Почему поспешное внедрение ИИ приводит к низкому качеству работ

Овладеть искусством отладки Python с этими советами

Frontier Models теперь становятся доступными для выпуска

Red Hat OpenShift 4.20 повышает уровень искусственного интеллекта, безопасность и гибридное облако

Контейнерные приложения для вашей домашней сети

Программирование с помощью инструмента Gemini CLI

Познакомьтесь с кагентом, с открытым исходным кодом для агентов искусственного интеллекта в Kubernetes

Как снежинка переопределила свой стек данных с помощью стратегии AI-Pryrst

Будьте креативны: пятичасовое интервью ThePrimeagn с Lex Fridman

Удаленные серверы MCP: неизбежно, не легко

Как ВПЛ совмещают производительность и контроль в эпоху искусственного интеллекта