ᐅ История компании DeepSeek и как они сделали конкурента ChatGPT

История ДипСик

История DeepSeek – это пример создания инновации при помощи стратегического подхода. В январе 2025 года китайская компания DeepSeek представила языковую модель DeepSeek-R1.

Она показала отличную производительность при небольших затратах. Это вызвало резонанс в технологическом секторе. Рассмотрим данную разработку подробнее.


1. Что такое Deepseek

DeepSeek – это китайская компания, предлагающая ИИ, который использует архитектуру Mixture-of-Experts (MoE), позволяющую задействовать лишь часть параметров модели при каждом запросе.

Это снижает затраты и делает ИИ более доступным. Например, стоимость обработки 1 млн токенов у ДипСик – около 2 USD, тогда как у OpenAI – около 60 USD (в зависимости от модели).

Но это логично, ведь еще одним умопомрачительным фактом есть то, что DeepSeek-R1 (первая версия чат-бота) был создан всего за 55 дней при бюджете около 6 млн USD — меньше десятой части затрат западных аналогов.

Главная страница DeepSeek
Главная страница официального сайта DeepSeek

Таким образом, DeepSeek нарушает монополию США в сфере передового искусственного интеллекта.

Модель R1 уже была интегрирована в облако Microsoft Azure, а качество ответов, по словам гендиректора Microsoft Сатьи Наделлы, впервые приблизилась к GPT-4 от OpenAI.

DeepSeek в момент выхода также возглавила чарты App Store и Google Play, став глобально востребованным инструментом. Немаловажным преимуществом есть то, что у DeepSeek открытый исходный код.

Репозиторий DeepSeek-V3 на GitHub набрал свыше 96 900 звёзд и 15 700 форков и эти цифры продолжают увеличиваться, что показывает большой интерес разработчиков.

Появление ДипСик называют ключевым моментом в развитии технологий ИИ. Это алгоритм, равный по значимости, изобретению лампочки, транзистора, или выводу первого спутника на орбиту Земли.

Считается, что DeepSeek может ускорить появление новых инноваций в мире. Сегодня Deepseek делает то, что недоступно многим другим инструментам ИИ.


2. Как появилась Deepseek

DeepSeek – китайский стартап в области искусственного интеллекта, основанный в мае 2023 года в Ханчжоу.

Его основатель, Лян Вэньфэн, родился в 1985 году в Чжаньцзяне (провинция Гуандун) и окончил Чжэцзянский университет со степенью магистра в области информационных и коммуникационных технологий.

Лян Вэньфэн
Основатель компании DeepSeek Лян Вэньфэн

В 2015 году он вместе с двумя однокурсниками основал хедж-фонд High-Flyer, который использовал математические модели и ИИ для торговли на фондовом рынке.

К 2019 году активы фонда превысили 10 миллиардов юаней, а в 2021 году Лян начал приобретать тысячи графических процессоров Nvidia для обучения ИИ-моделей.

GPU Nvidia для обучения
DeepSeek использовала графические процессоры Nvidia для обучения ИИ

В мае 2023 года Лян основал DeepSeek как дочернюю компанию High-Flyer, сосредоточенную на разработке искусственного общего интеллекта (AGI).

Компания быстро привлекла внимание благодаря выпуску модели DeepSeek-V3 в конце 2024 года, которая была обучена с использованием 2 000 чипов Nvidia H800 при затратах менее 6 миллионов долларов.

Ключевые участники команды:

  • Лян Вэньфэн (Liang Wenfeng). Основатель и генеральный директор DeepSeek. Ранее он соосновал хедж-фонд High-Flyer а также был известен своей стратегией долгосрочных исследований и акцентом на эффективность в разработке ИИ-моделей.
  • Ло Фули (Luo Fuli). Молодая специалистка в области обработки естественного языка, выпускница Пекинского университета.

    Её работа сыграла значительную роль в разработке модели DeepSeek-V2. Ло получила признание в китайских СМИ как «вундеркинд ИИ».
  • Гао Хуачзо (Gao Huazuo) и Цзэн Вандин (Zeng Wangding). Исследователи, внесшие ключевой вклад в разработку архитектуры MLA, которая позволила значительно снизить стоимость обучения модели DeepSeek-V3.
  • Го Дая (Guo Daya), Чжу Цихао (Zhu Qihao) и Дай Дамай (Dai Damai). Молодые учёные, получившие докторские степени в ведущих китайских университетах.

    Они активно участвовали в разработке моделей ДипСик и внесли значительный вклад в исследовательскую деятельность компании.

Компания DeepSeek придерживается плоской организационной структуры, поощряя сотрудничество и обмен идеями среди сотрудников.

DeepSeek на смартфонах
Китайский чат-бот DeepSeek на Android и iPhone

Фирма предлагает конкурентоспособные зарплаты и предоставляет значительные вычислительные ресурсы для перспективных проектов, что способствует привлечению и удержанию талантливых специалистов.


3. Разработка своего аналога ChatGPT

DeepSeek – это китайская нейросеть, разработанная стартапом DeepSeek, которая представляет собой аналог ChatGPT.

Она использует архитектуру «mixture of experts», что позволяет ей эффективно обрабатывать и анализировать данные.

Mixture of experts схема
Схема работы mixture of experts

ДипСик обладает рядом уникальных функций, таких как глубокое рассуждение и возможность поиска информации в интернете, что делает её конкурентоспособной на рынке ИИ.

Несмотря на свои преимущества, у DeepSeek есть и недостатки, включая проблемы с безопасностью и возможные утечки данных.

В отличие от ChatGPT, доступ к ДипСик не требует использования VPN, что делает её более доступной для пользователей в разных странах.

Однако стоит учитывать, что использование этой нейросети может быть связано с рисками, такими как кибератаки и обвинения в нарушении прав OpenAI.

В целом, DeepSeek представляет собой интересный шаг в развитии генеративных моделей искусственного интеллекта, предлагая пользователям новые возможности для взаимодействия с технологиями.

Ключевые особенности DeepSeek:

  • Архитектура «mixture of experts». Позволяет эффективно обрабатывать данные, активируя только необходимые параметры для конкретных задач, что делает модель более ресурсосберегающей.
  • Доступность. DeepSeek предлагает бесплатный доступ без ограничений по количеству запросов, что делает её привлекательной для пользователей, ищущих экономичные решения.
  • Локальная работа. Возможность запуска на собственном оборудовании обеспечивает защиту конфиденциальной информации и независимость от интернет-соединения.

DeepSeek представляет собой интересный шаг в развитии ИИ, предлагая пользователям новые возможности для взаимодействия с технологиями.


4. Запуск продукта и первые успехи

Появление китайской нейросети DeepSeek вызвало бурную реакцию на рынке. Акции технологических компаний, таких как Nvidia и ASML, упали на 8–17% из-за опасений утраты США лидерства в ИИ.

Nasdaq и S&P 500 снизились на 2.6% и более, отражая панику инвесторов. DeepSeek, использующий лишь 2 000 GPU, впечатлил эффективностью, что усилило ажиотаж и страхи.

Падение S&P 500
Обвал S&P 500 на фоне запуска DeepSeek

Пользователи активно обсуждали DeepSeek, отмечая его низкую стоимость (1/30 от ChatGPT) и высокую производительность, особенно в китайскоязычной среде.

Однако популярность снижается: уже через пару месяцев, к маю 2025 года, доля рынка упала с 4% до 2%. Некоторые указывают на цензуру в поиске, что вызывает недоверие.

Тем не менее, ДипСик стимулирует инновации и конкуренцию в сфере ИИ.

Что лучше DeepSeek или Chat GPT? DeepSeek и ChatGPT – лидеры среди ИИ-чат ботов, но выбор зависит от задач.

DeepSeek (R1 и V3) превосходит в логических и математических задачах, быстрее и дешевле (1/30 стоимости ChatGPT). Он эффективен для структурированного обучения и кодирования, но ограничен в функциональности и интеграции.

ChatGPT (GPT-4o) выигрывает в универсальности, контекстном мышлении и креативности, предлагая десктоп-приложения и лучшее взаимодействие с платформами.

ДипСик ценят за открытость кода, но есть опасения цензуры.

Установка по QR-коду
Установка приложения по QR-коду на Android и iOS

5. Сравнение с ChatGPT

Давайте рассмотрим ключевые характеристики DeepSeek и ChatGPT на момент выхода первой:

Характеристика DeepSeek-R1 ChatGPT (GPT-4)
Происхождение Китай, компания DeepSeek США, компания OpenAI
Архитектура Mixture-of-Experts (MoE) Dense Transformer
Общее количество параметров 236 млрд (21 млрд активных на запрос) Около 175 млрд (все активны постоянно)
Стоимость 1 млн токенов 2 USD Около 60 USD, зависит от версии
Целевая аудитория Азиатский и глобальный рынок Глобальный рынок
Оптимизация под языки Китайский и английский Мультиязычный
Интеграция в Azure Да (с 2025 года) Да
Производительность Наравне с GPT-4 по ряду задач (по оценке Microsoft) Лидирующая, особенно в англоязычных задачах
Особенности обучения Использует GPU (Nvidia H800), MLA Обучен на суперкомпьютерах с A100/H100
Open-source компоненты Да (например, DeepSeek-Coder) Частично (GPT-2, Whisper, OpenAI Baselines)
Ставка на скорость и стоимость Высокая эффективность и экономичность Качество, масштаб, стабильность

Несмотря на то, что сделал DeepSeek, новая платформа имеет, как плюсы, так и минусы.

Преимущества DeepSeek:

  • Низкая стоимость обработки.
  • Высокая энергоэффективность архитектуры MoE.
  • Адаптация под китайский рынок.
  • Быстрое развитие, регулярные релизы.
  • Активная команда разработчиков.
  • Интеграция в Azure и облачными хранилищами.
  • Доступность Open-source моделей.
  • В приоритете исследовательский подход, а не только бизнес.

Недостатки DeepSeek:

  • Меньшая зрелость экосистемы – меньше плагинов, инструментов и SDK (библиотеки и документы для разработчиков).
  • Зависимость от китайских GPU и локальной инфраструктуры.
  • Меньшая популярность и комьюнити за пределами Китая.

DeepSeek на ПК и смартфонах
DeepSeek легко использовать на смартфонах и ПК

6. Планы и перспективы Deepseek

Компания DeepSeek строит амбициозные планы по развитию искусственного интеллекта до 2030 года, сосредотачиваясь на расширении возможностей своих моделей, внедрении в различные отрасли и обеспечении этичного использования ИИ.

Краткосрочные цели:

  • Мультимодальные ИИ-системы. Планируется запуск модели DeepSeek-Vision, способной обрабатывать текст, изображения и голос, с точностью перевода до 99.8% и генерацией изображений с учетом контекста.
  • Устойчивость ИИ. Снижение энергопотребления на 40% за счет использования квантово-вдохновленных алгоритмов и сотрудничества с NVIDIA по созданию экологичных дата-центров в Осло и Сингапуре.
  • Отраслевые решения. Разработка диагностического инструмента для раннего обнаружения рака с точностью 94.3% и систем обнаружения мошенничества для крупных банков, включая HSBC и Citigroup.

Это достойные цели, однако компания планирует развиваться дальше, занимаясь даже глобальными вопросами.

Инциденты ИИ 2024
Инциденты, связанные с ИИ. В 2024 году – 233 случая

Долгосрочные перспективы:

  • Исследования в области AGI. Инвестиции в размере 2 млрд USD в исследования, направленные на достижение общего искусственного интеллекта.
  • Глобальное расширение. Планируется присутствие в более чем 50 странах к 2028 году, включая запуск образовательных программ и доступных ИИ-инструментов для развивающихся регионов.
  • Этическое управление ИИ. Внедрение трехуровневой модели управления, включающей внешний этический совет, алгоритмы обнаружения предвзятости и портал прозрачности, запланированный к запуску в первом квартале 2025 года.

Также DeepSeek работает над созданием специализированных моделей для различных отраслей, таких как здравоохранение и финансы.

Компания уже занимается разработкой инструментов без необходимости программирования, чтобы сделать ИИ доступным для широкой аудитории.

Расходы на обучение ИИ
Расходы на обучение ИИ DeepSeek и его конкурентов

Эти инициативы подчеркивают стремление DeepSeek не только конкурировать с ведущими игроками в области ИИ, но и формировать будущее технологий с акцентом на доступность, устойчивость и этичность.


7. Заключение

История китайской компании DeepSeek – это пример того, как стратегическое мышление, инновации и фокус на эффективности могут привести к созданию продукта, способного конкурировать с лидерами отрасли.

Успех компании DeepSeek означает, что монополия западных компаний в сфере ИИ под угрозой. Китай впервые создал модель, сопоставимую с GPT-4, при этом значительно дешевле и эффективнее.

Это стимулирует глобальную конкуренцию, ускоряет развитие ИИ и снижает барьеры для его внедрения. Появляется новый технологический центр, способный изменить расстановку сил в индустрии.

А что лучше DeepSeek или Chat GPT, остаётся открытым, только время покажет, сможет ли китайский DeepSeek стать мощным игроком в секторе ИИ.


8. FAQ

Китайская компания, разработавшая ИИ-модель DeepSeek-R1 с архитектурой Mixture-of-Experts.
В мае 2023 года в Ханчжоу как дочерняя компания хедж-фонда High-Flyer.
Mixture-of-Experts (MoE), позволяющую активировать лишь часть параметров для каждого запроса.
Около 2 USD, что примерно в 30 раз дешевле по сравнению с ChatGPT.
Низкая стоимость, высокая энергоэффективность, открытый исходный код и интеграция в Azure.
Меньшая зрелость экосистемы, зависимость от китайских GPU и ограниченная популярность за пределами Китая.
Запуск мультимодальной модели DeepSeek-Vision, снижение энергопотребления и отраслевые решения для медицины и финансов.
Нет, доступ не требует VPN и доступен в большинстве стран напрямую.
Автор блога Profvest Taras S
Тарас С.Частный инвестор, предприниматель, блогер. Инвестирую с 2008 года.

Зарабатываю в интернете на криптовалютах, акциях и других направлениях и активах.

Со-владелец нескольких ресторанов и сети магазинов электронной техники. Консультирую в Телеграм, делюсь опытом.