ᐅ История компании DeepSeek и как они сделали конкурента ChatGPT

История DeepSeek – это пример создания инновации при помощи стратегического подхода. В январе 2025 года китайская компания DeepSeek представила языковую модель DeepSeek-R1.

Она показала отличную производительность при небольших затратах. Это вызвало резонанс в технологическом секторе. Рассмотрим данную разработку подробнее.

Содержание

Что такое Deepseek
Как появилась Deepseek
Разработка своего аналога ChatGPT
Запуск продукта и первые успехи
Сравнение с ChatGPT
Планы и перспективы Deepseek
Заключение
FAQ

1. Что такое Deepseek

DeepSeek – это китайская компания, предлагающая ИИ, который использует архитектуру Mixture-of-Experts (MoE), позволяющую задействовать лишь часть параметров модели при каждом запросе.

Это снижает затраты и делает ИИ более доступным. Например, стоимость обработки 1 млн токенов у ДипСик – около 2 USD, тогда как у OpenAI – около 60 USD (в зависимости от модели).

Но это логично, ведь еще одним умопомрачительным фактом есть то, что DeepSeek-R1 (первая версия чат-бота) был создан всего за 55 дней при бюджете около 6 млн USD — меньше десятой части затрат западных аналогов.

Главная страница официального сайта DeepSeek

Таким образом, DeepSeek нарушает монополию США в сфере передового искусственного интеллекта.

Модель R1 уже была интегрирована в облако Microsoft Azure, а качество ответов, по словам гендиректора Microsoft Сатьи Наделлы, впервые приблизилась к GPT-4 от OpenAI.

DeepSeek в момент выхода также возглавила чарты App Store и Google Play, став глобально востребованным инструментом. Немаловажным преимуществом есть то, что у DeepSeek открытый исходный код.

Репозиторий DeepSeek-V3 на GitHub набрал свыше 96 900 звёзд и 15 700 форков и эти цифры продолжают увеличиваться, что показывает большой интерес разработчиков.

Появление ДипСик называют ключевым моментом в развитии технологий ИИ. Это алгоритм, равный по значимости, изобретению лампочки, транзистора, или выводу первого спутника на орбиту Земли.

Считается, что DeepSeek может ускорить появление новых инноваций в мире. Сегодня Deepseek делает то, что недоступно многим другим инструментам ИИ.

2. Как появилась Deepseek

DeepSeek – китайский стартап в области искусственного интеллекта, основанный в мае 2023 года в Ханчжоу.

Его основатель, Лян Вэньфэн, родился в 1985 году в Чжаньцзяне (провинция Гуандун) и окончил Чжэцзянский университет со степенью магистра в области информационных и коммуникационных технологий.

Основатель компании DeepSeek Лян Вэньфэн

В 2015 году он вместе с двумя однокурсниками основал хедж-фонд High-Flyer, который использовал математические модели и ИИ для торговли на фондовом рынке.

К 2019 году активы фонда превысили 10 миллиардов юаней, а в 2021 году Лян начал приобретать тысячи графических процессоров Nvidia для обучения ИИ-моделей.

DeepSeek использовала графические процессоры Nvidia для обучения ИИ

В мае 2023 года Лян основал DeepSeek как дочернюю компанию High-Flyer, сосредоточенную на разработке искусственного общего интеллекта (AGI).

Компания быстро привлекла внимание благодаря выпуску модели DeepSeek-V3 в конце 2024 года, которая была обучена с использованием 2 000 чипов Nvidia H800 при затратах менее 6 миллионов долларов.

Ключевые участники команды:

Лян Вэньфэн (Liang Wenfeng). Основатель и генеральный директор DeepSeek. Ранее он соосновал хедж-фонд High-Flyer а также был известен своей стратегией долгосрочных исследований и акцентом на эффективность в разработке ИИ-моделей.
Ло Фули (Luo Fuli). Молодая специалистка в области обработки естественного языка, выпускница Пекинского университета.
Её работа сыграла значительную роль в разработке модели DeepSeek-V2. Ло получила признание в китайских СМИ как «вундеркинд ИИ».
Гао Хуачзо (Gao Huazuo) и Цзэн Вандин (Zeng Wangding). Исследователи, внесшие ключевой вклад в разработку архитектуры MLA, которая позволила значительно снизить стоимость обучения модели DeepSeek-V3.
Го Дая (Guo Daya), Чжу Цихао (Zhu Qihao) и Дай Дамай (Dai Damai). Молодые учёные, получившие докторские степени в ведущих китайских университетах.
Они активно участвовали в разработке моделей ДипСик и внесли значительный вклад в исследовательскую деятельность компании.

Компания DeepSeek придерживается плоской организационной структуры, поощряя сотрудничество и обмен идеями среди сотрудников.

Китайский чат-бот DeepSeek на Android и iPhone

Фирма предлагает конкурентоспособные зарплаты и предоставляет значительные вычислительные ресурсы для перспективных проектов, что способствует привлечению и удержанию талантливых специалистов.

3. Разработка своего аналога ChatGPT

DeepSeek – это китайская нейросеть, разработанная стартапом DeepSeek, которая представляет собой аналог ChatGPT.

Она использует архитектуру «mixture of experts», что позволяет ей эффективно обрабатывать и анализировать данные.

Схема работы mixture of experts

ДипСик обладает рядом уникальных функций, таких как глубокое рассуждение и возможность поиска информации в интернете, что делает её конкурентоспособной на рынке ИИ.

Несмотря на свои преимущества, у DeepSeek есть и недостатки, включая проблемы с безопасностью и возможные утечки данных.

В отличие от ChatGPT, доступ к ДипСик не требует использования VPN, что делает её более доступной для пользователей в разных странах.

Однако стоит учитывать, что использование этой нейросети может быть связано с рисками, такими как кибератаки и обвинения в нарушении прав OpenAI.

В целом, DeepSeek представляет собой интересный шаг в развитии генеративных моделей искусственного интеллекта, предлагая пользователям новые возможности для взаимодействия с технологиями.

Ключевые особенности DeepSeek:

Архитектура «mixture of experts». Позволяет эффективно обрабатывать данные, активируя только необходимые параметры для конкретных задач, что делает модель более ресурсосберегающей.
Доступность. DeepSeek предлагает бесплатный доступ без ограничений по количеству запросов, что делает её привлекательной для пользователей, ищущих экономичные решения.
Локальная работа. Возможность запуска на собственном оборудовании обеспечивает защиту конфиденциальной информации и независимость от интернет-соединения.

DeepSeek представляет собой интересный шаг в развитии ИИ, предлагая пользователям новые возможности для взаимодействия с технологиями.

4. Запуск продукта и первые успехи

Появление китайской нейросети DeepSeek вызвало бурную реакцию на рынке. Акции технологических компаний, таких как Nvidia и ASML, упали на 8–17% из-за опасений утраты США лидерства в ИИ.

Nasdaq и S&P 500 снизились на 2.6% и более, отражая панику инвесторов. DeepSeek, использующий лишь 2 000 GPU, впечатлил эффективностью, что усилило ажиотаж и страхи.

Обвал S&P 500 на фоне запуска DeepSeek

Пользователи активно обсуждали DeepSeek, отмечая его низкую стоимость (1/30 от ChatGPT) и высокую производительность, особенно в китайскоязычной среде.

Однако популярность снижается: уже через пару месяцев, к маю 2025 года, доля рынка упала с 4% до 2%. Некоторые указывают на цензуру в поиске, что вызывает недоверие.

Тем не менее, ДипСик стимулирует инновации и конкуренцию в сфере ИИ.

Что лучше DeepSeek или Chat GPT? DeepSeek и ChatGPT – лидеры среди ИИ-чат ботов, но выбор зависит от задач.

DeepSeek (R1 и V3) превосходит в логических и математических задачах, быстрее и дешевле (1/30 стоимости ChatGPT). Он эффективен для структурированного обучения и кодирования, но ограничен в функциональности и интеграции.

ChatGPT (GPT-4o) выигрывает в универсальности, контекстном мышлении и креативности, предлагая десктоп-приложения и лучшее взаимодействие с платформами.

ДипСик ценят за открытость кода, но есть опасения цензуры.

Установка приложения по QR-коду на Android и iOS

5. Сравнение с ChatGPT

Давайте рассмотрим ключевые характеристики DeepSeek и ChatGPT на момент выхода первой:

Характеристика	DeepSeek-R1	ChatGPT (GPT-4)
Происхождение	Китай, компания DeepSeek	США, компания OpenAI
Архитектура	Mixture-of-Experts (MoE)	Dense Transformer
Общее количество параметров	236 млрд (21 млрд активных на запрос)	Около 175 млрд (все активны постоянно)
Стоимость 1 млн токенов	2 USD	Около 60 USD, зависит от версии
Целевая аудитория	Азиатский и глобальный рынок	Глобальный рынок
Оптимизация под языки	Китайский и английский	Мультиязычный
Интеграция в Azure	Да (с 2025 года)	Да
Производительность	Наравне с GPT-4 по ряду задач (по оценке Microsoft)	Лидирующая, особенно в англоязычных задачах
Особенности обучения	Использует GPU (Nvidia H800), MLA	Обучен на суперкомпьютерах с A100/H100
Open-source компоненты	Да (например, DeepSeek-Coder)	Частично (GPT-2, Whisper, OpenAI Baselines)
Ставка на скорость и стоимость	Высокая эффективность и экономичность	Качество, масштаб, стабильность

Несмотря на то, что сделал DeepSeek, новая платформа имеет, как плюсы, так и минусы.

Преимущества DeepSeek:

Низкая стоимость обработки.
Высокая энергоэффективность архитектуры MoE.
Адаптация под китайский рынок.
Быстрое развитие, регулярные релизы.
Активная команда разработчиков.
Интеграция в Azure и облачными хранилищами.
Доступность Open-source моделей.
В приоритете исследовательский подход, а не только бизнес.

Недостатки DeepSeek:

Меньшая зрелость экосистемы – меньше плагинов, инструментов и SDK (библиотеки и документы для разработчиков).
Зависимость от китайских GPU и локальной инфраструктуры.
Меньшая популярность и комьюнити за пределами Китая.

DeepSeek легко использовать на смартфонах и ПК

6. Планы и перспективы Deepseek

Компания DeepSeek строит амбициозные планы по развитию искусственного интеллекта до 2030 года, сосредотачиваясь на расширении возможностей своих моделей, внедрении в различные отрасли и обеспечении этичного использования ИИ.

Краткосрочные цели:

Мультимодальные ИИ-системы. Планируется запуск модели DeepSeek-Vision, способной обрабатывать текст, изображения и голос, с точностью перевода до 99.8% и генерацией изображений с учетом контекста.
Устойчивость ИИ. Снижение энергопотребления на 40% за счет использования квантово-вдохновленных алгоритмов и сотрудничества с NVIDIA по созданию экологичных дата-центров в Осло и Сингапуре.
Отраслевые решения. Разработка диагностического инструмента для раннего обнаружения рака с точностью 94.3% и систем обнаружения мошенничества для крупных банков, включая HSBC и Citigroup.

Это достойные цели, однако компания планирует развиваться дальше, занимаясь даже глобальными вопросами.

Инциденты, связанные с ИИ. В 2024 году – 233 случая

Долгосрочные перспективы:

Исследования в области AGI. Инвестиции в размере 2 млрд USD в исследования, направленные на достижение общего искусственного интеллекта.
Глобальное расширение. Планируется присутствие в более чем 50 странах к 2028 году, включая запуск образовательных программ и доступных ИИ-инструментов для развивающихся регионов.
Этическое управление ИИ. Внедрение трехуровневой модели управления, включающей внешний этический совет, алгоритмы обнаружения предвзятости и портал прозрачности, запланированный к запуску в первом квартале 2025 года.

Также DeepSeek работает над созданием специализированных моделей для различных отраслей, таких как здравоохранение и финансы.

Компания уже занимается разработкой инструментов без необходимости программирования, чтобы сделать ИИ доступным для широкой аудитории.

Расходы на обучение ИИ DeepSeek и его конкурентов

Эти инициативы подчеркивают стремление DeepSeek не только конкурировать с ведущими игроками в области ИИ, но и формировать будущее технологий с акцентом на доступность, устойчивость и этичность.

7. Заключение

История китайской компании DeepSeek – это пример того, как стратегическое мышление, инновации и фокус на эффективности могут привести к созданию продукта, способного конкурировать с лидерами отрасли.

Успех компании DeepSeek означает, что монополия западных компаний в сфере ИИ под угрозой. Китай впервые создал модель, сопоставимую с GPT-4, при этом значительно дешевле и эффективнее.

Это стимулирует глобальную конкуренцию, ускоряет развитие ИИ и снижает барьеры для его внедрения. Появляется новый технологический центр, способный изменить расстановку сил в индустрии.

А что лучше DeepSeek или Chat GPT, остаётся открытым, только время покажет, сможет ли китайский DeepSeek стать мощным игроком в секторе ИИ.

8. FAQ

1. Что такое DeepSeek?

Китайская компания, разработавшая ИИ-модель DeepSeek-R1 с архитектурой Mixture-of-Experts.

2. Когда была основана DeepSeek?

В мае 2023 года в Ханчжоу как дочерняя компания хедж-фонда High-Flyer.

3. Какую архитектуру использует DeepSeek-R1?

Mixture-of-Experts (MoE), позволяющую активировать лишь часть параметров для каждого запроса.

4. Сколько стоит обработка 1 млн токенов у DeepSeek?

Около 2 USD, что примерно в 30 раз дешевле по сравнению с ChatGPT.

5. В чем преимущества DeepSeek перед ChatGPT?

Низкая стоимость, высокая энергоэффективность, открытый исходный код и интеграция в Azure.

6. Какие недостатки у DeepSeek?

Меньшая зрелость экосистемы, зависимость от китайских GPU и ограниченная популярность за пределами Китая.

7. Каковы краткосрочные планы DeepSeek?

Запуск мультимодальной модели DeepSeek-Vision, снижение энергопотребления и отраслевые решения для медицины и финансов.

8. Требуется ли VPN для доступа к DeepSeek?

Нет, доступ не требует VPN и доступен в большинстве стран напрямую.

Автор: PROFVEST — независимый обзор криптовалют и рынка (метрики, тренды, риски). Мы анализируем проекты по данным: ликвидность, активность, TVL/объёмы, токеномика и разлоки, а также публикуем образовательные материалы.

Дисклеймер: информация не является инвестиционной рекомендацией. Перед покупкой активов оценивайте риски и проверяйте токеномику/разлоки.

Тарас С.Частный инвестор, предприниматель, блогер. Инвестирую с 2008 года. Зарабатываю в интернете на криптовалютах, акциях и других направлениях и активах. Со-владелец нескольких ресторанов и сети магазинов электронной техники. Консультирую в Телеграм, делюсь опытом.