Что такое DeepSeek AI? Обзор отечественной модели искусственного интеллекта, завоевывающей рынок криптотрей

Рынки
Обновлено: 2025-10-29 10:22

В недавнем эксперименте по торговле криптовалютой китайская AI-модель DeepSeek продемонстрировала впечатляющие результаты — всего за 9 дней она увеличила стартовый капитал с $10 000 до $22 500 в рамках соревнования Alpha Arena по криптотрейдингу, обеспечив выдачную доходность в 125%.

Этот результат превзошёл даже модель Qwen 3 Max от Alibaba, закрепив за DeepSeek статус восходящей звезды в секторе AI-трейдинга.

Истоки и развитие DeepSeek

DeepSeek — это компания в сфере искусственного интеллекта, базирующаяся в Ханчжоу, Китай, основанная в 2023 году при поддержке известной фирмы по управлению количественными активами High-Flyer.

Компания специализируется на разработке передовых больших языковых моделей и сопутствующих технологий, уже представив ряд продуктов: DeepSeek LLM, DeepSeek Coder, DeepSeekMath и DeepSeek-VL.

20 января 2025 г. DeepSeek официально запустила модель DeepSeek-R1, которая сопоставима с OpenAI O1 по задачам, связанным с математикой, программированием и обработкой естественного языка. Последняя версия, DeepSeek-V3.2, привлекла значительное внимание благодаря снижению стоимости инференса AI до одной шестой — одной седьмой от стоимости V3.1, а также ускорению обработки длинных контекстов в 2–3 раза.

Семейство моделей DeepSeek и техническая эволюция

Инновационная архитектура модели

Техническая архитектура DeepSeek сочетает различные варианты структуры Transformer с динамическими механизмами внимания, достигая баланса между пониманием и генерацией смысла за счёт многоуровневого объединения признаков.

Ключевые преимущества модели проявляются в трёх направлениях:

  • Механизм динамического разреженного внимания: благодаря внедрению управляющих элементов, динамически распределяющих веса внимания, DeepSeek сохраняет высокую эффективность обработки длинных текстов при снижении вычислительной сложности. При работе с документами объёмом 100 000 токенов вычисления сокращаются на 42% по сравнению со стандартными Transformer.
  • Система «смеси экспертов»: за счёт маршрутизации между 16 экспертными модулями, каждый токен активирует лишь 2–3 эксперта, что увеличивает ёмкость модели при контроле затрат на инференс.
  • Прогрессивная стратегия обучения: DeepSeek использует поэтапное предварительное обучение, дообучение на инструкциях и обучение с подкреплением на основе обратной связи от человека. В сценариях генерации кода синтетическое расширение данных повышает точность кода до 89,7%.

Выдающаяся производительность

На эталонном тесте MMLU модель DeepSeek-72B набрала 81,3 балла по направлениям STEM, таким как математика и физика, превзойдя показатель GPT-4 (79,8).

В задачах автодополнения кода она достигла Pass@1 на уровне 68,2%, что на 12 пунктов выше, чем у Codex.

Результаты DeepSeek на крипто- и финансовых рынках

Лидерство в криптовалютных соревнованиях

В рамках инвестиционного проекта Alpha Arena, запущенного Nof1, DeepSeek Chat V3.1 продемонстрировал выдающиеся торговые способности.

В соревновании шести AI-моделям был предоставлен стартовый капитал по $10 000, и они работали в одинаковых условиях рыночной информации, торгуя цифровыми активами, такими как Bitcoin, Ether и Dogecoin, стремясь к максимальной доходности.

По состоянию на 28 октября DeepSeek обеспечил доходность 125%, значительно опередив международных конкурентов.

Для сравнения: GPT-5 от OpenAI потерял почти 60% средств, снизив баланс до примерно $4 000, а Gemini 2.5 Pro от Google DeepMind понёс убыток в 57%.

На платформе прогнозов Polymarket трейдеры оценили вероятность победы DeepSeek в 61%, что намного выше, чем у Alibaba (29%).

Высокие результаты на рынке акций США

DeepSeek также добился успеха в торговле акциями США.

В открытом эксперименте "AI-Trader", организованном Гонконгским университетом, DeepSeek занял первое место в рейтинге за месяц тестирования с годовой доходностью 10,61%, тогда как эталонный индекс Nasdaq 100 по технологическим акциям показал лишь 2,13%.

Это означает, что доходность DeepSeek была почти в пять раз выше, чем у бенчмарка.

Преимущества DeepSeek по цене API и стратегия открытого исходного кода

Существенное снижение цен

29 сентября 2025 г. DeepSeek выпустила модель DeepSeek-V3.2-Exp и объявила о значительном снижении цен на API.

Согласно новой политике, обработка входных токенов при совпадении с кэшем стоит 0,2 юаня за миллион токенов, при отсутствии совпадения — 2 юаня, а вывод — 3 юаня за миллион токенов, что более чем на 50% дешевле прежних тарифов.

Последняя модель DeepSeek-V3.2 дополнительно снижает стоимость инференса AI до одной шестой — одной седьмой от V3.1, при этом цены на API составляют $0,28/$0,028/$0,42 за миллион входных/кэшированных/выходных токенов соответственно.

Стратегия открытого исходного кода и локализованное развертывание

DeepSeek распространяется по лицензии MIT и оптимизирован для чипов Huawei и других китайских производителей, что облегчает развертывание в локальных вычислительных средах Китая.

Открытая стратегия позволяет разработчикам бесплатно и приватно внедрять модели DeepSeek, открывая больше возможностей для корпоративных решений.

Перспективы

По мере развития технологий AI-трейдинга становится очевидным, что отечественные крупные модели, такие как DeepSeek, будут играть всё более значимую роль в будущем криптовалютного и более широкого финансового рынка.

Для криптотрейдеров следить за развитием DeepSeek — это не только способ оставаться на передовой AI-технологий, но и возможность воспользоваться новыми инвестиционными перспективами в меняющемся финансовом ландшафте.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Нравится содержание