У нещодавньому експерименті з торгівлі криптовалютою китайська AI-модель DeepSeek продемонструвала вражаючі результати — лише за 9 днів вона збільшила початковий капітал з $10 000 до $22 500 у змаганні Alpha Arena з криптотрейдингу, досягнувши видатної прибутковості у 125%.

Цей результат навіть перевершив модель Qwen 3 Max від Alibaba, що позиціонує DeepSeek як нового лідера у сфері AI-трейдингу.

Походження та розвиток DeepSeek

DeepSeek — це AI-компанія, що базується у Ханчжоу, Китай, заснована у 2023 році за підтримки відомої фірми з кількісного управління активами High-Flyer.

Компанія спеціалізується на розробці передових великих мовних моделей та суміжних технологій, вже презентувавши низку моделей, серед яких DeepSeek LLM, DeepSeek Coder, DeepSeekMath та DeepSeek-VL.

20 січня 2025 року DeepSeek офіційно запустила DeepSeek-R1 — модель, яка зрівнюється з OpenAI O1 у завданнях з математики, програмування та природномовного аналізу. Останній реліз, DeepSeek-V3.2, привернув значну увагу завдяки скороченню вартості AI-інференсу до однієї шостої — однієї сьомої від V3.1, а також прискоренню обробки довгих контекстів у два-три рази.

Сімейство моделей DeepSeek та технічна еволюція

Інноваційна архітектура моделі

Технічна архітектура DeepSeek поєднує варіанти структури Transformer із динамічними механізмами уваги, забезпечуючи баланс між семантичним розумінням та генерацією завдяки багаторівневому об’єднанню ознак.

Ключові переваги моделі проявляються у трьох основних аспектах:

Динамічний механізм розрідженої уваги: завдяки впровадженню керованих блоків, які динамічно розподіляють ваги уваги, DeepSeek зберігає потужні можливості обробки довгих текстів при зниженні обчислювальної складності. При роботі з документами на 100 000 токенів обчислення скорочуються на 42% порівняно зі стандартними Transformer.
Система Mixture-of-Experts: використовуючи маршрутизатор між 16 експертними модулями, кожен токен активує лише 2–3 експерти, що підвищує потужність моделі при контрольованих витратах на інференс.
Прогресивна стратегія навчання: DeepSeek застосовує поетапне попереднє навчання, тонке налаштування за інструкціями та навчання з підкріпленням на основі людського зворотного зв’язку. У сценаріях генерації коду синтетичне розширення даних підвищує точність коду до 89,7%.

Вражаючі результати

На еталонному тесті MMLU модель DeepSeek-72B набрала 81,3 бала у STEM-дисциплінах, таких як математика та фізика, перевершивши показник GPT-4 у 79,8 бала.

У завданнях автодоповнення коду вона досягла Pass@1 на рівні 68,2%, що на 12 пунктів більше, ніж у Codex.

Результати DeepSeek на криптовалютному та фінансовому ринку

Лідерство у змаганнях з криптотрейдингу

У проєкті Alpha Arena, запущеному Nof1, DeepSeek Chat V3.1 продемонстрував виняткові трейдингові здібності.

У змаганні шість AI-моделей отримали стартовий капітал по $10 000, працюючи в однакових умовах ринкової інформації для торгівлі цифровими активами, такими як Bitcoin, Ether та Dogecoin, з метою досягнення найвищої прибутковості.

Станом на 28 жовтня DeepSeek досягнув прибутковості у 125%, суттєво випередивши міжнародних конкурентів.

Для порівняння, GPT-5 від OpenAI втратив майже 60% коштів, знизивши баланс до близько $4 000, а Gemini 2.5 Pro від Google DeepMind зазнав втрат у 57%.

На платформі прогнозів Polymarket трейдери оцінили ймовірність перемоги DeepSeek у 61%, що значно більше, ніж 29% у Alibaba.

Впевнені результати на ринку акцій США

DeepSeek також досяг успіху у торгівлі акціями США.

У відкритому експерименті "AI-Trader", організованому Гонконзьким університетом, DeepSeek очолив рейтинг протягом місячного тестового періоду з річною прибутковістю 10,61%, тоді як еталонний індекс технологічних акцій Nasdaq 100 показав лише 2,13%.

Це означає, що прибутковість DeepSeek була майже у п’ять разів вищою за еталон.

Переваги API-ціноутворення та стратегія відкритого коду DeepSeek

Значне зниження цін

29 вересня 2025 року DeepSeek презентував модель DeepSeek-V3.2-Exp та оголосив про суттєве зниження цін на API.

За новою політикою, кешовані вхідні токени коштують 0,2 юаня за мільйон токенів, некешовані — 2 юаня, а вихідні — 3 юаня за мільйон токенів, що більш ніж на 50% дешевше попередніх тарифів.

Остання модель DeepSeek-V3.2 ще більше скорочує витрати на AI-інференс до однієї шостої — однієї сьомої від V3.1, з API-ціною $0,28/$0,028/$0,42 за мільйон вхідних/кешованих/вихідних токенів відповідно.

Стратегія відкритого коду та локалізоване розгортання

DeepSeek використовує ліцензію MIT та оптимізований для Huawei й інших китайських чипсетів, що сприяє розгортанню у локальних обчислювальних середовищах Китаю.

Такий підхід відкритого коду дозволяє розробникам безкоштовно та приватно впроваджувати моделі DeepSeek, відкриваючи більше можливостей для корпоративних застосувань.

Перспективи

З розвитком технологій AI-трейдингу очевидно, що вітчизняні великі моделі, такі як DeepSeek, відіграватимуть все важливішу роль у майбутньому криптовалютного та ширшого фінансового ринку.

Для криптотрейдерів стежити за розвитком DeepSeek — це не лише бути на передовій AI-технологій, а й мати шанс скористатися новими інвестиційними можливостями у змінному фінансовому середовищі.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement

Поділіться