DeepSeek добавляет распознавание изображений и видео в свой основной чат-бот

Китайская компания искусственного интеллекта добавила распознавание изображений и видео в свой основной чат-бот.

В то же время местные производители чипов показали, что теперь они могут соперничать с быстрым запуском поддержки, которая раньше считалась американской сильной стороной.

DeepSeek, компания из Ханчжоу, тихо добавила новую функцию под названием «режим распознавания изображений» в свою платформу чата. Этот новый режим присоединяется к двум другим режимам, запущенным компанией в начале этого месяца: «эксперт» и «вспышка».

Новая функция позволяет чат-боту понимать фотографии и видео, а не только текст.

Это приводит его в соответствие с другими крупными AI-чатботами, которые уже давно предлагают подобные возможности.

Чен Сяоканг, руководитель мультимодальной команды DeepSeek, заявил, что инструмент впервые был протестирован небольшой группой пользователей как на сайте, так и в мобильном приложении.

Чен Делли, старший исследователь компании, отметил запуск коротким постом, в котором упоминался логотип компании: «Маленький кит теперь может видеть».

Функция распознавания изображений и видео появилась всего через несколько дней после того, как DeepSeek выпустила предварительный просмотр своей новейшей флагманской модели DeepSeek-V4 и сделала веса модели доступными для скачивания и использования любым желающим.

V4 — это не одна модель, а две. Первая, DeepSeek-V4-Pro, содержит 1,6 триллиона параметров и предназначена для сложных задач, требующих сложных рассуждений и многоступенчатых автоматизированных процессов.

Вторая, DeepSeek-V4-Flash, создана для обработки большого количества запросов при меньших затратах. Обе модели поддерживают окно контекста в один миллион токенов.

Они также используют гибридную архитектуру внимания, которая, по словам компании, снижает потребление вычислительной мощности и памяти во время вывода.

Китайские производители чипов достигли нового рубежа

Что привлекло внимание многих отраслевых наблюдателей, так это не только сама модель, но и то, что произошло в день её запуска.

Четыре китайские компании по производству чипов — Huawei Ascend, Cambricon, Hygon Information и Moore Threads — все подтвердили, что их оборудование работало идеально с V4 с самого первого дня выпуска.

Такое же дневное сопровождение, когда новая модель работает без сбоев на не-NVIDIA чипах сразу при запуске, а не через недели или месяцы, ранее было практически невозможным вне экосистемы Nvidia.

Чипы Ascend от Huawei, включая A2, A3 и 950, поддерживают как V4-Pro, так и V4-Flash.

Компания заявила, что её чип Ascend 950 использует объединённые вычислительные процессы и параллельные потоки обработки для ускорения вывода.

Cambricon завершила адаптацию, используя открытый фреймворк vLLM для вывода и поделилась своим кодом на GitHub.

Hygon заявила, что провела глубокую оптимизацию модели на своей платформе DCU, чтобы обеспечить плавный переход от выпуска модели к её реальному использованию.

Moore Threads работала с Пекинской академией искусственного интеллекта для запуска V4 на своей карте MTT S5000 с использованием программного стека FlagOS.

Отраслевые наблюдатели считают, что такой скоординированный запуск представляет собой реальное изменение.

Годами чипы вне экосистемы Nvidia требовали месяцев для поддержки новой крупной модели. Добиться того, чтобы восемь различных отечественных чипсета работали в первый день, — это значительный рубеж.

Общая картина: стоимость и независимость DeepSeek

Наблюдатели считают, что более глубокий смысл этого запуска в том, что DeepSeek показала, что может поставлять высокоуровневый ИИ без зависимости от западного оборудования.

Запуская свои модели нативно на нескольких китайских чипах одновременно, она снижает риск, связанный с экспортными ограничениями, которые блокируют доступ китайских компаний к самым мощным американским процессорам.

Стоимость также важна. DeepSeek усердно работала над тем, чтобы снизить цену на запуск своих моделей. Это облегчает бизнесу создание автоматизированных систем без очень высоких вычислительных затрат.

Таким образом, обновления и запуск DeepSeek — это не только технический прорыв. Это скорее целая цепочка поставок, которая объединяется.

Исходя из этого релиза, вопрос о том, кто лидирует в ИИ, кажется, уходит от того, кто создает самую умную модель, к тому, кто может поддерживать всю систему дешево и независимо в долгосрочной перспективе.

Если вы читаете это, вы уже на шаг впереди. Оставайтесь с нами с нашим информационным бюллетенем.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить