DeepSeek ajoute la reconnaissance d'images et de vidéos à son chatbot principal

Une entreprise chinoise d’intelligence artificielle a ajouté la reconnaissance d’images et de vidéos à son chatbot principal.

En même temps, des fabricants locaux de puces ont montré qu’ils pouvaient désormais rivaliser avec le support de lancement rapide qui était autrefois une force américaine.

DeepSeek, une entreprise basée à Hangzhou, a discrètement ajouté une nouvelle fonctionnalité appelée « mode reconnaissance d’image » à sa plateforme de chat. Ce nouveau mode rejoint deux autres modes que l’entreprise a lancés plus tôt ce mois-ci : « expert » et « flash ».

La nouvelle fonctionnalité permet au chatbot de comprendre des photos et des vidéos, pas seulement du texte.

Cela le met en conformité avec d’autres grands chatbots IA qui offrent des capacités similaires depuis un certain temps.

Chen Xiaokang, qui dirige l’équipe multimodale de DeepSeek, a déclaré que l’outil avait été testé en premier lieu avec un petit groupe d’utilisateurs sur le site web et l’application mobile.

Chen Deli, un chercheur senior de l’entreprise, a célébré le lancement avec un court message faisant référence au logo de l’entreprise : « La petite baleine peut maintenant voir. »

La fonctionnalité d’image et de vidéo est sortie quelques jours seulement après que DeepSeek a publié un aperçu de son tout nouveau modèle phare, DeepSeek-V4, et rendu les poids du modèle disponibles pour que quiconque puisse les télécharger et les utiliser.

V4 n’est pas un seul modèle mais deux. Le premier, DeepSeek-V4-Pro, compte 1,6 trillion de paramètres et est conçu pour des tâches difficiles nécessitant un raisonnement complexe et des flux de travail automatisés à plusieurs étapes.

Le second, DeepSeek-V4-Flash, est conçu pour gérer un grand nombre de requêtes à un coût inférieur. Les deux modèles supportent une fenêtre de contexte d’un million de tokens.

Ils utilisent également une conception d’attention hybride que l’entreprise affirme réduire la puissance de calcul et la mémoire nécessaires lors de l’inférence.

Les fabricants chinois de puces atteignent une nouvelle étape

Ce qui a attiré l’attention de nombreux observateurs de l’industrie n’était pas seulement le modèle lui-même, mais ce qui s’est passé le jour de son lancement.

Quatre entreprises chinoises de puces, Huawei Ascend, Cambricon, Hygon Information et Moore Threads, ont toutes confirmé que leur matériel fonctionnait parfaitement avec V4 dès le premier jour de sa sortie.

Ce type de support le jour même, où un nouveau modèle fonctionne sans problème sur des puces non-NVIDIA dès le lancement au lieu de semaines ou de mois plus tard, était auparavant presque impossible en dehors de l’écosystème Nvidia.

Les puces Ascend de Huawei, y compris les A2, A3 et 950, supportent à la fois V4-Pro et V4-Flash.

L’entreprise a déclaré que sa puce Ascend 950 utilise des processus de calcul fusionnés et des flux de traitement parallèles pour accélérer l’inférence.

Cambricon a terminé son adaptation en utilisant le cadre d’inférence open-source vLLM et a partagé son code sur GitHub.

Hygon a indiqué avoir effectué une optimisation approfondie du modèle sur sa plateforme DCU pour créer une voie fluide entre la sortie du modèle et son utilisation réelle.

Moore Threads a travaillé avec l’Académie chinoise d’intelligence artificielle pour faire fonctionner V4 sur sa carte MTT S5000 en utilisant la pile logicielle FlagOS.

Les observateurs de l’industrie affirment que ce lancement coordonné représente un changement réel.

Pendant des années, les puces fabriquées en dehors de l’écosystème Nvidia mettaient des mois à supporter un nouveau modèle majeur. Faire fonctionner huit chipsets domestiques différents dès le premier jour est une étape importante.

La vue d’ensemble : coût et indépendance pour DeepSeek

Les observateurs pensent que la signification plus profonde de ce lancement est que DeepSeek a montré qu’il peut fournir une IA de haut niveau sans dépendre du matériel occidental.

En faisant fonctionner ses modèles nativement sur plusieurs puces chinoises en même temps, cela réduit le risque lié aux restrictions à l’exportation qui ont empêché les entreprises chinoises d’accéder aux processeurs américains les plus puissants.

Le coût est également important. DeepSeek a travaillé dur pour maintenir le prix de l’exécution de ses modèles à un niveau bas. Cela facilite la construction de systèmes automatisés pour les entreprises sans faire face à des coûts de calcul très élevés.

De cette manière, les améliorations et le lancement de DeepSeek ne concernent pas principalement une avancée technique unique. Il s’agit plutôt d’une chaîne d’approvisionnement entière qui se rassemble.

À partir de cette sortie, la question de savoir qui mène dans l’IA semble s’éloigner de celui qui construit le modèle le plus intelligent, et se diriger vers celui qui peut faire fonctionner tout le système de manière économique et indépendante à long terme.

Si vous lisez ceci, vous êtes déjà en avance. Restez-y avec notre newsletter.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler