Cerebras : comment les puces IA à l’échelle du wafer défient NVIDIA — Analyse financière de CBRS et explication des obstacles technologiques

Marchés
Mis à jour: 24/06/2026 10:58

Le 14 mai 2026, une entreprise encore peu connue mais prête à bouleverser l’ensemble du secteur des puces d’IA — Cerebras Systems — a réalisé la plus grande introduction en bourse technologique de l’année sur le Nasdaq. Fixée à 185 $ par action, l’action a ouvert en forte hausse à 350 $ et a terminé sa première journée en progression de 68 %. Présentée comme le « concurrent le plus sérieux de NVIDIA », cette étoile montante des puces d’IA a lancé une offensive technologique directe contre le géant du GPU avec sa puce « de la taille d’une assiette », gravée sur une seule tranche de silicium.

Pourtant, à peine plus d’un mois après son entrée en bourse, le premier rapport trimestriel de Cerebras a suscité de vifs débats sur le marché. Le chiffre d’affaires a dépassé les attentes et les pertes se sont nettement réduites, mais des prévisions de forte baisse de la marge brute ont entraîné un recul de plus de 10 % du cours en after-hours. Quelles sont les inquiétudes du marché ? La stratégie indépendante de puce à l’échelle de la tranche a-t-elle réellement le potentiel de défier NVIDIA sur le long terme ? Nous analyserons de manière systématique Cerebras sous quatre angles : technologie, performance financière, concurrence sectorielle et canaux de négociation.

La proposition de valeur de Cerebras

La fabrication traditionnelle de puces suit une logique bien établie : une tranche de silicium de 12 pouces est gravée avec des centaines de puces, puis découpée, encapsulée et testée. La taille de chaque puce est limitée par les dimensions du photomasque de la machine de lithographie, ce qui empêche de fabriquer des puces plus grandes. Cerebras a bouleversé ce paradigme : au lieu de découper la tranche, elle réalise une lithographie complète en une seule fois, transformant l’intégralité de la tranche en une seule puce géante.

C’est le Wafer-Scale Engine (WSE) de Cerebras. La dernière génération, le WSE-3, repose sur la technologie 5nm de TSMC, avec une surface de puce unique de 46 225 mm², intégrant 4 000 milliards de transistors et 900 000 cœurs d’IA, équipée de 44 Go de SRAM embarquée, et délivrant 125 pétaflops de puissance de calcul IA. À titre de comparaison, le H100 de NVIDIA — pilier des centres de données IA — contient environ 80 milliards de transistors. Le WSE-3 en intègre 50 fois plus.

Mais le véritable avantage compétitif de Cerebras ne réside pas uniquement dans le nombre de transistors. La vraie différenciation provient de son architecture mémoire.

Les GPU traditionnels (comme le H100) reposent largement sur une mémoire externe HBM à large bande passante, les transferts de données entre la puce et la mémoire étant limités par la bande passante physique. C’est ce que l’on appelle dans l’industrie le « mur mémoire » : quelle que soit la puissance des unités de calcul, si les données ne circulent pas assez vite, les performances en pâtissent. Cerebras intègre 44 Go de SRAM directement sur la puce, atteignant une bande passante mémoire embarquée de 21 Po/s. Selon les analystes, la bande passante mémoire du WSE-3 est 2 625 fois supérieure à celle du NVIDIA B200. En inférence IA, cela signifie que les poids des modèles n’ont plus besoin d’être transférés en permanence depuis la mémoire externe, ce qui réduit drastiquement la latence d’inférence.

Bien entendu, l’approche à l’échelle de la tranche comporte aussi des compromis. Un défaut critique n’importe où sur la tranche peut rendre la puce inutilisable. La réponse de Cerebras : la « technologie de réparation de cœurs redondants » — un grand nombre de cœurs de calcul de secours sont intégrés pour contourner automatiquement les zones défectueuses. Cela accroît la complexité et le coût de conception. Utiliser la tranche entière comme une seule puce exige une gestion des défauts et du rendement fondamentalement différente de la fabrication traditionnelle.

Différence fondamentale d’approche technique : NVIDIA privilégie l’« assemblage massif + interconnexions haut débit », construisant des supercalculateurs à partir d’une multitude de GPU. Cerebras opte pour « l’ultra-intégration sur une seule puce », remplaçant des centaines ou milliers de GPU par une puce géante. NVIDIA bénéficie d’un écosystème logiciel mature et d’une compatibilité inégalée. Cerebras offre des avantages théoriques d’efficacité dans certains scénarios d’inférence, mais doit bâtir son écosystème logiciel à partir de zéro.

Premier mois après l’IPO : de l’euphorie à la correction — trajectoire du cours CBRS

Le 14 mai 2026, Cerebras a fait ses débuts sur le Nasdaq à 185 $ par action, ouvrant à 350 $. L’action a grimpé de plus de 108 % en séance, entraînant une suspension de cotation, et a clôturé à 311,07 $. Avec une hausse de 68 % dès le premier jour, il s’agit de la plus grande IPO tech de 2026 aux États-Unis.

Dans les semaines suivantes, le titre CBRS a connu de fortes fluctuations. Le cours a atteint un sommet historique à 386 $, avant de retomber à un plus bas proche de 197 $. Au mardi 23 juin, CBRS a clôturé à 226,72 $ — soit encore 23 % au-dessus du prix d’introduction, mais en baisse de plus de 27 % par rapport à la clôture du premier jour.

Après la clôture du 23 juin, Cerebras a publié ses premiers résultats trimestriels en tant que société cotée, entraînant une chute de plus de 10 % du cours en after-hours. Lors de la séance nocturne du 24 juin, CBRS a encore perdu près de 11 %, à 201,8 $.

À la date de publication, la capitalisation boursière de CBRS s’élève à environ 49,8 milliards de dollars, avec un PER de l’ordre de 527x sur les douze derniers mois. Cette valorisation reflète de fortes attentes de croissance, mais implique aussi qu’une déception peut entraîner une forte volatilité.

Première publication de résultats : chiffre d’affaires en hausse, mais pourquoi le marché reste-t-il sceptique ?

Les résultats financiers du T1 2026 (clos le 31 mars) de Cerebras présentent un tableau contrasté :

Points positifs :

  • Chiffre d’affaires total de 193,4 millions $, en hausse de 94 % sur un an, supérieur aux attentes des analystes (181,2 millions $)
  • Chiffre d’affaires matériel de 110,6 millions $, en hausse de 59 % sur un an
  • Revenus cloud et autres services de 82,8 millions $, en hausse de 178 % sur un an
  • Perte nette de 14 millions $, fortement réduite par rapport à 23,9 millions $ un an plus tôt
  • Perte par action de 0,22 $, meilleure que les 0,25 $ attendus
  • Prévisions de chiffre d’affaires annuel entre 855 et 865 millions $, au-dessus du consensus des analystes (824,8 millions $)

Sujets d’inquiétude :

  • Marge brute cœur T2 attendue entre 36 % et 38 %, en baisse de plus de 10 points par rapport aux 46,5 % du T1
  • Marge opérationnelle cœur annuelle attendue entre -28 % et -32 %
  • Chiffre d’affaires cœur T2 attendu autour de 194 millions $

Doublement du chiffre d’affaires, pertes réduites, prévisions relevées : des performances impressionnantes pour toute entreprise en croissance. Pourtant, la réaction du marché a été une forte baisse en after-hours. La logique est simple : la valorisation de Cerebras repose sur le double pari "forte croissance + fortes marges", et la chute de la marge brute remet en cause ce second pilier.

Le directeur financier Bob Komin a expliqué lors de la conférence téléphonique que la baisse de marge s’explique par un manque d’espace dans les centres de données, obligeant Cerebras à relouer certains systèmes à ses clients, tandis que l’entreprise « accélère » l’expansion de ses propres capacités. Ces coûts devraient réduire les marges 2026 d’environ 10 à 15 points de pourcentage. Le PDG Andrew Feldman a été direct : « C’est assez ironique qu’après avoir inventé toute cette technologie, le facteur limitant soit… de construire les bâtiments. »

En d’autres termes, le goulot d’étranglement actuel de Cerebras n’est ni technologique, ni lié à la demande, mais bien au rythme d’expansion des infrastructures physiques, qui ne suit pas la croissance des commandes. Cela pèse sur la rentabilité à court terme, mais confirme aussi la réalité et l’urgence de la demande.

OpenAI et AWS : transformation de la clientèle derrière 20 milliards $ de commandes

L’évolution de la base clients de Cerebras est essentielle pour comprendre sa valeur à long terme.

Au premier semestre 2024, l’entreprise d’IA G42, basée aux Émirats arabes unis, représentait 87 % du chiffre d’affaires de Cerebras. Une telle concentration extrême de clientèle était auparavant la principale inquiétude du marché. Mais en janvier 2026, Cerebras a annoncé un partenariat stratégique avec OpenAI d’une valeur de plus de 20 milliards $ — OpenAI déploiera 750 mégawatts de puissance d’inférence haute vitesse Cerebras d’ici 2028. Les deux partenaires ont également lancé Codex-Spark, un modèle d’IA conçu pour le codage quasi instantané, générant plus de 1 000 tokens par seconde.

Parallèlement, Cerebras a signé un partenariat pluriannuel avec Amazon AWS, prévoyant le déploiement de systèmes Cerebras CS-3 dans les centres de données AWS. Les deux entreprises proposeront une « stratégie d’inférence découplée » : les puces Trainium 3 d’AWS gèrent le calcul prefill, tandis que Cerebras CS-3 assure l’inférence de décodage ultra-rapide.

Ces partenariats ne se résument pas à la taille des commandes. D’un client unique (G42) à deux piliers (OpenAI et AWS), le risque de concentration client de Cerebras s’est considérablement réduit. Surtout, OpenAI et AWS incarnent les deux grands scénarios mondiaux d’inférence IA : l’entraînement de modèles de pointe et le déploiement cloud à grande échelle. Obtenir des commandes pluriannuelles de ces deux géants constitue en soi une « validation de marché » du choix technologique de Cerebras.

Fin 2025, Cerebras disposait d’un carnet de commandes de 24,6 milliards $, avec l’objectif de convertir 3,7 milliards $ en chiffre d’affaires reconnu d’ici 2027. Le ratio carnet de commandes/chiffre d’affaires actuel est d’environ 48x — cela traduit une forte visibilité sur les revenus futurs, mais montre aussi que Cerebras n’en est qu’aux débuts de la livraison à grande échelle.

Puces à l’échelle de la tranche : la logique et les limites du défi au monopole de NVIDIA

Cerebras a fait le choix d’une voie technologique radicalement différente de celle de NVIDIA.

NVIDIA suit la tendance dominante du secteur : l’assemblage de chiplets. Les puces sont scindées en chiplets fonctionnels (calcul, cache, IO, etc.), fabriqués séparément puis assemblés via un packaging avancé. Cette méthode permet d’obtenir un bon rendement, des coûts maîtrisés et une production de masse évolutive. Les puces B200 de NVIDIA et Ascend de Huawei utilisent cette approche.

La voie de Cerebras, c’est « la tranche monolithique » : pas de découpe, pas d’assemblage, toute la tranche est utilisée comme une seule puce. Cela offre des avantages théoriques d’efficacité pour l’inférence, mais implique une complexité de fabrication élevée, une gestion du rendement difficile et la nécessité de bâtir un écosystème logiciel ex nihilo.

Leur concurrence relève donc d’un affrontement entre les paradigmes « effets d’échelle » et « efficacité extrême ». Les points forts de NVIDIA sont son écosystème logiciel CUDA, bâti sur des décennies, et sa capacité industrielle massive. L’atout de Cerebras : des gains potentiels de vitesse de l’ordre de 10x dans certains cas d’inférence.

Pour les investisseurs, la question clé n’est pas « Cerebras peut-il battre NVIDIA ? » — cela paraît quasi impossible à court terme. La vraie interrogation est : le marché de l’inférence IA est-il assez vaste pour soutenir une voie technologique indépendante, non basée sur le GPU ? Si oui, l’unicité de Cerebras, seul acteur commercial sur cette voie, devient en soi un argument de valorisation.

Facteurs de risque : quatre grands défis à ne pas négliger

Incertitude sur la marge brute et la rentabilité. Les prévisions de marge T2 chutent de 46,5 % à 36–38 %, et la marge opérationnelle cœur annuelle reste fortement négative. L’entreprise est loin de la rentabilité durable. Morgan Stanley estime que la compression des marges est temporaire, anticipant un retour vers l’objectif de 60 % à mesure que Cerebras s’affranchit de l’infrastructure louée — mais cela reste à prouver sur le marché.

Les évolutions structurelles de la clientèle devront être confirmées dans le temps. Si OpenAI et AWS ont nettement diversifié la base clients, la commande de 20 milliards $ d’OpenAI domine toujours le carnet (20 sur 24,6 milliards $). Tout changement dans le rythme de déploiement d’OpenAI pourrait avoir un impact significatif sur les revenus.

Pression de l’offre liée à la fin du lock-up. Ce jeudi (25 juin), la période de lock-up expire, rendant environ 13 % des actions issues de l’IPO cessibles par les investisseurs historiques et les dirigeants. L’augmentation du flottant pourrait peser à court terme sur le cours.

Décalage valorisation/croissance. CBRS se négocie actuellement autour de 91 fois les ventes, très au-dessus des 23x de NVIDIA. Les sociétés à forte croissance justifient une prime, mais si la croissance ralentit ou si les marges ne se redressent pas, le risque de contraction de la valorisation est important.

Conclusion

L’ascension de Cerebras illustre le déplacement de la demande de calcul IA du « training » vers « l’inférence ». À mesure que l’entraînement de grands modèles se standardise et s’industrialise, la quête d’une efficacité extrême en latence, coût et énergie pour l’inférence ouvre une fenêtre commerciale à des technologies « non conventionnelles » comme les puces à l’échelle de la tranche.

Dès sa première publication de résultats, Cerebras a affiché des revenus et des commandes supérieurs aux attentes, mais la forte baisse des marges a aussi révélé les difficultés de la phase d’expansion : l’infrastructure physique des data centers ne suit pas l’explosion de la demande de calcul. Un « doux casse-tête », mais un vrai frein sur la rentabilité.

Pour les investisseurs, Cerebras n’est pas « le remplaçant de NVIDIA », mais « une alternative pour l’inférence IA ». L’issue de cette voie indépendante dépendra de deux variables majeures : la capacité du marché de l’inférence IA à croître assez vite pour soutenir plusieurs routes technologiques, et la faculté de Cerebras à transformer efficacement ses 24,6 milliards $ de carnet en chiffre d’affaires et en flux de trésorerie positif sur 2026–2027.

La puce à l’échelle de la tranche de Cerebras peut-elle réellement ébranler l’empire GPU de NVIDIA ? La réponse n’est pas évidente aujourd’hui, mais se dessinera à chaque étape-clé des 12 à 24 prochains mois : taux de conversion des commandes, redressement des marges, concrétisation du partenariat AWS.

FAQ

Q1 : Quelle est la différence fondamentale entre la puce WSE-3 de Cerebras et le H100 de NVIDIA ?

Le WSE-3 est une tranche de 12 pouces non découpée, intégrant 4 000 milliards de transistors et 900 000 cœurs ; le H100 est une puce découpée et encapsulée de manière classique. La principale différence réside dans l’architecture mémoire : le WSE-3 dispose de 44 Go de SRAM embarquée avec une bande passante de 21 Po/s ; le H100 repose sur une mémoire HBM externe avec seulement 3,35 To/s de bande passante. Le WSE-3 offre des avantages de vitesse significatifs pour l’inférence, mais au prix d’une complexité et d’un coût de fabrication accrus.

Q2 : Quels sont les chiffres-clés du rapport de résultats T1 2026 de Cerebras ?

Le chiffre d’affaires du T1 s’établit à 193,4 millions $, en hausse de 94 % sur un an et supérieur aux 181,2 millions $ attendus ; la perte nette est de 14 millions $, contre 23,9 millions $ un an plus tôt ; le chiffre d’affaires matériel atteint 110,6 millions $, les services cloud 82,8 millions $. Les prévisions annuelles de chiffre d’affaires sont comprises entre 855 et 865 millions $.

Q3 : Pourquoi l’action Cerebras a-t-elle chuté après la publication des résultats ?

Malgré des revenus et pertes meilleurs qu’attendu, la marge brute T2 prévue chute fortement de 46,5 % à 36–38 %. La raison principale : le manque d’espace dans les data centers, obligeant l’entreprise à relouer des systèmes à ses clients et à accélérer l’expansion de ses capacités, ce qui réduit les marges d’environ 10 à 15 points. Le marché s’inquiète de la visibilité sur le chemin vers la rentabilité.

Q4 : Quels sont les principaux risques pour Cerebras ?

Quatre risques majeurs : forte baisse de la marge brute et rentabilité incertaine ; clientèle toujours très concentrée sur OpenAI (20 milliards $ de commandes sur 24,6 milliards $ de carnet) ; fin du lock-up le 25 juin, rendant 13 % des actions IPO cessibles ; ratio cours/chiffre d’affaires d’environ 91x, très supérieur aux 23x de NVIDIA, ce qui crée un risque important de contraction de valorisation.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Liker le contenu