Synapse Software applique la technologie TurboQuant pour réduire les coûts de traitement des documents d’IA

Message Gate News, 15 avril — Synapse Software a intégré TurboQuant, un algorithme de quantification vectorielle développé par Google Research, dans sa solution Synap OCR IX afin d’améliorer les capacités d’IA documentaire tout en réduisant les coûts d’adoption de l’IA en entreprise.

TurboQuant compresse le cache KV utilisé par les grands modèles de langage (LLMs) et les modèles de langage vision (VLMs), réduisant la consommation mémoire lors du traitement de documents longs. Cela permet un traitement des données plus rapide sur la même infrastructure GPU. La technologie répond aux goulots d’étranglement de mémoire qui nécessitaient auparavant une infrastructure GPU coûteuse, en particulier pour gérer des contextes étendus et des traitements par lots volumineux sans dégradation des performances.

Synapse Software prend également en charge des environnements basés sur le CPU pour les entreprises qui ne peuvent pas déployer d’infrastructure GPU. Grâce à un profilage de précision, l’entreprise a atteint un traitement d’inférence uniquement sur CPU d’environ 100 documents par minute, avec une perte de qualité maintenue en dessous de 1%, ce qui réduit le coût total de possession (TCO). Cette approche d’infrastructure flexible permet l’adoption de l’OCR par IA dans des secteurs sensibles à la sécurité tels que la finance et l’administration publique, où le déploiement sur site et les contraintes d’infrastructure ont auparavant freiné la mise en œuvre de l’IA.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Les caméras d’IA Netradyne surveillent le comportement des conducteurs dans les flottes

Système de surveillance du conducteur par IA de Netradyne Netradyne, une startup indienne, déploie des caméras alimentées par l’IA dans des flottes de véhicules commerciaux pour surveiller le comportement des conducteurs et réduire les accidents. Les caméras orientées vers l’intérieur se concentrent sur le conducteur plutôt que sur les passagers, en alertant les conducteurs lorsqu’ils dépassent les limites de vitesse o

CryptoFrontierIl y a 6h

AequiSolva lance l’architecture d’IA Sentinel Stack pour la vérification des actifs institutionnels le 30 avril

D’après AequiSolva, l’entreprise a lancé son architecture d’échange Sentinel Stack™ intégrant l’IA le 30 avril 2026, avec une exécution déterministe, une surveillance des marchés pilotée par l’IA et le moteur Omni-Attest Engine™ pour une preuve cryptographique continue des réserves. La plateforme combine trois éléments centraux

GateNewsIl y a 11h

Karpathy révèle : la méthode complète pour construire une base de connaissances personnelle avec des LLM

Les membres fondateurs d’OpenAI, l’ancien directeur de l’IA chez Tesla, Andrej Karpathy, a publié sur X un travail sur le flux de travail des « LLM Knowledge Bases » et a expliqué comment, récemment, il a fait passer une grande partie de sa consommation de tokens de « la manipulation de code » à « la manipulation de connaissances »—en utilisant des LLM pour rassembler des articles, des documents, des dossiers, des images dispersés dans un wiki personnel auto-entretenu. L’ensemble du processus a déjà accumulé, dans ses propres projets de recherche, environ ~100 articles, ~400 000 mots, et tout a été écrit et mis à jour entièrement par des LLM. Cet article récapitule le setup complet de Karpathy et fournit aux développeurs qui veulent le reproduire une liste de vérification exécutable. Idée centrale : données brutes → compilation par LLM → wiki → Q&R La philosophie de conception de Karpathy peut se résumer en un

ChainNewsAbmediaIl y a 17h

L’entreprise de trésorerie Bitcoin K Wave Media obtient jusqu’à $485M pour la mise en place de l’infrastructure d’IA

Selon ChainCatcher, l’entreprise de trésorerie en bitcoins cotée au Nasdaq, K Wave Media, a annoncé le 4 mai un pivot stratégique vers l’infrastructure d’IA, en obtenant jusqu’à 485 millions de dollars de soutien en capital pour des investissements dans des centres de données, des services de location de GPU, ainsi que des acquisitions et des partenariats d’infrastructure d’IA. L’entreprise

GateNewsIl y a 18h

Antimatter lance un plan de centre de données d’IA avec un financement de 300 millions d’euros

Antimatter, une société française d’infrastructure cloud pour les charges de travail liées à l’IA, a été lancée le 4 mai en réunissant trois entreprises existantes : Datafactory, Policloud et Hivenet. La société lève 300 millions d’euros (351 millions de dollars) afin de déployer 100 unités de micro data centers en 2026 pour l’inférence IA

CryptoFrontierIl y a 20h
Commentaire
0/400
Aucun commentaire