Google 推出第八代 TPU 芯片:价格-性能提升更好,并将训练与推理分离

Gate News 消息,4 月 22 日——Google Cloud 宣布于 4 月 22 日发布其第八代自研定制 TPU (Tensor Processing Unit) 芯片。新产品阵容包括 TPU 8t,专为 AI 训练任务而设计;以及 TPU 8i,为 AI 推理工作负载进行了优化。两款芯片都将在今年晚些时候开始供货。谷歌还发布了用于构建 AI 代理的新工具,并宣布一项 $750 百万基金以推动企业采用 AI。

TPU 8t 在相同价格水平下,其性能比谷歌上一代 Ironwood TPU 提升 2.8 倍。TPU 8i 相较其前代产品性能提升 80%,并采用静态随机存取存储器 (SRAM) 架构,实现“具有成本效益的大规模吞吐和低延迟,使数百万个代理能够同时运行”,据首席执行官 Sundar Pichai 表示。与 Ironwood 相比,TPU 8t 和 TPU 8i 的每瓦效率均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。谷歌在整个技术栈中优化了能效,并集成动态功耗管理系统,根据实时需求调整能耗。

谷歌自研模型现在通过直接客户 API 调用,每分钟处理超过 1600 亿个 token,高于上个季度的 1000 亿。如今,AI 在谷歌产生了 75% 的所有新增代码,而去年秋季为 50%。谷歌的企业产品 Gemini Enterprise,其付费月活用户环比增长 40%。该公司预计到 2026 年,将其机器学习计算预算中略多于一半投入云服务,以更好地服务云端客户及合作伙伴。谷歌也在扩大与博通(Broadcom)的合作,以开发并供给未来世代的定制 TPU 芯片,因为大型科技公司正寻求对英伟达(NVIDIA)和 AMD 价格昂贵且供给受限的 GPU 的替代方案。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

CZ dice que YZi Labs asigna el 70% a blockchain y el 20% a IA en Consensus Miami 2026

Según ChainCatcher, en Consensus Miami 2026, Zhao Changpeng (CZ) afirmó que YZi Labs asigna el 70% de la financiación a blockchain, el 20% a IA y el 10% a biotecnología. CZ añadió que BNB debería posicionarse como una moneda nativa para agentes de IA, y que todas las blockchains deben estar “listas para la IA” para respaldar

GateNewshace5h

Public adquiere la aplicación Treasury de la plataforma de inversión en IA para ampliar el trading de cripto

Según ChainCatcher, Public anunció la adquisición de la plataforma de servicios de inversión en IA Treasury App para fortalecer su negocio de corretaje impulsado por IA. No se divulgó el monto de la adquisición. Public actualmente admite la negociación de acciones, bonos y criptomonedas, incluidos Bitcoin, Ethereum, a

GateNewshace6h

Blitzy completa una ronda de financiación $200M liderada por Northzone

Según ChainCatcher, Blitzy, una empresa de codificación con IA cofundada por el ex arquitecto de Nvidia Sid Pardeshi, ha completado una ronda de financiación de 200 millones de dólares liderada por Northzone. Battery Ventures, Jump Capital y Morgan Creek Digital participaron en la ronda. La plataforma puede analizar sistemas complejos con

GateNewshace7h

La UE prohíbe la pornografía deepfake generada por IA el 7 de mayo

Según la agencia Xinhua, el 7 de mayo, los miembros del Parlamento Europeo y los Estados miembros alcanzaron un consenso para prohibir que los sistemas de inteligencia artificial generen contenido pornográfico deepfake. La prohibición se incorporará en las enmiendas de la Ley de Inteligencia Artificial de 2024. Parlamento Europeo

GateNewshace7h

Tether lanza el modelo de IA médica MedPsy QVAC y logra una puntuación de 62,62 en la versión de 17 mil millones de parámetros

Según Odaily, Tether AI Research Group lanzó QVAC MedPsy, un modelo de IA médica diseñado para ejecutarse localmente en teléfonos inteligentes y dispositivos portátiles sin depender de la nube. La versión de 1,7 mil millones de parámetros obtuvo 62,62 en siete evaluaciones médicas, superando a MedGemma-1.5-4B de Google por 11,42 poi

GateNewshace8h

La API de B.AI lanza cuatro modelos nuevos, incluido GPT-5.5 Instant en las 48 horas posteriores al lanzamiento de OpenAI

La API de B.AI ha lanzado cuatro nuevos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 y GLM-5.1. GPT-5.5 Instant completó la adaptación subyacente y la integración de la interfaz en 48 horas desde el lanzamiento de OpenAI, lo que permite acceso sin retraso a

GateNewshace8h
Comentar
0/400
Sin comentarios