Mensaje de Gate News, 23 de abril — Google anunció el 22 de abril que lanzará más adelante este año chips TPU de octava generación separados para entrenamiento e inferencia, reemplazando su diseño combinado anterior. La medida se dirige a cargas de trabajo de agentes de IA y ofrece a los clientes de Google Cloud una alternativa al hardware de Nvidia.
El chip de entrenamiento ofrece 2.8 veces el rendimiento del TPU Ironwood de séptima generación de Google al mismo precio, mientras que el chip de inferencia es 80% más rápido y cuenta con 384 MB de SRAM, el triple de la cantidad en Ironwood. La separación de las capacidades de entrenamiento e inferencia refleja un cambio en la forma en que las empresas optimizan para diferentes demandas computacionales.
La iniciativa está respaldada por una asociación a largo plazo con Broadcom y Anthropic. Anthropic planea utilizar aproximadamente 3.5 gigavatios de cómputo de TPU a través de Broadcom a partir de 2027, y Broadcom se encargará de la fabricación de chips y de los componentes de redes hasta 2031. Anthropic, la startup de IA detrás de Claude, ha visto que sus ingresos anualizados superan recientemente $30 mil millones. Mientras tanto, Apple, Microsoft, Meta y Amazon también están ampliando sus esfuerzos de chips de IA personalizados para reducir la dependencia de Nvidia, que sigue siendo el líder del mercado.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
RLWRLD lanza el modelo de IA RLDX-1 para manos robóticas industriales
RLWRLD, una startup de IA en robótica respaldada por LG Electronics, presentó RLDX-1, un modelo base diseñado para manos robóticas de cinco dedos en aplicaciones industriales, según RLWRLD. La compañía lanzó los pesos del modelo, el código y la documentación técnica en GitHub y Hugging Face.
Modelo
CryptoFrontierHace18m
DeepMind AlphaEvolve récords entre disciplinas: la multiplicación de matrices de 4×4 supera el récord de Strassen de 1969 y el entrenamiento de Gemini es 1% más rápido
Google DeepMind 7 de mayo (hora de EE. UU.) publicó un informe de resultados multidisciplinarios de AlphaEvolve. El blog oficial de DeepMind resume los avances concretos de AlphaEvolve desde su lanzamiento: encontrar un método mejor para la multiplicación de matrices complejas 4×4 que el algoritmo de Strassen de 1969 (48 multiplicaciones escalares puras), colaborar con matemáticos como Terence Tao para resolver varios problemas matemáticos difíciles de Erdős, ahorrar 0,7% de recursos globales de cómputo para los centros de datos de Google, aumentar la velocidad en 23% de los kernels clave con los que se entrena Gemini y reducir en 1% el tiempo total de entrenamiento de Gemini.
Arquitectura: Exploración de amplitud con Gemini Flash + Gemini
ChainNewsAbmediaHace31m
OpenAI Codex llega a la extensión para Chrome: puede probar una Web App en el navegador, obtener Contexto entre páginas y funcionar en paralelo
OpenAI 7 de mayo (hora de EE. UU.) anunció la función de extensión de Chrome de Codex, que permite que los agentes de codificación de Codex operen directamente dentro del navegador Chrome en macOS y Windows. La documentación oficial de Codex de OpenAI detalla que la extensión permite a Codex probar una web app sin hacerse cargo del navegador del usuario, obtener context a través de múltiples pestañas, usar Chrome DevTools y realizar otras tareas en paralelo. OpenAI también informó que los usuarios activos semanales de Codex superan los 4 millones, lo que representa un crecimiento de 8 veces desde principios de año.
Cosas que se pueden hacer dentro del navegador: probar web app, obtener context entre páginas, usar DevTools
Extensión de Chrome
ChainNewsAbmediaHace34m
OpenAI lanza GPT-Realtime-2: introduce el razonamiento de GPT-5 en agentes de voz y eleva el contexto a 128K
OpenAI 7 de mayo (hora de EE. UU.) en una conferencia para desarrolladores presentó tres nuevos modelos de voz en tiempo real: GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper, todos abiertos para desarrolladores a través de la Realtime API. El anuncio oficial de OpenAI señala que GPT-Realtime-2 es el primero de OpenAI con capacidades de GPT-5
ChainNewsAbmediaHace35m
Visité en persona laboratorios de IA en China: un investigador revela que la brecha entre chips y datos es la clave de la diferencia entre China y EE. UU.
El reportero Nathan Lambert, tras una visita en profundidad a varios laboratorios de IA en China, señala que la ventaja central del país reside en la cultura, el talento y una mentalidad pragmática: la investigación se centra primero en mejorar la calidad de los modelos, los estudiantes se convierten en contribuyentes clave y hay menos luchas internas en la colaboración entre equipos; pero existen brechas en chips, datos y creatividad, lo que, junto con la limitación del poder de cómputo externo por parte de Estados Unidos y una calidad de datos baja, impulsa a construir entornos de entrenamiento propios. Las empresas abren el código, pero conservan la tecnología central para sus propias afinaciones. Si Estados Unidos endurece el ecosistema abierto, podría afectar la posición de liderazgo global.
ChainNewsAbmediaHace45m
a16z lidera la ronda de financiación $16M para la startup sueca de IA Pit
Según Bloomberg, la startup sueca de IA Pit recaudó 16 millones de dólares en una ronda de financiación liderada por Andreessen Horowitz, con la participación de Lakestar y de ejecutivos de importantes empresas de IA y tecnología. Las familias suecas Stena y Lundin también se sumaron a la ronda. Pit ya tiene proyectos piloto con Voi,
GateNewsHace48m