Mensaje de Gate News, 24 de abril — El ingeniero de OpenAI, Clive Chan, ha presentado objeciones detalladas al capítulo de recomendaciones de hardware en el informe técnico V4, calificándolo de “sorprendentemente mediocre y propenso a errores” en comparación con la versión V3 aclamada. La guía de hardware de V3, que incluía sesiones de Q&A que se convirtieron en el tema de discusión más popular en la conferencia académica ISCA, ofreció recomendaciones específicas alineadas con los estándares de interconexión de la industria. En cambio, V4 es mucho más vaga.
Chan cuestionó sistemáticamente tres recomendaciones clave. Sobre el consumo de energía, el informe sugiere que la optimización del software permite que los chips ejecuten cómputo, almacenamiento y comunicación al mismo tiempo al máximo, y recomienda que los fabricantes de chips reserven margen adicional de potencia. Chan sostiene que esto es contraproducente: la potencia total del chip está limitada por restricciones físicas del proceso, así que reservar más margen de potencia solo reduce la frecuencia de operación, disminuyendo en última instancia el rendimiento computacional. En cuanto a la transferencia de datos de GPU a GPU, el informe aboga por un modelo pull—en el que las GPU obtienen activamente los datos—en lugar de un modelo push, citando la alta sobrecarga de notificaciones en las operaciones push. Chan lo refuta, argumentando que en realidad el pull es más lento y que sería preferible mejorar las capacidades de los adaptadores de red. Sin embargo, ambos podrían estar hablando de capas diferentes del problema: el informe aborda la sobrecarga del mecanismo de notificación, mientras que Chan se refiere a la latencia de transmisión en sí.
Sobre las funciones de activación, el informe recomienda reemplazar SwiGLU por funciones más simples para reducir la carga computacional. Chan no ve mérito en ello, señalando que Sonic MoE ya ha demostrado un rendimiento óptimo usando SwiGLU. Chan sospecha que DeepSeek pudo haber “debilitado deliberadamente esta sección.”
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Musk Consideró Integrar OpenAI en Tesla a Fines de 2017, Dice el Tribunal
De acuerdo con un testimonio en un juicio federal en Oakland, California, Elon Musk consideró integrar OpenAI en Tesla a finales de 2017 y principios de 2018, según Shivon Zilis, ejecutiva de Neuralink y exmiembro de la junta de OpenAI. Zilis declaró que Musk exploró ofrecer a Sam Altman un escaño en la junta directiva de Tesla
GateNewsHace16m
El crecimiento de usuarios de Gemini y Claude se acelera en abril, mientras que el de ChatGPT se desacelera a 30% interanual
Según el último informe de Bank of America, Gemini y Claude registraron un sólido crecimiento de usuarios en abril, mientras que la expansión de ChatGPT se desaceleró. En visitas web en EE. UU., ChatGPT creció un 30% interanual hasta 34 millones de visitas (equivalente al 6% del tráfico de Google), mientras que Claude se disparó un 715% interanual hasta 7,1 mil millones
GateNewsHace24m
OpenAI lanza el protocolo MRC con AMD, Broadcom, Intel, Microsoft y Nvidia
OpenAI anunció que ha colaborado con AMD, Broadcom, Intel, Microsoft y Nvidia para lanzar Multipath Reliable Connection (MRC), un protocolo de redes de código abierto. MRC está diseñado para acelerar clústeres de entrenamiento de IA a gran escala, mejorar la fiabilidad y reducir significativamente la inactividad de GPU
GateNewsHace26m
Los ingresos del centro de datos de IA de SK Telecom aumentan un 89% en el primer trimestre de 2026
Según SK Telecom, el negocio de centro de datos de inteligencia artificial de la empresa de telecomunicaciones surcoreana registró 131,4 mil millones de wones (89,4 millones de dólares) en ingresos durante el primer trimestre de 2026, un 89,3% más interanual. La compañía atribuyó el aumento a una mayor utilización de los centros de datos y
GateNewsHace36m
Arm advierte debilidad en los smartphones y observa el crecimiento de chips de IA para compensar
Arm Holdings advirtió que la debilidad del mercado de los smartphones está comprimiendo una fuente clave de ingresos para la empresa de diseño de chips, aunque se espera que el crecimiento del negocio de chips de IA compense el impacto, según el CEO Rene Haas en una conferencia de resultados. En el trimestre anterior, las entregas de teléfonos disminuyeron, con las pérdidas concentradas en
CryptoFrontierHace46m
DeepSeek recauda financiación con una valoración de $45B en medio de la competencia de la IA
El laboratorio de IA chino DeepSeek está en conversaciones para recaudar su primera ronda de financiación con una valoración reportada de 45 mil millones de dólares, según TechCrunch. Esta valoración supone un aumento significativo frente a una valoración estimada de 20 mil millones de dólares solo unas semanas antes, después de que se prestara atención a los modelos de IA de la empresa por
CryptoFrontierhace1h