Investigadores de OpenAI: los sistemas de IA podrían manejar la mayor parte del trabajo de investigación en dos años

Mensaje de Gate News, 29 de abril — Los investigadores de OpenAI Sébastien Bubeck y Ernest Ryu afirman que los sistemas de IA podrían realizar la mayor parte del trabajo de investigación humano en dos años, presentando las matemáticas como una medida clara del progreso de la IA. A diferencia de las pruebas de rendimiento vagas, los problemas matemáticos ofrecen una verificación precisa: las respuestas son correctas o incorrectas, sin dejar margen para la ambigüedad.

Bubeck señaló que el verdadero pensamiento de la IA requiere sobrevivir a largas cadenas de razonamiento. Un solo error en un argumento de varios pasos derrumba toda la demostración, por lo que la detección y corrección de errores a mitad del proceso es el objetivo definitivo para los modelos avanzados. Los laboratorios internos de OpenAI ya han generado más de diez teoremas completamente nuevos publicables en revistas de combinatoria de primer nivel, demostrando que la IA ahora produce trabajo genuinamente original y rompedor, más allá de simplemente recombinar artículos existentes.

Sin embargo, los avances científicos sostenidos exigen un enfoque constante durante semanas de pruebas. Los sistemas actuales todavía requieren una supervisión humana estricta para guiar y verificar cada cambio de dirección. Bubeck usa “tiempo de AGI” para medir cuánto tiempo un modelo puede imitar de forma independiente el pensamiento humano; los sistemas actuales operan aproximadamente de días a una semana, y el objetivo de la industria es lograr semanas o meses para permitir trabajo autónomo en campos como la biología.

La memoria a largo plazo es fundamental para este futuro. Las ventanas de chat estándar limitan la profundidad: las demostraciones matemáticas complejas a menudo superan 50 páginas, mientras que los repositorios de código muestran cómo las sesiones de trabajo prolongadas permiten una resolución de problemas más profunda. A medida que la IA gane independencia y memoria, la experiencia humana se vuelve más valiosa, no menos. Los trabajadores deben conservar el conocimiento profundo y básico para desafiar y verificar las respuestas de las máquinas, y las organizaciones necesitarán nuevos filtros automatizados y sistemas de reputación para mantener la confianza ante una avalancha de investigación asistida por IA.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

SoftBank se dispara un 16,5% mientras el rally de chips de IA impulsa las acciones de Japón el 7 de mayo

Según CNBC, SoftBank Group subió un 16,5% el 7 de mayo después de que los mercados de Japón reabrieran tras el parón de la Golden Week. Las subidas llegaron cuando los inversores siguieron una subida global en acciones de IA y de chips que llevó al Nikkei 225 a un máximo histórico. Advantest subió un 7,8%, Tokyo Electron ganó un 9,2% y Renesas

GateNewsEn este momento

El CEO de Anthropic lo admitió en persona: crecimiento de 80 veces en el 1T, explica por qué hay que conseguir toda la capacidad informática de SpaceX

El CEO de Anthropic, Dario Amodei, dijo en la conferencia Code with Claude que los ingresos anualizados proyectados para Q1 y el uso crecerían 10 veces, pero en realidad aumentaron 80 veces; lo calificó de «desquiciado, demasiado difícil de gestionar», aunque acelerará la entrega de más capacidad de cómputo y ampliará los límites de uso para los usuarios. Ese mismo día también anunció la adquisición de toda la capacidad de cómputo de SpaceX Colossus 1 (aprox. 300+ MW, 220.000 GPUs de Nvidia), prevista para entrar en línea en un plazo de un mes, como trasfondo comercial del crecimiento. Aún no se han divulgado montos concretos; los próximos resultados financieros confirmarán las cifras.

ChainNewsAbmediaHace7m

a16z lanza su quinto fondo de criptomonedas por 2.200 millones de dólares, liderando la inversión en tres nuevas empresas de IA

Según el anuncio de a16z (Andreessen Horowitz) del 5 de mayo, la firma de capital de riesgo lanzó formalmente su quinto fondo exclusivo para criptomonedas, “Crypto Fund 5”, con un monto de recaudación de 2,2 mil millones de dólares. En el mismo periodo, a16z anunció que lidera la inversión en las empresas de integración de IA Tessera Labs, la plataforma de contratación de IA Ethos y la plataforma de creación con IA Glif.

MarketWhisperHace34m

Cursor Contrata a Simon Green, exejecutivo de Palo Alto Networks, para liderar la expansión en Asia

Según Cursor AI, la empresa de codificación con IA ha establecido su sede regional en Singapur y ha nombrado a Simon Green, ex ejecutivo sénior de Palo Alto Networks, como presidente regional. Green pasó más de 10 años en Palo Alto Networks, donde ayudó a impulsar el crecimiento de la empresa en Japón y Asia P

GateNewsHace50m

El fundador de Pi Network asiste a Consensus 2026 y pronuncia una charla sobre la verificación de identidad en la era de la IA

Según el anuncio en la cuenta oficial de X de Pi Network, el cofundador de Pi Network, Chengdiao Fan, dio una charla en la conferencia Consensus 2026 celebrada el 6 de mayo en Miami, Estados Unidos, sobre la «fusión práctica de Web3, IA y blockchain»; mientras que Koka(l)is participó el 7 de mayo en un debate titulado «Cómo demostrar que eres una persona real en un mundo de IA».

MarketWhisperhace1h
Comentar
0/400
Sin comentarios