Anthropic identifica tres cambios a nivel de producto detrás de la caída de la calidad de Claude Code, no un problema del modelo

Mensaje de Gate News, 23 de abril — El equipo de ingeniería de Anthropic confirmó que la degradación de la calidad de Claude Code reportada por los usuarios durante el mes pasado se debió a tres cambios independientes a nivel de producto, no a problemas de la API ni del modelo subyacente. Los tres problemas se solucionaron el 7 de abril, el 10 de abril y el 20 de abril, respectivamente, con la versión final ahora en v2.1.116.

El primer cambio ocurrió el 4 de marzo, cuando el equipo redujo el nivel de esfuerzo de razonamiento predeterminado para Claude Code de “high” a “medium” para abordar picos ocasionales de latencia extrema en Opus 4.6 bajo alta intensidad de razonamiento. Después de quejas generalizadas de los usuarios sobre el rendimiento reducido, el equipo revirtió el cambio el 7 de abril. El valor predeterminado actual es ahora “xhigh” para Opus 4.7 y “high” para otros modelos.

El segundo problema fue un bug introducido el 26 de marzo. El sistema estaba diseñado para borrar registros antiguos de razonamiento después de que la inactividad de la conversación superara una hora para reducir los costos de recuperación de sesión. Sin embargo, una falla en la implementación hizo que el borrado se ejecutara repetidamente en cada turno posterior en lugar de una sola vez, lo que provocó que el modelo perdiera progresivamente el contexto de razonamiento previo. Esto se manifestó como un aumento de la falta de memoria, operaciones repetidas e invocaciones anómalas de herramientas. El bug también provocó fallos de caché en cada solicitud, acelerando el consumo de la cuota de los usuarios. Dos experimentos internos no relacionados enmascararon las condiciones de reproducción, extendiendo el proceso de depuración a más de una semana. Después de la corrección el 10 de abril, el equipo revisó el código problemático usando Opus 4.7 y descubrió que Opus 4.7 podía identificar el bug, mientras que Opus 4.6 no.

El tercer cambio se lanzó el 16 de abril junto con Opus 4.7. El equipo agregó instrucciones al mensaje del sistema para reducir la salida redundante. Las pruebas internas durante varias semanas no mostraron regresión, pero después del lanzamiento la interacción con otros prompts degradó la calidad de la codificación. La evaluación extendida reveló una caída del 3% en el rendimiento tanto en Opus 4.6 como en 4.7, lo que llevó a un rollback el 20 de abril.

Estos tres cambios afectaron a diferentes grupos de usuarios en distintos momentos, y su efecto combinado creó una caída generalizada e inconsistente de la calidad, complicando el diagnóstico. Anthropic afirmó que ahora requerirá a más empleados internos que usen la misma versión pública de compilación que los usuarios, que ejecuten suites completas de evaluación del modelo para cada modificación del prompt del sistema y que implementen periodos de despliegue por etapas. Como compensación, Anthropic ha restablecido las cuotas de uso para todos los usuarios con suscripción.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Sierra recauda 950 millones de dólares, con una valoración de 15.800 millones: Bret Taylor lidera OpenAI como presidente para hacerse con el principal referente de atención al cliente de IA

Sierra, cofundada por Bret Taylor, anunció la finalización de una ronda Series E de 950 millones de dólares, con una valoración de 15.800 millones de dólares, liderada inicialmente por Tiger Global y GV. En 8 trimestres alcanzó 150 millones de dólares en ARR y una tasa de penetración en Fortune 50 superior al 40%. Se posiciona como una plataforma vertical de atención al cliente impulsada por agentes de IA, que ofrece flujos de trabajo listos para usar. Taylor también es presidente de OpenAI, y el foco está en la gobernanza y las revelaciones de intereses.

ChainNewsAbmediahace1h

La API de Gemini habilita Webhooks: Google aborda el dolor de la sondeación en bucles para tareas largas, Batch/Veo se pueden enviar en tiempo real

La API de Google Gemini lanzó Webhooks el 4 de mayo, que empujan automáticamente el resultado al callback URL cuando se completa una tarea larga, en lugar de la sondeo, reduciendo el consumo de recursos y la latencia y simplificando el código. Es aplicable a la Batch API, a Veo2 y al razonamiento con contextos largos, especialmente adecuado para serverless. En comparación con OpenAI, que tiende a usar SSE, y con Anthropic, que aún utiliza sondeo, Google destaca la infraestructura para desarrolladores. A futuro, se prestará atención a los mecanismos de seguridad y a la ampliación de modelos. Para los desarrolladores en Taiwán, integrarlo de inmediato puede reducir de forma significativa las cuotas y la carga del sistema.

ChainNewsAbmediahace1h

Krutrim cambia a servicios en la nube de IA el 5 de mayo, publica sus primeras ganancias mientras los ingresos del AF26 alcanzan 31,6 millones de dólares

Según Press Trust of India, la empresa india de IA Krutrim se reposicionó como proveedor nacional de servicios en la nube de IA el 5 de mayo, deteniendo sus esfuerzos de diseño de chips y redirigiendo capital y talento hacia la infraestructura en la nube. La empresa informó ingresos de FY26 de aproximadamente 3 mil millones de rupias (US$31,6 m

GateNewshace2h

Las inversiones de Anthropic y OpenAI superan los 1,1 billones de dólares en operaciones de cripto retail desde el inicio de 2026

Según Bloomberg, los inversores minoristas han inyectado aproximadamente 1,13 mil millones de dólares en operaciones apalancadas de derivados de empresas privadas de IA desde el inicio de 2026. Las plataformas cripto Ventuals y PreStocks permiten operar 24 horas al día en firmas como Anthropic, OpenAI y SpaceX sin otorgar acceso directo e

GateNewshace3h
Comentar
0/400
Sin comentarios