Anthropic Identifica Três Alterações na Camada de Produto por Detrás da Queda da Qualidade do Claude Code, e Não um Problema do Modelo

Mensagem do Gate News, 23 de abril — A equipa de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code reportada pelos utilizadores ao longo do último mês resultou de três alterações independentes na camada de produto, e não de problemas na API ou no modelo subjacente. Os três problemas foram corrigidos a 7 de abril, 10 de abril e 20 de abril, respetivamente, com a versão final agora na v2.1.116.

A primeira alteração ocorreu a 4 de março, quando a equipa reduziu o nível de esforço de raciocínio predefinido do Claude Code de “high” para “medium” para abordar picos ocasionais e extremos de latência no Opus 4.6 sob elevada intensidade de raciocínio. Após reclamações generalizadas de utilizadores sobre desempenho reduzido, a equipa reverteu a alteração em 7 de abril. O valor predefinido atual é agora “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido a 26 de março. O sistema foi concebido para limpar registos antigos de raciocínio após a inatividade na conversa exceder uma hora, de modo a reduzir os custos de recuperação da sessão. No entanto, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente em vez de uma única vez, levando o modelo a perder progressivamente o contexto de raciocínio anterior. Isso manifestou-se como aumento de esquecimento, operações repetidas e invocações anormais de ferramentas. O bug também resultou em faltas de cache em cada pedido, acelerando o consumo das quotas dos utilizadores. Dois testes internos não relacionados mascararam as condições de reprodução, alargando o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipa analisou código problemático usando o Opus 4.7 e verificou que o Opus 4.7 conseguia identificar o bug, enquanto o Opus 4.6 não conseguia.

A terceira alteração foi lançada a 16 de abril em conjunto com o Opus 4.7. A equipa adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento, a interação com outros prompts degradou a qualidade da codificação. Uma avaliação alargada revelou uma queda de 3% no desempenho tanto no Opus 4.6 como no 4.7, levando a uma reversão a 20 de abril.

Estas três alterações afetaram grupos de utilizadores diferentes em momentos diferentes, e o efeito combinado criou uma queda de qualidade generalizada e inconsistente, dificultando o diagnóstico. A Anthropic afirmou que agora será necessário envolver mais funcionários internos para utilizarem a mesma versão pública de compilação que os utilizadores, executarem conjuntos completos de avaliação do modelo para cada modificação de prompt do sistema e implementarem períodos de rollout faseado. Como compensação, a Anthropic repôs as quotas de utilização de todos os utilizadores com subscrição.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A ASX Adverte as Empresas para Não Exagerarem o Impacto da IA a 4 de Maio

De acordo com a Bloomberg, a 4 de maio, a operadora da bolsa australiana ASX alertou as empresas para não exagerarem o impacto da inteligência artificial nos seus negócios. A diretora-chefe de conformidade da ASX, Lucinda McCann, afirmou que a bolsa está a acompanhar a existência de «ramping» ou de alegações destinadas a impulsionar os preços das ações

GateNews2m atrás

Megazone Cloud faz parceria com a AWS para um programa de formação em IA na Coreia do Sul

A Megazone Cloud, uma empresa de serviços cloud com sede na Coreia do Sul, foi escolhida pela Amazon Web Services, a 4 de maio, como parceira de operações para o AWS Agentic AI GameDay na Coreia do Sul, segundo o anúncio da empresa. O programa é um evento de formação prática conduzido pelo Generative AI Innovation Center da AWS,

CryptoFrontier1h atrás

Cofundador da Solana alerta que a IA poderá quebrar a criptografia pós-quântica no Breakpoint de 2026

De acordo com o cofundador da Solana Anatoly Yakovenko, falando na conferência 2026 Solana Breakpoint em Amesterdão, a inteligência artificial representa uma ameaça existencial maior para a segurança da blockchain do que os computadores quânticos. Yakovenko alertou que os modelos de IA poderiam explorar padrões matemáticos subtis em po

GateNews1h atrás

Da sanita aos fabricantes de especiarias: a transbordação do valor da cadeia de abastecimento da IA impulsionou que empresas?

A vaga de dividendos da onda da inteligência artificial continua a espalhar-se, indo de uma empresa como a Nvidia até gigantes tecnológicos como a Taiwan Semiconductor Manufacturing Company, e agora até empresas japonesas que fabricam sanitas e um grupo alimentar que começou com glutamato monossódico — todos se tornaram, silenciosamente, vencedores ocultos desta febre da construção de infraestruturas para IA. A sua ascensão revelou uma tendência-chave: o efeito de transbordo de valor das cadeias de abastecimento de IA já se infiltrou profundamente na indústria transformadora tradicional, abrindo caminho para oportunidades de transformação ainda mais diversas. Fabricante de sanitas TOTO: tecnologia cerâmica acerta, de forma inesperada, na procura dos processos de wafer A japonesa TOTO, grande marca de casas de banho e do sector de sanitários, é conhecida mundialmente pelas suas tampas de sanita de alta qualidade, com mais de 40 anos de dedicação à produção cerâmica. Ainda assim, é precisamente esta arte tradicional que, à primeira vista, parece nada ter a ver com tecnologia, que lhe deu um palco totalmente novo nos processos de semicondutores. A TOTO anunciou recentemente que vai utilizar a sua especialização em tecnologia cerâmica para produzir um Electrostatic Chuck para a fabricação de chips. Mal a notícia surgiu, a cotação das ações registou um

ChainNewsAbmedia3h atrás

MediaTek Contrata Ex-Executivo da TSMC para Expansão de Chips de IA

O designer de chips taiwanês MediaTek nomeou o antigo executivo da Taiwan Semiconductor Manufacturing Co (TSMC) Douglas Yu como conselheiro a tempo parcial a 4 de maio, segundo a Reuters. A medida apoia a expansão da MediaTek para o mercado de chips de IA e o seu avanço na tecnologia de empacotamento. Advanced

CryptoFrontier3h atrás

Doubao lança três níveis pagos de subscrição a 4 de maio, com preços a partir de 68 yuanes por mês

De acordo com a PANews, a Doubao anunciou a 4 de maio escalões pagos de subscrição para complementar o seu serviço gratuito. Os três escalões são: Standard a 68 yuan por mês (688 yuan anualmente), Enhanced a 200 yuan por mês (2.048 yuan anualmente) e Professional a 500 yuan por mês (5.088 yuan anualmente). A Doubao sa

GateNews3h atrás
Comentar
0/400
Nenhum comentário