Noticiário da Gate, 23 de abril — A equipe de pesquisa da Perplexity publicou um artigo técnico detalhando sua metodologia de pós-treinamento para agentes de busca na web. A abordagem usa dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e emprega um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer aderência a instruções e consistência de linguagem, seguido de aprendizado por reforço online (RL) para otimizar a acurácia da busca e a eficiência do uso de ferramentas.
A fase de RL aproveita o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de consultas iniciais internas que exigem 2–4 saltos de raciocínio com verificação por múltiplos resolvedores, e dados gerais de conversação baseados em rubricas que convertem requisitos de implantação em condições atômicas objetivamente verificáveis para evitar degradação do comportamento do SFT.
O desenho de recompensa emprega agregação filtrada — as pontuações de preferência só contribuem quando a correção do baseline é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica forem atendidos), impedindo que sinais de alta preferência mascarem erros factuais. As penalidades de eficiência usam ancoragem dentro do grupo, aplicando penalidades suaves às chamadas de ferramenta e ao comprimento de geração que excede o baseline de respostas corretas no mesmo grupo.
A avaliação mostra que o Qwen3.5-397B-SFT-RL alcança desempenho de nível superior em benchmarks de busca. Em FRAMES, atinge 57,3% de acurácia com uma única chamada de ferramenta, superando GPT-5.4 em 5,7 pontos percentuais e Claude Sonnet 4.6 em 4,7 pontos percentuais. Com orçamento moderado (quatro chamadas de ferramentas), obtém 73,9% de acurácia a US$ 0,02 por consulta, em comparação com 67,8% de acurácia do GPT-5.4 a US$ 0,085 por consulta e 62,4% de acurácia do Sonnet 4.6 a US$ 0,153 por consulta. Os valores de custo são baseados na precificação pública de API de cada provedor e excluem otimizações de caching.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Fundador da Cardano: Agentes de IA vão superar a atividade da Internet humana até 2035, desestabilizando modelos baseados em anúncios
De acordo com a CoinDesk, o fundador da Cardano, Charles Hoskinson, previu na conferência Consensus em 7 de maio que agentes de IA vão superar a atividade humana em buscas na internet, no comércio e em transações até 2035. Como agentes de IA não clicam em anúncios nem demonstram preferências de marca, Hoskinson disse isso w
GateNews1h atrás
Líder do Claude Code, Boris: agentes de IA aumentam a produtividade humana e reescrevem a história do desenvolvimento de software
O responsável da Claude Code, Boris Cherny, afirmou em entrevista à CNBC que ferramentas de agentes de IA como o Co-Work podem delegar tarefas tediosas ao processamento por IA, fazendo com que engenheiros deixem de operar e passem a orientar, além de permitir acionar vários agentes para tratar depuração ao mesmo tempo, elevando significativamente a produtividade. As empresas precisam reorganizar processos tendo a IA como núcleo; a IA tem mostrado valor em todas as áreas e, no desenvolvimento de software, a atividade sairá de escrever códigos para se tornar uma colaboração guiada por lógica e conversas, com redução das barreiras técnicas e surgimento de um crescimento explosivo em inovação e startups.
ChainNewsAbmedia2h atrás
Reid Hoffman: NFTs podem voltar à medida que os agentes de IA precisam de confiança cripto
Reid Hoffman, sócio da Greylock e cofundador do LinkedIn, disse que agentes autônomos precisarão de sistemas de confiança baseados em cripto para fazer transações pela internet aberta, sugerindo que NFTs podem voltar a ter força, de acordo com sua declaração.
Agentes de IA e infraestrutura de confiança
As observações de Hoffman apontam para um possível
CryptoFrontier3h atrás
IBM amplia sua suíte de IA corporativa com novas ferramentas baseadas em agentes na Think 2026
Segundo a IBM, a empresa anunciou uma expansão de suas capacidades de IA corporativa na conferência Think 2026, em Boston, lançando novas ferramentas baseadas em agentes para ajudar organizações a incorporar inteligência artificial nas operações do dia a dia. O Context Studio, agora disponível de forma geral, permite que empresas
GateNews4h atrás
Sonhos do Claude, da Anthropic: agente se organiza para recuperar memórias entre tarefas, eliminando duplicidades e contradições
A Anthropic anunciou o Dreams no evento Code with Claude, permitindo que os Claude Managed Agents organizem automaticamente memórias entre várias conversas, eliminem duplicidades e contradições, atualizem itens desatualizados e gerem um banco de memórias pós-processado e auditável; o limite de entrada é de 100 sessions e 4.096 caracteres, com execução assíncrona, concluída em minutos a dezenas de minutos, e suporte à observação via streaming. A prévia da pesquisa precisa ser solicitada; por enquanto, apenas o claude-opus-4-7 e o claude-sonnet-4-6 são suportados, e o lançamento oficial ainda não tem data.
ChainNewsAbmedia8h atrás
A Cloudflare colabora com a Stripe para desenvolver agentes com negociação autônoma: a IA pode criar contas, comprar domínios e implantar aplicativos
A Cloudflare e a Stripe lançaram em 30 de abril um novo protocolo em conjunto, permitindo que agentes de IA criem, de forma autônoma e sem intervenção humana, uma conta na Cloudflare, assinem planos pagos, registrem domínios, obtenham um token de API e implantem diretamente aplicações. O blog oficial da Cloudflare explica que todo o processo, do começo ao fim, não requer que humanos acessem o painel, façam copiar e colar de tokens ou insiram dados do cartão de crédito; os usuários só precisam conceder permissões iniciais e aceitar os termos de uso da Cloudflare. Esta semana, a notícia deste anúncio recebeu 548 pontos no Hacker News, tornando-se uma das matérias-base mais emblemáticas sobre infraestrutura para que agentes de IA executem tarefas de maneira independente.
Estrutura em três camadas do protocolo: descoberta de serviços, autorização de identidade e pagamento por meio de tokenização
Cloudflare-Stripe
ChainNewsAbmedia8h atrás