Mensagem do Gate News, 23 de abril — A equipa de investigação da Perplexity publicou um artigo técnico que detalha a sua metodologia de pós-treinamento para agentes de pesquisa na web. A abordagem utiliza dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e recorre a um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer obediência a instruções e consistência linguística, seguido de aprendizagem por reforço online (RL) para otimizar a precisão da pesquisa e a eficiência no uso de ferramentas.
A fase de RL utiliza o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de queries iniciais internas que exigem 2–4 hops de raciocínio com verificação por múltiplos solucionadores, e dados conversacionais gerais baseados em rubricas que convertem requisitos de implementação em condições atómicas objetivamente verificáveis para evitar a degradação do comportamento do SFT.
O desenho de recompensas emprega agregação com gating — as pontuações de preferência só contribuem quando a correcção de base é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica são satisfeitos), impedindo que sinais de preferência elevados mascarem erros factuais. As penalizações de eficiência utilizam ancoragem dentro do grupo, aplicando penalizações suaves às chamadas de ferramentas e ao comprimento da geração que excede a base de respostas correctas no mesmo grupo.
A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho de referência em benchmarks de pesquisa. No FRAMES, alcança 57,3% de precisão com uma única chamada de ferramenta, superando o GPT-5.4 em 5,7 pontos percentuais e o Claude Sonnet 4.6 em 4,7 pontos percentuais. Sob um orçamento moderado (quatro chamadas de ferramentas), atinge 73,9% de precisão a $0,02 por consulta, em comparação com 67,8% de precisão do GPT-5.4 a $0,085 por consulta e 62,4% de precisão do Sonnet 4.6 a $0,153 por consulta. Os valores de custo baseiam-se na tarifação pública por API de cada fornecedor e excluem optimizações de caching.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
O projecto de IA da comunidade WLFI, WorldClaw, lançou um sistema operativo de agentes; sem revelar a marca, ainda consegue vender por 10 mil dólares?
A família Trump volta a atacar com uma nova estratégia do projecto cripto World Liberty Financial (WLFI), em parceria com a WorldClaw, lançando o modelo de IA com um ponto de entrada unificado WorldRouter. O foco está numa plataforma de agentes que integra 300 modelos de IA, com o plano de subscrição mais caro a custar quase 10 mil dólares, mas o que é oferecido em bónus é um dispositivo de hardware “com marca e sistema operativo não divulgados”, o que tem gerado dúvidas.
@WorldClawAI está a expandir o acesso à IA e $WLFI desempenha um papel-chave no ecossistema. Os utilizadores podem aceder a 300+ modelos com o WorldRouter, e os agentes podem
ChainNewsAbmedia2h atrás
A Meta está a desenvolver um assistente de IA chamado Hatch, em concorrência com a OpenClaw, com conclusão do teste interno até ao final de junho
De acordo com o Financial Times, a 5 de Maio, a Meta está a desenvolver um assistente de IA (Hatch) para o utilizador comum, inspirado no OpenClaw da OpenAI, com o objetivo de concluir testes internos até ao final de Junho; a Meta planeia, ao mesmo tempo, integrar uma ferramenta autónoma de compras baseada em agentes no serviço Instagram até ao quarto trimestre deste ano.
MarketWhisper3h atrás
Cloudflare: O tráfego não humano é agora a maioria, endereços da x402 Foundation na economia da Web
O Chief Strategy Officer da Cloudflare afirmou que mais de metade do tráfego da Internet já não é de origem humana, destacando uma mudança nos padrões de utilização da web impulsionada por agentes de IA. A empresa aponta para a x402 Foundation como uma iniciativa-chave para construir infraestruturas que suportem uma economia sustentável de conteúdos digitais
CryptoFrontier4h atrás
Empresas indianas de cibersegurança usam IA para reduzir os testes de vulnerabilidades para horas
Empresas indianas de cibersegurança, incluindo Indusface e Astra Security, estão a adoptar agentes de IA construídos sobre grandes modelos de linguagem para acelerar os testes de vulnerabilidades de software, reduzindo-os de dias ou semanas para horas, segundo o The Economic Times. A mudança reflecte a crescente velocidade dos atacantes e a capacidade emergente das ferramentas de IA
CryptoFrontier4h atrás
HINT (Hive Intelligence) dispara 60,25% nas últimas 24 horas
Notícia da Gate News, 6 de maio, segundo a informação do mercado da Gate, até ao momento da redação, o HINT (Hive Intelligence) está a cotar a 0,001695 dólares, tendo subido 60,25% nas últimas 24 horas. O preço atingiu um máximo de 0,0019 dólares e recuou para um mínimo de 0,0010577 dólares, com um volume de transações nas últimas 24 horas de 10,01 mil dólares. A atual capitalização de mercado ronda os 78,14 mil dólares.
Hive Intelligence é a camada de infraestruturas base para agentes de IA, fornecendo uma interface de aplicação unificada para dados de blockchain em tempo real. Elimina a fragmentação dos dados, permitindo que os agentes de IA consultem e interajam na cadeia sem esforço. Como infraestrutura de mercado cripto de nível institucional, a Hive Intelligence disponibiliza, através de endpoints MCP, REST A
GateNews4h atrás
A Anthropic lança 10 agentes de IA financeiros, integrados com o Microsoft 365 para tratar facilmente tarefas de gestão financeira
A Anthropic lançou 10 modelos de agentes de IA financeiros, integrando parceiros de dados como o Microsoft 365, a Moody’s e a D&B, e que podem ser usados como plugins ou com agendamento automático. Os modelos dividem-se em duas categorias: pesquisa/apoio ao cliente e operações financeiras, abrangendo investimentos, modelos financeiros, KYC, entre outros, e incluem também ratings da Moody’s. O Claude Opus 4.7 ficou em primeiro lugar no benchmark de agentes financeiros, indicando que os talentos do setor financeiro e o panorama regulatório serão afetados.
ChainNewsAbmedia4h atrás