Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A Prime Intellect Lab lança disponibilidade geral em 7 de maio e conclui mais de 10.000 execuções de treinamento na versão beta
De acordo com a Prime Intellect, a plataforma Lab da empresa saiu da fase beta em 7 de maio de 2026, passando para disponibilidade geral como um ambiente de treinamento ponta a ponta para agentes de IA autoaprimoráveis. O pipeline unificado consolida fluxos de trabalho de melhoria de modelos, permitindo que os usuários definam tarefas, configurem
GateNews16m atrás
A Cloudflare dispara 1 bilhão de respostas HTTP 402 por dia no Consensus 2026 e lança o Framework de Confiança de Agentes com a Visa e a Experian
De acordo com a Foresight News, a diretora de tecnologia (CSO) da Cloudflare, Stephanie Cohen, anunciou na Consensus 2026 que a plataforma gera aproximadamente 1 bilhão de respostas HTTP 402 por dia, refletindo a demanda dos agentes de IA por acesso pago ao conteúdo da web. A empresa, junto com Visa e Experian, apresentou o Agent Trust
GateNews2h atrás
Reid Hoffman: agentes de IA precisarão de sistemas de confiança em criptomoedas
Reid Hoffman, sócio da Greylock e cofundador do LinkedIn, afirmou que agentes autônomos precisarão de sistemas de confiança baseados em cripto para transacionar pela internet aberta, sugerindo que esse desenvolvimento pode permitir um retorno para os NFTs.
A declaração de Hoffman conecta o surgimento de agentes autônomos ao
CryptoFrontier4h atrás
B.AI ultrapassa 1,7 milhão de usuários em 7 de maio e lança programa de recompensas
De acordo com a B.AI, a plataforma de infraestrutura de IA ultrapassou 1,7 milhão de usuários em 7 de maio. A plataforma, que se concentra em proteção de privacidade e infraestrutura de economia de agentes, está oferecendo aos novos usuários 500 mil créditos gratuitos ao se cadastrar, preços sem markup em todos os modelos e uma promoção por tempo limitado de 1:1
GateNews4h atrás
a16z lança fundo de criptomoedas de US$ 2,2 bilhões na 5ª rodada, liderando o investimento em três startups de IA
De acordo com o anúncio da a16z (Andreessen Horowitz) em 5 de maio, a gestora de venture capital lançou oficialmente o quinto fundo exclusivo de criptomoedas, “Crypto Fund 5”, com um montante de captação de US$ 2,2 bilhões. Na mesma ocasião, a a16z anunciou que liderou os aportes nas empresas de integração de IA Tessera Labs, na plataforma de contratação de IA Ethos e na plataforma de criação de IA Glif.
MarketWhisper5h atrás
Fundador da Cardano: Agentes de IA vão superar a atividade da Internet humana até 2035, desestabilizando modelos baseados em anúncios
De acordo com a CoinDesk, o fundador da Cardano, Charles Hoskinson, previu na conferência Consensus em 7 de maio que agentes de IA vão superar a atividade humana em buscas na internet, no comércio e em transações até 2035. Como agentes de IA não clicam em anúncios nem demonstram preferências de marca, Hoskinson disse isso w
GateNews8h atrás