Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A FIS e a Anthropic desenvolvem agentes de IA para combater a lavagem de dinheiro, com implementação no BMO e no Amalgamated Bank no 2.º semestre de 2026
A FIS e a Anthropic estão a desenvolver agentes de IA concebidos para automatizar investigações de crimes financeiros, começando pelas operações de combate à lavagem de dinheiro. O Agente de IA para Crimes Financeiros irá recolher dados de sistemas bancários, avaliar transacções face a tipologias conhecidas e ajudar os investigadores na análise de al
GateNews47m atrás
A Prime Intellect Lab lança a disponibilidade geral a 7 de Maio, concluindo mais de 10.000 execuções de treino na fase beta
De acordo com a Prime Intellect, a plataforma Lab da empresa saiu da fase beta a 7 de maio de 2026, passando para disponibilidade geral como um ambiente de treino ponta a ponta para agentes de IA autoaperfeiçoados. O pipeline unificado consolida fluxos de trabalho de melhoria de modelos, permitindo aos utilizadores definir tarefas, configurar
GateNews1h atrás
A Cloudflare despoleta 1 mil milhões de respostas HTTP 402 diárias no Consensus 2026 e lança o Agent Trust Framework com a Visa e a Experian
De acordo com a Foresight News, a gestora executiva de tecnologia (CSO) da Cloudflare, Stephanie Cohen, anunciou no Consensus 2026 que a plataforma desencadeia aproximadamente mil milhões de respostas HTTP 402 por dia, reflectindo a procura dos agentes de IA por acesso pago ao conteúdo web. A empresa, juntamente com a Visa e a Experian, apresentou o Agent Trust
GateNews3h atrás
Reid Hoffman: Os agentes de IA vão precisar de sistemas de confiança em cripto
Reid Hoffman, parceiro da Greylock e cofundador do LinkedIn, afirmou que os agentes autónomos vão precisar de sistemas de confiança baseados em cripto para transaccionar através da internet aberta, sugerindo que este desenvolvimento poderá permitir um regresso dos NFTs.
A declaração de Hoffman liga o surgimento de agentes autónomos ao
CryptoFrontier5h atrás
B.AI ultrapassa 1,7 milhão de utilizadores a 7 de maio e lança programa de recompensas
Segundo a B.AI, a plataforma de infra-estruturas de IA ultrapassou 1,7 milhões de utilizadores a 7 de maio. A plataforma, que se centra na proteção da privacidade e na infraestrutura da economia de agentes, está a oferecer aos novos utilizadores 500 mil créditos gratuitos no registo, preços sem margem em todos os modelos, e uma oferta por tempo limitado de 1:1
GateNews5h atrás
a16z lança 5.ª ronda de um fundo cripto de 2,2 mil milhões de dólares, com investimento principal em três novas empresas de IA
De acordo com o anúncio da a16z (Andreessen Horowitz) a 5 de maio, a gestora de venture capital lançou oficialmente o quinto fundo exclusivo de criptomoedas, «Crypto Fund 5», com um montante de angariação de 2,2 mil milhões de dólares. Em simultâneo, a a16z anunciou a liderança do investimento em empresas de integração de IA, Tessera Labs, na plataforma de recrutamento de IA Ethos e na plataforma de criação de IA Glif.
MarketWhisper6h atrás