Google Lança Chips de IA Separados para Treinamento e Inferência, Aumentando o Desempenho em 2,8x

Mensagem do Gate News, 23 de abril — A Google anunciou em 22 de abril que lançará chips separados de TPU de oitava geração para treinamento e inferência ainda este ano, substituindo seu projeto anterior combinado. A iniciativa mira cargas de trabalho de agentes de IA e oferece aos clientes da Google Cloud uma alternativa ao hardware da Nvidia.

O chip de treinamento entrega 2,8 vezes o desempenho da TPU Ironwood de sétima geração da Google pelo mesmo preço, enquanto o chip de inferência é 80% mais rápido e traz 384 MB de SRAM, o triplo da quantidade na Ironwood. A separação das capacidades de treinamento e inferência reflete uma mudança na forma como as empresas otimizam para diferentes demandas computacionais.

A iniciativa é apoiada por uma parceria de longo prazo com Broadcom e Anthropic. A Anthropic planeja usar aproximadamente 3,5 gigawatts de computação com TPU via Broadcom a partir de 2027, com a Broadcom cuidando da fabricação dos chips e dos componentes de rede até 2031. A Anthropic, a startup de IA por trás do Claude, viu sua receita anualizada recentemente ultrapassar $30 bilhões. Enquanto isso, Apple, Microsoft, Meta e Amazon também estão expandindo esforços de chips personalizados de IA para reduzir a dependência da Nvidia, que segue como líder de mercado.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

CZ diz que a YZi Labs aloca 70% para blockchain e 20% para IA na Consensus Miami 2026

De acordo com o ChainCatcher, na Consensus Miami 2026, Zhao Changpeng (CZ) afirmou que a YZi Labs destina 70% do financiamento à blockchain, 20% à IA e 10% à biotecnologia. CZ acrescentou que a BNB deve ser posicionada como uma moeda nativa para agentes de IA, e que todas as blockchains precisam estar “prontas para IA” para suportar

GateNews1h atrás

A Public adquire o app do Treasury da plataforma de investimentos em IA para expandir a negociação de criptomoedas

De acordo com a ChainCatcher, a Public anunciou a aquisição da plataforma de serviços de investimento em IA Treasury App para fortalecer seu negócio de corretagem orientado por IA. O valor da aquisição não foi divulgado. Atualmente, a Public oferece suporte à negociação de ações, títulos e criptomoedas, incluindo Bitcoin, Ethereum, a

GateNews3h atrás

Blitzy conclui rodada de financiamento $200M liderada pela Northzone

De acordo com a ChainCatcher, a Blitzy, uma empresa de programação com IA cofundada pelo ex-arquiteto da Nvidia Sid Pardeshi, concluiu uma rodada de financiamento de US$ 200 milhões liderada pela Northzone. A Battery Ventures, a Jump Capital e a Morgan Creek Digital participaram da rodada. A plataforma pode analisar sistemas complexos com

GateNews3h atrás

UE proíbe pornografia deepfake gerada por IA em 7 de maio

De acordo com a Agência de Notícias Xinhua, em 7 de maio, membros do Parlamento Europeu e estados-membros chegaram a um consenso para banir sistemas de inteligência artificial de gerar conteúdo pornográfico deepfake. A proibição será incorporada a emendas ao Ato de Inteligência Artificial de 2024. Parlamento Europeu

GateNews4h atrás

Tether lança modelo de IA médica MedPsy QVAC e atinge nota 62,62 na versão de 17 bilhões de parâmetros

De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica projetado para rodar localmente em smartphones e dispositivos vestíveis, sem depender de nuvem. A versão com 1,7 bilhão de parâmetros obteve 62,62 em sete benchmarks médicos, superando a MedGemma-1.5-4B do Google em 11,42 poi

GateNews4h atrás

A API da B.AI lança quatro novos modelos, incluindo o GPT-5,5 Instant, dentro de 48 horas após a divulgação do OpenAI

A API do B.AI lançou quatro novos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 e GLM-5.1. O GPT-5.5 Instant concluiu a adaptação subjacente e a integração da interface em 48 horas após o lançamento da OpenAI, permitindo acesso sem atraso a

GateNews4h atrás
Comentário
0/400
Sem comentários