Google Lança Chips de IA Separados para Treino e Inferência, Aumentando o Desempenho 2,8x

Mensagem de Gate News, 23 de abril — A Google anunciou a 22 de abril que vai lançar, mais tarde este ano, chips TPU de 8.ª geração separados para treino e inferência, substituindo o seu design anterior combinado. A medida visa cargas de trabalho de agentes de IA e oferece aos clientes do Google Cloud uma alternativa ao hardware da Nvidia.

O chip de treino oferece 2,8 vezes o desempenho do TPU Ironwood de 7.ª geração da Google ao mesmo preço, enquanto o chip de inferência é 80% mais rápido e inclui 384 MB de SRAM, o triplo da quantidade no Ironwood. A separação das capacidades de treino e inferência reflecte uma mudança na forma como as empresas optimizam para diferentes exigências computacionais.

A iniciativa é apoiada por uma parceria de longo prazo com a Broadcom e a Anthropic. A Anthropic planeia usar cerca de 3,5 gigawatts de computação com TPU através da Broadcom a partir de 2027, com a Broadcom a assumir a fabricação dos chips e componentes de rede até 2031. A Anthropic, a startup de IA por detrás do Claude, tem visto recentemente as receitas anualizadas ultrapassar $30 mil milhões. Entretanto, a Apple, a Microsoft, a Meta e a Amazon também estão a expandir os seus esforços de chips de IA personalizados para reduzir a dependência da Nvidia, que continua a ser a líder de mercado.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

CZ diz que a YZi Labs aloca 70% para a blockchain e 20% para a IA no Consensus Miami 2026

De acordo com a ChainCatcher, na Consensus Miami 2026, Zhao Changpeng (CZ) afirmou que a YZi Labs atribui 70% do financiamento a blockchain, 20% a IA e 10% a biotecnologia. CZ acrescentou que a BNB deve ser posicionada como uma moeda nativa para agentes de IA, e que todas as blockchains precisam de estar “prontas para IA” para suportar

GateNews3h atrás

A Public adquire a plataforma de investimento em IA Treasury App para expandir o trading de cripto

De acordo com a ChainCatcher, a Public anunciou a aquisição da plataforma de serviços de investimento em IA Treasury App para reforçar o seu negócio de corretagem orientado por IA. O montante da aquisição não foi divulgado. Atualmente, a Public apoia a negociação de ações, obrigações e criptomoedas, incluindo Bitcoin, Ethereum, a

GateNews4h atrás

A Blitzy concluiu $200M ronda de financiamento liderada pela Northzone

De acordo com a ChainCatcher, a Blitzy, uma empresa de codificação com IA cofundada pelo antigo arquitecto da Nvidia Sid Pardeshi, concluiu uma ronda de financiamento de 200 milhões de dólares liderada pela Northzone. Battery Ventures, Jump Capital e Morgan Creek Digital participaram na ronda. A plataforma consegue analisar sistemas complexos com

GateNews5h atrás

A UE proíbe pornografia deepfake gerada por IA a 7 de maio

De acordo com a agência noticiosa Xinhua, a 7 de maio, os membros do Parlamento Europeu e os Estados-Membros chegaram a um consenso para proibir os sistemas de inteligência artificial de gerarem conteúdos pornográficos deepfake. A proibição será incorporada em alterações ao Regulamento de Inteligência Artificial de 2024. Parlamento Europeu

GateNews6h atrás

A Tether lança o modelo de IA médica MedPsy QVAC, atingindo uma pontuação de 62,62 na versão com 17 mil milhões de parâmetros

De acordo com a Odaily, o Tether AI Research Group lançou o QVAC MedPsy, um modelo de IA médica concebido para funcionar localmente em smartphones e dispositivos vestíveis, sem dependência de nuvem. A versão com 1,7 mil milhões de parâmetros obteve 62,62 em sete benchmarks médicos, superando o MedGemma-1.5-4B da Google em 11,42 poi

GateNews6h atrás

A API da B.AI lança quatro novos modelos, incluindo o GPT-5.5 Instant, no espaço de 48 horas após o lançamento da OpenAI

A API da B.AI lançou quatro novos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 e GLM-5.1. O GPT-5.5 Instant concluiu a adaptação subjacente e a integração da interface no prazo de 48 horas após o lançamento da OpenAI, permitindo acesso sem atraso a

GateNews6h atrás
Comentar
0/400
Nenhum comentário