Empresa avalia chips de IA personalizados com a virada do mercado para inferência e a expansão do segmento de ASIC até US$ 118 bilhões em 2033
O Google está em conversas com a Marvell Technology para criar dois novos chips voltados a tarefas de inteligência artificial, segundo o The Information. A proposta inclui uma MPU (memory processing unit), pensada para operar em conjunto com as TPUs (Tensor Processing Units) já existentes, além de uma nova TPU ajustada especificamente para inferência - a fase em que os modelos de IA respondem às solicitações dos utilizadores, em vez de serem treinados.
De acordo com as fontes, a Marvell Technology entraria como parceira de design, num formato semelhante ao que o Google adotou com a MediaTek nas versões mais recentes de TPU. Ainda assim, não há contrato assinado: o entendimento permanece em negociação.
Essas tratativas acontecem pouco depois de a Broadcom - principal parceira do Google em chips personalizados - ter assegurado um acordo de longo prazo para fornecer TPUs e componentes de rede até 2031. Isso sugere menos uma troca de fornecedores e mais o alargamento da cadeia de suprimentos: a Broadcom mantém o foco em soluções de alto desempenho, a MediaTek atende versões mais baratas e otimizadas, e a TSMC fica responsável pela fabricação.
O movimento do Google acompanha uma mudança mais ampla de prioridades no setor de chips de IA, com a inferência a ganhar protagonismo como principal fonte de custos computacionais. Ao contrário do treino de modelos, que ocorre de forma pontual e exige picos temporários de capacidade, a inferência funciona continuamente e cresce à medida que aumenta a procura dos utilizadores.
O Google já revelou a TPU de nova geração Ironwood, descrita pela empresa como “o primeiro TPU para a era da inferência”. Segundo a companhia, o chip entrega um aumento de dez vezes no desempenho de pico em relação à TPU v5p e pode escalar para 9 216 chips numa única configuração, com consumo energético em torno de 10 megawatts.
Nesse desenho, a Marvell Technology pode ocupar um espaço complementar - tanto em termos de custo quanto de perfil de cargas. A ideia é segmentar o processamento dentro de um mesmo ecossistema, ajustando diferentes tipos de chips para diferentes cenários de uso.
Em paralelo, o mercado de chips personalizados segue num ritmo acelerado. As projeções indicam crescimento de 45% em 2026 e um volume de US$ 118 bilhões até 2033, superando a velocidade de expansão do segmento de GPUs. O motor principal desse avanço passa a ser, sobretudo, a inferência, e não o treino de modelos.
Até ao momento, não existe acordo final com a Marvell Technology e, mesmo que venha a ser fechado, os novos chips só devem chegar após alguns anos. Ainda assim, a direção está traçada: o Google está a montar uma infraestrutura diversificada para computação de próxima geração, com a inferência como carga central e com a cadeia de fornecedores a tornar-se um elemento crítico da estratégia.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário