Financial Times; Nas três semanas desde que a Nvidia chocou o mundo da tecnologia com sua previsão de um salto sem precedentes nas vendas, Wall Street está buscando outras empresas de chips que possam se beneficiar do último sucesso da inteligência artificial. Mas, à medida que a busca avança, o abismo que se abriu entre a Nvidia e o restante da indústria de chips só aumentou.
Numa das tentativas mais esperadas de alcançar a Nvidia, a rival AMD exibiu um novo chip de IA nesta semana chamado MI300X. O chip inclui uma GPU –sigla em inglês para Unidade de Processamento de Gráficos, produto originalmente projetado para videogames que está no âmago do sucesso da Nvidia–, bem como uma CPU [Unidade Central de Processamento] de uso mais geral e memória integrada para fornecer dados a ambos os processadores.
O design reflete as tentativas dos fabricantes de chips de agrupar diferentes tecnologias na busca pela maneira mais eficiente de processar os grandes volumes de dados necessários para treinar e aplicar os grandes modelos usados na IA generativa.
A AMD reivindicou um desempenho impressionante para seu novo chip, que, segundo ela, superaria o H100, carro-chefe da Nvidia, em várias medições. Mas não conseguiu apontar nenhum cliente em potencial que estaria considerando o chip, e apenas destacou a capacidade do produto de lidar com a inferência de IA –aplicando modelos de IA pré-treinados–, em vez do trabalho mais intenso de treinamento, que explica o aumento nas vendas da Nvidia. Ela também disse que não começará a aumentar a produção do novo chip até o último trimestre deste ano.
Quando o novo chip da AMD estiver disponível, no primeiro semestre de 2024, o H100 da Nvidia estará no mercado há 18 meses, dando-lhe uma grande vantagem, disse Stacy Rasgon, analista da Bernstein. A AMD está “muito atrás. Eles podem ficar com o bagaço [do mercado de IA] –embora talvez até isso seja suficiente” para justificar o recente entusiasmo de Wall Street pelas ações da empresa, disse ele.
“A Nvidia está livre e limpa nesta rodada” das guerras de chips que eclodiram em torno da IA, acrescentou Patrick Moorhead, analista da Moor Insights & Strategy.
Wall Street destacou várias empresas de chips que poderiam obter um impulso da IA generativa. O valor de mercado de ações combinado da AMD, Broadcom e Marvell saltou US$ 99 bilhões, ou 20%, nos dois dias seguintes à impressionante previsão de vendas da Nvidia no mês passado. Mas não se espera que suas vendas relacionadas à IA venham do mercado dominado pela Nvidia.
A Broadcom, por exemplo, deve se beneficiar da crescente demanda por seus produtos de comunicação de dados, bem como de seu trabalho com o Google no desenvolvimento de um chip interno de data center, conhecido como TPU [Unidade de Processamento Tensor]. No início deste mês, a Broadcom previu que os negócios relacionados à IA representariam cerca de 25% de sua receita em 2024, contra apenas 10% no ano passado.
No entanto, os processadores usados para treinar e aplicar grandes modelos de IA estão obtendo o maior aumento de demanda e gerando mais entusiasmo no mercado de ações. Enquanto o novo chip da AMD decepcionou Wall Street, o valor de mercado da Nvidia voltou a subir para mais de US$ 1 trilhão, nível que atingiu pela primeira vez há duas semanas.
“Não há dúvida de que a IA será o principal motor do consumo de silício no futuro previsível”, com os data centers sendo o foco principal do investimento, disse a presidente-executiva da AMD, Lisa Su. Ela previu que o mercado de aceleradores de IA –GPUs e outros chips especializados, projetados para acelerar o processamento intensivo de dados necessário para treinar ou executar– subiria de US$ 30 bilhões (R$ 144,6 bi) neste ano para mais de US$ 150 bilhões (R$ 723 bi) em 2027.
Enquanto lutam para competir com a Nvidia nos chips de IA mais avançados, empresas como AMD e Intel contam com uma evolução no mercado de IA generativa para aumentar a demanda por outros tipos de processadores. Modelos de grande escala, como o GPT-4 da OpenAI, dominaram as etapas iniciais da tecnologia, mas uma recente explosão no uso de modelos menores e mais especializados poderá levar a um aumento nas vendas de chips menos potentes, afirmam.
Muitos clientes que desejam treinar modelos com seus dados corporativos também desejam manter suas informações perto de casa, em vez de se arriscar a entregá-las a empresas que fornecem grandes modelos de IA, disse Kavitha Prasad, vice-presidente da Intel. Juntamente com todo o trabalho de computação necessário para preparar os dados para alimentar o treinamento, isso criará muito trabalho para as CPUs e aceleradores de IA fabricados pela Intel, disse ela.
No entanto, a rápida mudança de demandas nos data centers, causada pelo aumento de serviços como o ChatGPT, deixaram os fabricantes de chips em dificuldade para prever como seus mercados evoluirão. As vendas de CPUs podem até cair nos próximos anos, à medida que os clientes de data centers investirem em aceleradores de IA, disse Rasgon.
Os rivais que esperam dar uma mordida no crescente negócio de IA da Nvidia enfrentam um desafio igualmente grande quando se trata de software. O uso generalizado dos chips da Nvidia em IA e outras aplicações deve muito à facilidade com que suas GPUs, originalmente projetadas para videogames, podem ser programadas para outras tarefas usando seu software Cuda.
Na tentativa de atrair mais desenvolvedores para seus chips de IA, a AMD destacou nesta semana seus esforços para trabalhar com o PyTorch, uma estrutura de IA amplamente usada. No entanto, ainda há um longo caminho a percorrer para igualar as muitas bibliotecas de softwares e aplicativos que já foram desenvolvidos para o Cuda, disse Rasgon. “Levará uma década” para que os rivais consigam igualar o software da Nvidia –período em que a empresa continuará agindo rapidamente para aumentar sua liderança, disse ele.
“Ninguém quer um setor em que um participante predomine”, disse Moorhead. Mas, por enquanto, o mercado em expansão de chips capazes de lidar com IA generativa pertence à Nvidia.