Oracle e AMD Anunciam Supercluster de IA com 50.000 GPUs de Próxima Geração

A Oracle e a AMD anunciaram uma expansão monumental em sua colaboração, com um plano para lançar o primeiro supercluster de IA publicamente acessível equipado com 50.000 GPUs da série AMD Instinct MI450. Com início previsto para o terceiro trimestre de 2026, a iniciativa visa atender à crescente e quase insaciável demanda por capacidade de computação para treinar e executar os modelos de inteligência artificial da próxima geração. A parceria, detalhada em um comunicado oficial da Oracle em 14 de outubro de 2025, posiciona a Oracle Cloud Infrastructure (OCI) como a primeira plataforma de nuvem a oferecer essa arquitetura de ponta, solidificando a aliança entre as duas gigantes da tecnologia na corrida pela supremacia em IA.

Desmontando o "Helios": A Arquitetura por Trás do Supercluster

O cerne desta nova infraestrutura é o design de rack "Helios" da AMD, uma arquitetura de escala de rack otimizada verticalmente. Se a premissa é construir um sistema para IA em escala massiva, então a solução não pode ser apenas um amontoado de GPUs. A lógica exige uma integração coesa de hardware. De acordo com os anúncios, cada rack Helios, refrigerado a líquido, abrigará 72 GPUs AMD Instinct MI450, as estrelas do show. Mas elas não estarão sozinhas.

Para sustentar o processamento, os racks contarão com a próxima geração de CPUs AMD EPYC, codinome "Venice", atuando como nós principais para orquestrar as tarefas e acelerar o processamento de dados. A conectividade, um componente vital para evitar gargalos, ficará a cargo da tecnologia de rede avançada AMD Pensando, com o codinome "Vulcano". Segundo a Oracle, cada GPU poderá ser equipada com até três NICs de IA "Vulcano" de 800 Gbps, garantindo uma comunicação de altíssima velocidade e baixa latência entre os nós. A estrutura é projetada para máxima performance, escalabilidade e, um ponto cada vez mais relevante, eficiência energética.

A Matemática do Poder: 50.000 GPUs em Números

Os números apresentados são, para dizer o mínimo, impressionantes. A implantação inicial de 50.000 GPUs se traduz em aproximadamente 700 racks "Helios", conforme a matemática divulgada por publicações como The Next Platform. A AMD projeta que um único rack Helios pode entregar até 2.9 exaFLOPS de performance em precisão FP4. Extrapolando, a capacidade total inicial do supercluster da Oracle ultrapassará a barreira dos 2 zettaFLOPS. É uma quantidade de poder computacional que, até poucos anos, pertencia ao reino da ficção científica.

A análise forense do hardware revela mais detalhes. Cada GPU AMD Instinct MI450, com o apelido "Altair" segundo o The Next Platform, virá equipada com até 432 GB de memória HBM4, oferecendo uma largura de banda de 20 TB/s. Isso permite, segundo a AMD, que modelos 50% maiores que os da geração anterior sejam treinados e executados inteiramente na memória, reduzindo a necessidade de particionamento complexo. Mahesh Thiagarajan, vice-presidente executivo da Oracle Cloud Infrastructure, afirmou que "nossos clientes estão construindo algumas das aplicações de IA mais ambiciosas do mundo, e isso requer uma infraestrutura robusta, escalável e de alto desempenho". A declaração é factual, mas o teste de veracidade ocorrerá apenas em 2026.

A Conexão Aberta: UALink e a Batalha dos Padrões

Um dos pontos mais estratégicos do anúncio é a aposta em padrões abertos para a interconexão. Se um ecossistema de hardware quer competir com um líder de mercado consolidado como a Nvidia, então oferecer uma alternativa aberta ao seu jardim murado é uma tática lógica. A AMD e seus parceiros estão promovendo o UALink (Ultra Accelerator Link), um padrão de interconexão de alta velocidade projetado para aceleradores de IA, que será transportado sobre Ethernet (UALoE).

Essa abordagem permite a comunicação direta e coerente entre as GPUs dentro de um rack, compartilhando memória e minimizando a latência sem precisar passar pelas CPUs. A adesão a padrões alinhados ao Ultra Ethernet Consortium (UEC) sinaliza um movimento para criar um ecossistema mais flexível e interoperável. Senão, o mercado continuaria dependente de soluções proprietárias como o NVLink da Nvidia. Para Forrest Norrod, vice-presidente executivo da AMD, essa colaboração acelera a IA "com sistemas abertos, otimizados e seguros construídos para data centers de IA massivos".

O Fator OpenAI e a Guerra dos Gigawatts

Nenhuma análise deste anúncio estaria completa sem mencionar o provável principal inquilino deste novo supercluster: a OpenAI. A Oracle já é a maior parceira de infraestrutura da criadora do ChatGPT. Adicionalmente, conforme noticiado pelo The Register, a AMD possui um acordo que pode conceder à OpenAI milhões de ações se a fabricante de chips facilitar a implantação de seis gigawatts de seus aceleradores Instinct.

O cluster de 50.000 GPUs na OCI, que, segundo as fontes, consumirá cerca de 200 megawatts, parece ser o primeiro passo verificável para cumprir essa promessa. Essa aliança tripartite – Oracle, AMD e OpenAI – cria um contrapeso significativo no mercado. A Oracle não apenas diversifica seu portfólio de hardware de IA, que também inclui um cluster massivo de 800.000 GPUs Nvidia Blackwell, mas também se posiciona como a principal fornecedora de nuvem para a empresa mais proeminente no campo da IA generativa.

Em conclusão, a expansão da parceria entre Oracle e AMD é um evento de consequências profundas para o mercado de infraestrutura de IA. A promessa de 50.000 GPUs de última geração em uma arquitetura aberta e escalável é uma declaração de intenções poderosa da AMD em sua disputa com a Nvidia. Para a Oracle, é a materialização de sua estratégia agressiva para se tornar uma potência em nuvem para IA. O veredito, no entanto, será emitido a partir do terceiro trimestre de 2026, quando as promessas de hoje serão confrontadas com a realidade da execução e da demanda do mercado. A proposição é clara; sua validação, aguarda.