A NVIDIA apresentou em 31 de maio de 2026, no GTC Taipei, a CPU Vera, o primeiro processador construído do zero para a era dos agentes de IA e do aprendizado por reforço. O anúncio marca uma mudança clara: a empresa, conhecida por GPUs, agora posiciona uma CPU dedicada como seu próximo grande vetor de crescimento, segundo o próprio CEO Jensen Huang. A Vera já está em produção plena e promete completar tarefas 1.8 vezes mais rápido que CPUs x86 convencionais em workloads de IA agêntica, processamento de dados e treinamento por reforço.
Arquitetura otimizada para agentes que pensam e agem
Em vez de simplesmente acelerar cálculos genéricos, a Vera foi projetada para sustentar o ciclo completo de um agente de IA: execução de código, uso de ferramentas, sandboxing, análises, pipelines de dados e orquestração. Ela traz 88 núcleos Olympus, tecnologia de multithreading espacial e subsistema de memória LPDDR5X capaz de entregar até 1.2 TB/s de largura de banda. Esses números não são apenas especificações técnicas; eles significam que os agentes conseguem responder mais rápido mesmo sob carga extrema, mantendo os GPUs alimentados sem gargalos na parte de controle e coordenação.
Quem já está adotando e o que isso muda na prática
Grandes laboratórios de IA como Anthropic, OpenAI e SpaceXAI planejam usar a Vera, assim como hyperscalers ByteDance, CoreWeave, Lambda, Nebius, Nscale e Oracle Cloud Infrastructure. Fabricantes de servidores em escala — Dell Technologies, HPE, Lenovo e Supermicro — vão produzir sistemas standalone, enquanto parceiros como ASUS, Compal, Foxconn e outros também participam. Para quem opera data centers ou treina modelos complexos, isso significa poder rodar agentes de forma mais eficiente e com menor consumo energético em comparação com soluções tradicionais.
Do Grace ao Vera: a evolução natural dos processadores NVIDIA
A Vera dá continuidade ao sucesso da linha Grace, que já ultrapassou 2.5 milhões de unidades enviadas. Enquanto o Grace trouxe eficiência e integração com GPUs, a Vera foca especificamente nas demandas dos agentes que precisam de respostas rápidas, alta coerência de memória e capacidade de orquestrar múltiplas ferramentas simultaneamente. Jensen Huang resumiu o momento: “Agentes de IA serão os maiores usuários de computação” e a Vera entrega “o maior número de instruções por ciclo do mundo”, com 10 instruções a cada ciclo de clock.
Disponibilidade e próximos passos para quem quer testar
Sistemas baseados na Vera começam a chegar a partir do outono de 2026 por meio dos parceiros de hardware e nuvem. Para profissionais e empresas que já trabalham com IA agêntica, o momento é de avaliar como essa CPU pode reduzir tempos de inferência e treinamento em cenários reais de uso intensivo. A NVIDIA também oferece documentação técnica no site oficial e atualizações constantes sobre benchmarks de desempenho em cargas de reinforcement learning e data pipelines.