A IBM acaba de jogar uma nova peça no tabuleiro da inteligência artificial, e ela não é para o seu desktop. A gigante da tecnologia anunciou o IBM Spyre Accelerator, um chip acelerador de IA projetado com uma missão bem específica: levar o poder da IA generativa para dentro de seus sistemas mais parrudos, os mainframes IBM Z, LinuxONE e servidores Power. O lançamento oficial está marcado para 28 de outubro, prometendo resolver um dilema que tira o sono de muitos CIOs: como usar a magia dos modelos de linguagem sem expor seus dados mais sensíveis na nuvem.
Em um mundo onde a corrida da IA parece acontecer majoritariamente em data centers de hiperescala, a IBM aposta em uma lógica diferente. A premissa é simples: se as empresas guardam suas informações mais valiosas — transações financeiras, dados de clientes, registros de saúde — em mainframes conhecidos por sua segurança e resiliência, por que forçá-las a mover esses dados para treinar ou consultar um modelo de IA? A resposta da IBM é: não force. Leve a IA até os dados. E o Spyre é o veículo para isso.
O que é esse tal de Spyre? (E por que ele importa?)
Vamos dissecar a promessa. Se uma empresa possui dados de missão crítica em um mainframe, e essa empresa quer usar IA generativa para, digamos, automatizar o atendimento ao cliente ou analisar relatórios complexos, então ela enfrenta um risco. Enviar esses dados para uma API na nuvem pode violar regulações de privacidade e criar brechas de segurança. A alternativa, até agora, era ficar de fora da festa da IA. O Spyre entra como uma terceira via.
Segundo o comunicado oficial da IBM, o Spyre Accelerator é um sistema-em-um-chip (SoC) com especificações robustas, fruto do trabalho do IBM Research AI Hardware Center desde 2019. Vamos aos números:
- Tecnologia: Produzido em um processo de 5 nanômetros.
- Transistores: Contém 25,6 bilhões de transistores.
- Cores: Possui 32 núcleos de aceleração individuais, otimizados para IA.
- Formato: É montado em uma placa PCIe de 75 watts, o que facilita sua instalação e escalabilidade.
Essa arquitetura permite que múltiplos chips sejam agrupados. Um sistema IBM Z ou LinuxONE pode abrigar até 48 placas Spyre, enquanto um servidor Power pode receber até 16. Na prática, isso significa que um mainframe pode ser equipado com um poder de processamento de IA considerável, capaz de executar modelos de linguagem de baixa latência diretamente no mesmo ambiente onde as transações principais da empresa acontecem.
On-premise é o novo hype? A aposta na segurança
A estratégia da IBM é um endosso claro à computação on-premise, especialmente para cargas de trabalho de IA. A empresa está apostando que, para o setor corporativo, a soberania e a segurança dos dados são inegociáveis. Um líder de infraestrutura de um grande banco europeu, citado pela IBM, reforçou essa visão: “On-prem com Spyre Accelerator para IBM Z é importante para nós porque este trabalho estará relacionado ao código de produção. Não queremos que as cargas de trabalho de produção saiam de nossas mãos, então é nossa opção favorita.”
Essa percepção não é isolada. De acordo com um estudo de 2024 do Institute for Business Value e da Oxford Economics, 61% dos executivos consideram a IA generativa um elemento fundamental para os esforços de modernização de aplicações em mainframes. A IBM está, portanto, respondendo a uma demanda latente do mercado: modernizar sem comprometer a segurança que tornou o mainframe um pilar da computação corporativa por décadas.
Spyre + Telum II: A Dupla Dinâmica da IBM
É importante entender que o Spyre não chega para trabalhar sozinho. Ele forma uma parceria estratégica com o processador Telum II, a segunda geração do chip com acelerador de IA on-chip da IBM, já presente nos sistemas IBM z17. Aqui, a lógica de Gabriela P. Torres se aplica bem: pense no Telum II como o cérebro analítico e rápido, focado em IA preditiva. Ele é projetado para inferências de altíssima velocidade e baixa latência, ideal para tarefas como detecção de fraude em tempo real, onde uma resposta binária (sim/não, fraude/não fraude) é necessária instantaneamente. A IBM afirma que o sistema z17 já processa até 450 bilhões de operações de inferência por dia com o Telum.
O Spyre, por outro lado, é o cérebro criativo e contextual, focado em IA generativa. Ele foi construído para lidar com a complexidade dos grandes modelos de linguagem (LLMs), permitindo casos de uso como assistentes virtuais (o watsonx Assistant for Z é um exemplo), geração de código, ou a análise e interpretação de milhões de documentos. Em servidores Power, por exemplo, a IBM afirma que o Spyre pode ingerir mais de 8 milhões de documentos por hora para integração de base de conhecimento, com base em testes internos. Juntos, Telum II e Spyre prometem cobrir todo o espectro de necessidades de IA de uma empresa, do transacional ao generativo, tudo dentro do mesmo perímetro seguro.
Conclusão: Um upgrade de cérebro para o vovô mainframe?
Com o Spyre Accelerator, a IBM não está apenas lançando um novo hardware. Está fazendo uma declaração forte de que o mainframe não é uma relíquia do passado, mas uma plataforma central para o futuro da IA empresarial. A jogada é lógica: em vez de tentar competir com a nuvem em escala bruta, a IBM foca em seu ponto forte — a segurança e a confiabilidade para dados de missão crítica. Ao equipar seus sistemas mais robustos com um cérebro de IA generativa, a empresa oferece a seus clientes uma forma de inovar sem abrir mão de seu maior ativo. Se a promessa de desempenho, segurança e escalabilidade for cumprida, o "vovô mainframe" pode acabar se mostrando o adulto mais inteligente e confiável na sala da inteligência artificial.
{{ comment.name }}
{{ comment.comment }}