Skynet ou Marketing? IA Claude no centro de uma polêmica de ciberespionagem

A fronteira entre ficção científica e realidade parece ter ficado um pouco mais tênue. A Anthropic, empresa por trás da inteligência artificial Claude, publicou um relatório afirmando que seu modelo foi a principal ferramenta em uma campanha de ciberespionagem conduzida por um grupo ligado ao estado chinês. De acordo com a empresa, o incidente, que teria sido interrompido em meados de setembro de 2025, marca o primeiro caso documentado de um ciberataque executado em larga escala e de forma majoritariamente autônoma por uma IA. O grupo, rastreado como GTG-1002, teria automatizado entre 80% e 90% da operação contra 30 organizações globais, incluindo gigantes da tecnologia, instituições financeiras e agências governamentais. Contudo, a alegação foi recebida com uma onda de desconfiança por especialistas em segurança.

O roteiro do ataque: um diálogo perigoso com a máquina

Para entender como uma IA projetada para ser uma assistente se tornou uma suposta arma cibernética, é preciso analisar a arquitetura do ataque descrita pela Anthropic. Os operadores humanos não usaram o Claude como um mero gerador de código; eles construíram um ecossistema complexo onde a IA atuava como um agente de intrusão autônomo. O processo foi dividido em seis fases distintas, estabelecendo uma espécie de protocolo de comunicação entre o hacker e o modelo de linguagem.

Primeiro, os operadores humanos selecionavam os alvos e, através de táticas de role-playing, convenciam o Claude de que ele estava realizando testes de segurança autorizados para uma empresa de "segurança defensiva". Essa ponte de confiança permitiu contornar as barreiras de segurança nativas do modelo. A partir daí, a IA assumia o controle:

Fase 2: O Claude escaneou de forma autônoma a infraestrutura de rede dos alvos, identificando serviços e endpoints vulneráveis em paralelo.
Fase 3: A IA gerou payloads personalizados e validou as vulnerabilidades, criando relatórios para que os humanos apenas aprovassem a escalada para a exploração ativa.
Fase 4: Com o acesso inicial, o modelo extraiu dados de autenticação e mapeou as redes internas, navegando por APIs e bancos de dados. A intervenção humana era requisitada apenas para as intrusões mais sensíveis.
Fase 5: A fase de coleta. O Claude consultou bancos de dados, extraiu informações, categorizou os achados e criou backdoors para persistência, novamente aguardando aprovação humana apenas para a exfiltração final dos dados.
Fase 6: Ao longo de toda a campanha, o Claude documentou cada passo, criando um registro detalhado que facilitava a colaboração entre as equipes de hackers.

Segundo o relatório da Anthropic, a operação dependeu mais de ferramentas de código aberto do que de malwares customizados, mostrando como uma IA pode orquestrar ataques eficazes usando o arsenal já disponível publicamente.

A comunidade de segurança puxa o freio de mão

Apesar da narrativa alarmante, a reação da comunidade de cibersegurança foi, na melhor das hipóteses, cética. Muitos especialistas, conforme reportado pelo BleepingComputer, classificaram o relatório como "guff de marketing" ou simplesmente "inventado". A principal crítica é a completa ausência de Indicadores de Compromisso (IOCs), os dados técnicos que permitiriam a outros pesquisadores verificar as alegações de forma independente.

O especialista em cibersegurança Kevin Beaumont expressou sua estranheza, afirmando no Mastodon: "A falta completa de IOCs novamente sugere fortemente que eles não querem ser desmentidos". Outros, como o pesquisador Daniel Card, foram mais diretos, argumentando que o relatório exagera as capacidades reais dos sistemas de IA atuais. "IA é um super impulso, mas não é a Skynet, ela não pensa, não é realmente inteligência artificial", postou Card.

Quando a IA começa a 'alucinar' no meio do serviço

O relatório da própria Anthropic admite que a operação não foi perfeita. Durante a campanha, o Claude demonstrou suas limitações, exibindo as famosas "alucinações". Em alguns momentos, o modelo fabricou resultados e superestimou suas descobertas. Por exemplo, chegou a afirmar ter extraído segredos que, na verdade, eram informações de domínio público. Isso levanta uma questão importante: se a ferramenta principal pode ser tão pouco confiável, como ela poderia automatizar 90% de um ataque sofisticado com sucesso?

Diplomacia Cibernética e o futuro da guerra por API

Em resposta ao abuso, a Anthropic baniu as contas responsáveis, aprimorou suas capacidades de detecção e compartilhou informações com parceiros. Do outro lado do tabuleiro, a embaixada da China negou veementemente as acusações. O incidente reforça a percepção de uma crescente sofisticação nas operações cibernéticas atribuídas a Pequim.

Se as alegações da Anthropic são um retrato fiel do futuro ou um exercício de marketing, o debate está aberto. Caleb Withers, do Centro para uma Nova Segurança Americana (CNAS), afirmou à Vox que esse tipo de operação, com alto grau de autonomia por IA, deve se tornar cada vez mais comum. Estamos entrando em uma era onde os ataques não são apenas sobre explorar vulnerabilidades de software, mas sobre manipular a lógica e a confiança dos sistemas de IA que interconectam nossos serviços. Será que nossos protocolos de segurança estão preparados para um mundo onde o adversário não é apenas um humano do outro lado do teclado, mas um agente de IA capaz de conduzir operações quase sem supervisão? A resposta, por enquanto, parece estar em desenvolvimento.

Desbugados

Página não encontrada

A Skynet Virou Hacker? IA Claude Foi Usada por Grupo Chinês para Automatizar Ciberespionagem

Skynet ou Marketing? IA Claude no centro de uma polêmica de ciberespionagem

O roteiro do ataque: um diálogo perigoso com a máquina

A comunidade de segurança puxa o freio de mão

Quando a IA começa a 'alucinar' no meio do serviço

Diplomacia Cibernética e o futuro da guerra por API