A Microsoft anunciou em 21 de maio de 2026 a liberação em código aberto de duas ferramentas voltadas à segurança de agentes de IA: Rampart e Clarity. Se a empresa realmente quer operacionalizar verificações de segurança desde o início do desenvolvimento, então Rampart e Clarity precisam demonstrar isso na prática; senão, o anúncio corre o risco de ficar apenas no comunicado de imprensa.
Rampart: de achados de red team a testes automatizados
Rampart converte descobertas de equipes de red team em testes repetíveis e é construído sobre o framework PyRIT. A ferramenta permite executar cenários adversariais e benignos contra agentes de IA diretamente em pipelines de CI/CD. Se o objetivo é tornar a segurança contínua, então integrar Rampart ao fluxo de desenvolvimento já existente é o passo lógico; caso contrário, os riscos de injeção de prompt e uso indevido de ferramentas permanecem manuais e pontuais.
Clarity: validando suposições antes do código
Clarity examina e valida as suposições por trás das decisões de design de agentes de IA antes mesmo de qualquer linha de código ser escrita. Ele roda como aplicativo desktop, interface web ou integrado a um agente de codificação, gerando saídas em arquivos markdown dentro do diretório .clarity-protocol/. Se as suposições de design não forem documentadas e validadas cedo, então problemas como escalação de privilégios e ações autônomas não intencionais só serão descobertos tarde demais.
Contexto e declarações oficiais
O fundador do time de red team de IA da Microsoft, Ram Shankar Siva Kumar, afirmou que as ferramentas visam transformar a segurança de IA em uma disciplina contínua de engenharia. O lançamento sucede o Agent Governance Toolkit de abril de 2026 e menciona riscos específicos como injeção de prompt, uso inseguro de ferramentas, escalação de privilégios e ações autônomas não pretendidas. Se o histórico de anúncios anteriores da empresa sobre agentes for consistente, então a abertura de código representa evolução; senão, trata-se de resposta tardia a preocupações já levantadas em releases recentes de agentes autônomos.