EnglishKoreanPortugueseSpanish
EnglishKoreanPortugueseSpanish

O que é Prompt Injection e como ele afeta sistemas de IA

O que é Prompt Injection e como ele afeta sistemas de IA

O Prompt Injection voltou ao centro do debate sobre segurança em inteligência artificial após a repercussão da decisão da 3ª Vara do Trabalho de Parauapebas/PA, vinculada ao TRT da 8ª Região, envolvendo o uso de comandos ocultos em uma petição judicial. 

O caso trouxe visibilidade para um risco que especialistas em governança e segurança de IA já tratam há algum tempo como uma das principais vulnerabilidades da era da inteligência artificial generativa. 

Embora o tema tenha ganhado notoriedade recentemente, o problema vai muito além do ambiente jurídico. 

À medida que empresas passam a utilizar Large Language Models (LLMs), como ChatGPT, Gemini, Claude e copilots corporativos, em fluxos operacionais críticos, documentos externos deixam de ser apenas arquivos informacionais e passam também a representar potenciais vetores de manipulação algorítmica.

Entender esses riscos tornou-se uma questão de governança com impacto direto sobre a confiabilidade institucional.

O que é Prompt Injection?

Prompt Injection é uma técnica de manipulação utilizada para inserir instruções ocultas ou maliciosas em conteúdos processados por sistemas de inteligência artificial.

Na prática, o atacante tenta “enganar” o modelo de IA para que ele ignore comandos originais, altere comportamentos esperados ou execute ações não autorizadas.

Isso acontece porque modelos de linguagem funcionam a partir de instruções em linguagem natural. Se o sistema não possuir mecanismos robustos de proteção, uma instrução maliciosa pode ser interpretada como legítima pelo modelo.

Em termos simples, o Prompt Injection funciona como uma tentativa de reescrever as regras que a IA deveria seguir.

VEJA TAMBÉM:

Tribunais e bancas tentam combater uso de ‘prompt’

Como funciona um ataque de Prompt Injection?

O ataque pode ocorrer de diversas formas, especialmente em ambientes onde a IA lê:

  • PDFs
  • contratos
  • petições
  • e-mails
  • planilhas
  • páginas web
  • anexos externos
  • bases documentais

O objetivo do atacante é inserir comandos invisíveis ou disfarçados dentro desses conteúdos para influenciar a interpretação da IA.

Principais técnicas de prompt injection em documentos

A sofisticação dos vetores de ataque em documentos evoluiu consideravelmente. As quatro técnicas a seguir representam os métodos mais relevantes do ponto de vista operacional, identificados a partir de análise forense de documentos submetidos a fluxos com suporte de IA.

1 – Texto invisível por cor

O método mais clássico e ainda amplamente utilizado. O atacante grava o payload no PDF com a cor da fonte idêntica à cor do fundo, texto branco sobre fundo branco, no caso mais frequente.

2 – Fonte microscópica

Variante do ataque de ocultação visual por escala tipográfica. O texto é inserido no documento em tamanho de fonte extremamente reduzido resultando em uma sequência de pontos visualmente ininteligíveis para o leitor humano, mesmo em zoom moderado. 

3 – Fonte anômala por tamanho relativo

A variante mais sofisticada e a que melhor distingue detecção forense avançada de análise ingênua. 

O atacante não usa fonte microscópica, usa fonte apenas discretamente menor do que o padrão tipográfico do documento.

4 – Texto fora da viewport

O atacante posiciona o conteúdo malicioso em coordenadas que ficam fora da MediaBox da página, a área que define o que será renderizado na tela. 

Por que o Prompt Injection preocupa especialistas em segurança?

O principal problema é que modelos de IA não “enxergam” documentos da mesma forma que seres humanos.

Enquanto uma pessoa observa apenas o conteúdo visualmente renderizado, a IA processa o fluxo textual completo do arquivo, incluindo elementos invisíveis, ocultos ou fora da área aparente do documento.

Isso cria um cenário perigoso em aplicações corporativas que utilizam IA para:

  • análise documental;
  • classificação automática;
  • revisão jurídica;
  • atendimento automatizado;
  • extração de dados;
  • workflows inteligentes.

Em ambientes sem governança adequada, um documento manipulado pode influenciar diretamente o comportamento do sistema.

LEIA TAMBÉM:

A nova fronteira da Litigância de má-fé: sabotagem algorítmica, prompt injection e os impactos na governança corporativa

Casos atuais de prompt injection no judiciário

O debate ganhou relevância nacional após a repercussão do caso analisado pela 3ª Vara do Trabalho de Parauapebas/PA. No entanto, o episódio não permaneceu isolado.

Na mesma semana, uma decisão da 2ª Vara Cível de Porto Velho/RO identificou comandos ocultos em fonte branca sobre fundo branco ao final de uma petição inicial, instruindo eventual sistema de IA a classificar procedimentos médicos como urgentes e a reconhecer abusividade na negativa de cobertura do plano de saúde. 

O juiz aplicou multa por litigância de má-fé no percentual máximo de 10% sobre o valor da causa e determinou a expedição de ofícios à OAB e à Secretaria de Tecnologia da Informação do tribunal. 

O tema também alcançou os tribunais superiores. Ainda em maio, o Superior Tribunal de Justiça (STJ) instaurou procedimentos para apurar o uso de prompt injection em petições apresentadas em um processo relacionado à invasão e manipulação de sistemas judiciais  

Segundo informações, os comandos ocultos buscavam influenciar ferramentas de inteligência artificial na análise de recursos processuais. 

Os episódios demonstram que o Prompt Injection deixou de ser uma preocupação exclusivamente teórica ou restrita ao ambiente de segurança da informação. 

Esse entendimento começa a se refletir também na atuação institucional do próprio Poder Judiciário. O Centro de Inteligência da Justiça de Minas Gerais (CIJMG) publicou recentemente a Nota Técnica nº 19/2026 alertando magistrados sobre os riscos da técnica em processos judiciais. 

O documento reconhece a manipulação dolosa de sistemas de inteligência artificial como uma ameaça à integridade processual, orienta a adoção de mecanismos defensivos para mitigação desses ataques e recomenda a aplicação de sanções processuais quando identificada a inserção intencional de comandos ocultos em documentos submetidos ao Judiciário.

A iniciativa demonstra que a discussão sobre segurança e governança de IA já ultrapassou o campo acadêmico e tecnológico, tornando-se uma preocupação institucional para órgãos responsáveis pela administração da Justiça.

Metodologia Manticore

Desde 2021, a LBCA opera sob a diretriz AI First, estruturando fluxos jurídicos com suporte de IA a partir de princípios de supervisão humana, rastreabilidade e controle de acesso. A exposição sistemática a documentos externos, petições de contrapartes, contratos, laudos técnicos, notificações administrativas, evidenciou a necessidade de um protocolo estruturado de verificação antes da ingestão em fluxos apoiados por inteligência artificial. 

O Manticore é a resposta metodológica a esse diagnóstico. Trata-se de uma metodologia proprietária de análise forense aplicada a documentos externos utilizados em fluxos jurídicos e tecnológicos, com o objetivo de reforçar a integridade operacional em ambientes onde modelos de linguagem participam ativamente do processamento de informação. 

A metodologia realiza quatro camadas independentes de verificação antes que documentos ingressem em fluxos operacionais apoiados por IA:

• análise forense visual e estrutural;
• análise semântica voltada à identificação de padrões de prompt injection;
• sanitização e isolamento de contexto;
• validação humana com trilha auditável.

Para entender mais sobre a metodologia Manticore e nossa visão sobre governança de IA aplicada à operação jurídica, acesse a nova página dedicada ao tema em nosso site.

Post Relacionados