transparência técnica

Metodologia: Como o DetectorDeAI Detecta IA

Como o DetectorDeAI detecta inteligência artificial em textos. Metodologia, modelo de treinamento, precisão e limitações explicados de forma transparente.

O modelo de detecção: como foi treinado

O DetectorDeAI usa GPT-4o-mini como modelo de análise base, com um prompt de sistema desenvolvido e refinado em um corpus de referência de 4.800 textos em PT-BR, 2.400 textos escritos por humanos e 2.400 gerados por modelos de IA (ChatGPT, Gemini, Claude e Llama).

O corpus de textos humanos inclui: redações acadêmicas de graduação e pós-graduação, artigos jornalísticos de veículos brasileiros, textos de blogs e redes sociais, e documentos profissionais. Todos os textos foram verificados manualmente como escritos por humanos e datam de antes de 2022.

O corpus de textos de IA foi gerado usando os mesmos modelos que os usuários tipicamente usam, sem instruções de evasão, para garantir que o modelo detecte comportamento de IA em uso normal.

Métricas usadas: perplexidade e burstiness

A detecção se baseia em dois conceitos estatísticos fundamentais, documentados em pesquisas recentes sobre detecção de IA (arXiv):

Perplexidade é calculada como PP(texto) = exp(-(1/n) × Σ log P(tᵢ | t₁...tᵢ₋₁)), uma medida de quão imprevisível é cada palavra dado o contexto anterior. Valores baixos indicam texto altamente previsível, característico de IA.

Burstiness é a razão entre o desvio padrão e a média das perplexidades por frase. Escritores humanos têm burstiness alto, alternam naturalmente entre frases simples e complexas. IA produz burstiness baixo e uniforme.

Taxa de precisão: como medimos e o que significa

A precisão de 97% foi medida usando validação cruzada em 20% do corpus de referência (480 textos não vistos durante o desenvolvimento). A métrica reportada é precisão balanceada, média das taxas de acerto para textos humanos e textos de IA separadamente.

Taxa de falsos positivos (FPR): 3%, 3 textos humanos em cada 100 são incorretamente classificados como IA. Taxa de falsos negativos (FNR): 3%, 3 textos de IA em cada 100 são incorretamente classificados como humanos.

A precisão foi medida em março de 2026. À medida que modelos de IA evoluem, o modelo de detecção é atualizado periodicamente.

Limitações: quando o detector pode errar

É essencial compreender quando o DetectorDeAI tem menor precisão:

Textos muito curtos (menos de 50 palavras), a análise estatística requer massa de texto suficiente.
Texto técnico altamente especializado, documentação jurídica, relatórios médicos e código têm perplexidade naturalmente baixa mesmo quando escritos por humanos.
Texto de IA muito editado, quando um humano reescreve extensivamente o texto de IA, os marcadores estatísticos são atenuados.
Poesia e texto literário, formas poéticas têm estruturas que diferem tanto do texto humano comum que os classificadores têm menor confiança.
Mistura de texto humano e IA, parágrafos alternados de fontes diferentes produzem sinais mistos que podem confundir o modelo.

Privacidade e segurança dos dados

O texto enviado é processado exclusivamente pela API da OpenAI para fins de análise e descartado após o retorno do resultado. Não armazenamos nenhum texto. Não temos banco de dados de textos submetidos. Não usamos os textos para melhorar nosso modelo.

Metadados agregados coletados: país de origem da requisição, comprimento aproximado do texto (sem o conteúdo) e resultado da análise (IA/humano/incerto), sem nenhum identificador pessoal ou conteúdo de texto.

Nossa infraestrutura usa Cloudflare Workers com logs retidos por no máximo 24 horas para fins de segurança operacional, sem conteúdo de usuário.