Metodologia: Como o DetectorDeAI Detecta IA
Como o DetectorDeAI detecta inteligência artificial em textos. Metodologia, modelo de treinamento, precisão e limitações explicados de forma transparente.
O modelo de detecção: como foi treinado
O DetectorDeAI usa GPT-4o-mini como modelo de análise base, com um prompt de sistema desenvolvido e refinado em um corpus de referência de 4.800 textos em PT-BR, 2.400 textos escritos por humanos e 2.400 gerados por modelos de IA (ChatGPT, Gemini, Claude e Llama).
O corpus de textos humanos inclui: redações acadêmicas de graduação e pós-graduação, artigos jornalísticos de veículos brasileiros, textos de blogs e redes sociais, e documentos profissionais. Todos os textos foram verificados manualmente como escritos por humanos e datam de antes de 2022.
O corpus de textos de IA foi gerado usando os mesmos modelos que os usuários tipicamente usam, sem instruções de evasão, para garantir que o modelo detecte comportamento de IA em uso normal.
Métricas usadas: perplexidade e burstiness
A detecção se baseia em dois conceitos estatísticos fundamentais, documentados em pesquisas recentes sobre detecção de IA (arXiv):
Perplexidade é calculada como PP(texto) = exp(-(1/n) × Σ log P(tᵢ | t₁...tᵢ₋₁)), uma medida de quão imprevisível é cada palavra dado o contexto anterior. Valores baixos indicam texto altamente previsível, característico de IA.
Burstiness é a razão entre o desvio padrão e a média das perplexidades por frase. Escritores humanos têm burstiness alto, alternam naturalmente entre frases simples e complexas. IA produz burstiness baixo e uniforme.
Taxa de precisão: como medimos e o que significa
A precisão de 97% foi medida usando validação cruzada em 20% do corpus de referência (480 textos não vistos durante o desenvolvimento). A métrica reportada é precisão balanceada, média das taxas de acerto para textos humanos e textos de IA separadamente.
Taxa de falsos positivos (FPR): 3%, 3 textos humanos em cada 100 são incorretamente classificados como IA. Taxa de falsos negativos (FNR): 3%, 3 textos de IA em cada 100 são incorretamente classificados como humanos.
A precisão foi medida em março de 2026. À medida que modelos de IA evoluem, o modelo de detecção é atualizado periodicamente.
Limitações: quando o detector pode errar
É essencial compreender quando o DetectorDeAI tem menor precisão:
- Textos muito curtos (menos de 50 palavras), a análise estatística requer massa de texto suficiente.
- Texto técnico altamente especializado, documentação jurídica, relatórios médicos e código têm perplexidade naturalmente baixa mesmo quando escritos por humanos.
- Texto de IA muito editado, quando um humano reescreve extensivamente o texto de IA, os marcadores estatísticos são atenuados.
- Poesia e texto literário, formas poéticas têm estruturas que diferem tanto do texto humano comum que os classificadores têm menor confiança.
- Mistura de texto humano e IA, parágrafos alternados de fontes diferentes produzem sinais mistos que podem confundir o modelo.
Privacidade e segurança dos dados
O texto enviado é processado exclusivamente pela API da OpenAI para fins de análise e descartado após o retorno do resultado. Não armazenamos nenhum texto. Não temos banco de dados de textos submetidos. Não usamos os textos para melhorar nosso modelo.
Metadados agregados coletados: país de origem da requisição, comprimento aproximado do texto (sem o conteúdo) e resultado da análise (IA/humano/incerto), sem nenhum identificador pessoal ou conteúdo de texto.
Nossa infraestrutura usa Cloudflare Workers com logs retidos por no máximo 24 horas para fins de segurança operacional, sem conteúdo de usuário.