Detector de plágio: como funciona e o que não detecta
Entenda como os detectores de plágio funcionam, quais são os mais usados na academia brasileira e o que eles não conseguem identificar.
O número que assusta (e o que ele não mede)
O relatório chega com 23% de similaridade em vermelho e a pesquisadora entra em pânico. Ou chega com 4% e ela respira aliviada. Nos dois casos, a reação provavelmente está errada, porque o índice de similaridade não é sinônimo de plágio.
Detector de plágio é um software que compara um texto enviado com uma base de dados de documentos, páginas web e publicações, e calcula o percentual de trechos que aparecem em outras fontes. O que ele produz é um mapa de similaridade, não uma avaliação de integridade acadêmica.
A distinção importa porque muda completamente o que fazer com o resultado.
Como funciona a comparação
Por dentro, esses sistemas funcionam com um processo em três etapas:
- O texto enviado é segmentado em fragmentos (sentenças, frases ou sequências de palavras, dependendo da ferramenta).
- Cada fragmento é comparado com os documentos da base de dados usando algoritmos de correspondência textual.
- Os trechos com correspondência acima de um limiar são sinalizados, e o resultado é compilado num relatório com percentual de similaridade e indicação das fontes correspondentes.
A base de dados faz toda a diferença. O Turnitin, por exemplo, tem acesso a publicações acadêmicas, repositórios institucionais de dezenas de países, trabalhos anteriores submetidos por outras universidades (sem mostrá-los, apenas comparando) e páginas da web. O CopySpider, ferramenta gratuita bastante usada no Brasil, compara principalmente com conteúdo web e tem base menor para artigos acadêmicos.
Resultado: o mesmo texto pode ter 8% no CopySpider e 22% no Turnitin porque o segundo tem uma base de comparação muito maior.
O que o número de similaridade diz e o que não diz
Um índice de 20% pode ser absolutamente irrelevante ou sinal real de problema. Depende do que está gerando a similaridade.
Trechos que NÃO indicam plágio, mas aparecem nos relatórios:
- Citações diretas devidamente formatadas com aspas e referência
- Nomes de autores, títulos de obras e referências bibliográficas
- Termos técnicos obrigatórios do campo (não há como parafrasear “análise de variância” ou “habeas corpus”)
- Frases metodológicas padrão (“os dados foram coletados por meio de…”)
- Texto próprio da autora que já foi publicado anteriormente (autoplágio, que é outra questão)
O que indica problema real, mesmo com índice baixo:
- Paráfrases de trechos sem citação da fonte
- Estrutura argumentativa idêntica à de outro texto, com palavras trocadas
- Tradução de texto estrangeiro não creditada
- Uso de ideias de outros autores apresentadas como próprias
O detector não vê nenhum desses últimos casos. Ele só vê texto igual ou muito similar.
As formas de plágio que o detector não enxerga
Esse é o ponto que mais importa para a integridade acadêmica, e que menos aparece quando o assunto é “passar no detector”.
Plágio de ideia: você leu um argumento original em um artigo, entendeu, reformulou com suas palavras, não citou. O detector não vai pegar. A banca especialista pode pegar, especialmente se conhecer o campo.
Tradução não creditada: você encontrou um texto em inglês, traduziu os parágrafos e inseriu no seu trabalho sem referência. O detector brasileiro vai ter dificuldade porque a base de comparação em inglês é menor e a correspondência direta não existe.
Plágio de estrutura: o texto segue exatamente a lógica argumentativa de outro trabalho (introdução do problema, mesmos exemplos, mesma sequência de conclusões), mas cada frase foi reescrita. A similaridade textual pode ser mínima, o plágio intelectual é real.
Texto gerado por IA: com a proliferação de ferramentas de geração de texto, novos detectores tentam identificar texto produzido por IA. A maioria dos detectores tradicionais de plágio não tem essa função. Ferramentas específicas como Turnitin AI Detection, GPTZero e outras estão sendo adicionadas, mas a confiabilidade ainda é variável.
IA e os novos desafios para a detecção
A geração de texto por IA criou uma camada de complexidade que os sistemas de detecção ainda estão tentando resolver.
Texto produzido por ChatGPT, Claude ou outros modelos não aparece como plágio nos detectores convencionais porque não está copiado de nenhum documento existente. É gerado. O detector compara e não encontra correspondência.
A questão ética aqui não é de plágio textual, é de autoria. Quando a regulamentação da sua instituição exige que o trabalho seja de sua autoria, usar texto gerado por IA sem declaração e adaptação substancial viola essa norma, mesmo com 0% no detector de plágio.
Algumas universidades brasileiras já têm política específica sobre uso de IA em trabalhos acadêmicos. Verificar as normas da sua instituição é o primeiro passo antes de usar qualquer ferramenta de geração de texto no processo de escrita.
Como interpretar o relatório sem entrar em pânico
Quando o relatório chegar, o processo mais útil é:
- Abrir o relatório detalhado e verificar o que está gerando similaridade.
- Separar as ocorrências em categorias: citações diretas, termos técnicos, referências bibliográficas, trechos problemáticos.
- Avaliar apenas os trechos problemáticos com atenção.
- Corrigir o que precisar ser corrigido (adicionar citação, reformular, retirar) e reenviar se necessário.
Se depois dessa filtragem o percentual real de trechos sem citação adequada for baixo (3-5% dependendo das normas da instituição), o trabalho está dentro do aceitável. Se for alto, é sinal de que a revisão das citações foi insuficiente.
Fechamento: a ferramenta não substitui o julgamento
O detector de plágio é uma ferramenta, não um árbitro. Ele ajuda a identificar trechos que podem precisar de atenção, mas não diz se o trabalho tem integridade acadêmica.
Uma pesquisadora com integridade sólida pode ter 15% de similaridade por causa de citações e terminologia técnica. Uma pesquisadora que parafraseou sem citar o tempo todo pode ter 3%. O número não conta a história completa.
O que conta é se cada argumento tem a fonte que merece, se cada ideia apontada como sua é de fato sua, e se o texto representa honestamente o processo de pesquisa que aconteceu. Isso o detector não mede, e nenhuma ferramenta vai medir no lugar da pesquisadora.
Para entender como usar ferramentas de IA na pesquisa com ética e clareza metodológica, a página /recursos tem materiais organizados por etapa da pesquisa.
O que fazer antes de submeter o trabalho ao detector
Alguns cuidados antes de rodar o relatório economizam revisões desnecessárias depois:
Verificar se todas as citações diretas estão entre aspas e com referência no corpo do texto. Uma citação direta sem aspas vai aparecer como plágio no relatório, mesmo que a referência esteja na lista bibliográfica ao final. A formatação importa tanto quanto a intenção.
Confirmar que a lista de referências está completa e corresponde a todas as fontes citadas no texto. Referência na lista mas sem citação no texto, ou citação no texto sem referência na lista, são inconsistências que o detector não resolve, mas a banca vai notar.
Se houver texto de trabalhos próprios anteriores reaproveitado (por exemplo, um trecho da monografia de graduação usado no mestrado), verificar se a instituição exige declaração de autoplágio ou se o reaproveitamento é permitido dentro de certos limites. As políticas variam.
Esses três pontos não eliminam a necessidade de rodar o detector, mas reduzem o número de ocorrências que precisam de atenção no relatório final.
Perguntas frequentes
Qual o melhor detector de plágio para trabalhos acadêmicos?
O que é considerado plágio em trabalho acadêmico?
Como o detector de plágio funciona?
Leia também
Receba estratégias de escrita acadêmica direto no seu feed
Siga a Dra. Nathalia no YouTube e Instagram para conteúdo gratuito sobre o Método V.O.E.