Turnitin: o que é e o que o índice de similaridade significa
Entenda o que o Turnitin detecta, o que o índice de similaridade diz (e não diz) sobre o seu texto e como usar a ferramenta de forma ética.
O número que assusta e o que ele realmente mede
A primeira vez que uma pesquisadora vê o relatório do Turnitin, a reação costuma ser a mesma: fixar no percentual colorido e entrar em pânico. Vermelho. Amarelo. Qualquer coisa acima de zero já levanta a pressão.
Turnitin é uma ferramenta de detecção de similaridade textual que compara o seu documento com um banco de dados composto por publicações acadêmicas, páginas da web, trabalhos enviados por outras instituições e repositórios de conteúdo. O que ela produz é um índice de correspondência, não uma sentença sobre integridade acadêmica.
Um texto com 22% de similaridade pode ser perfeitamente íntegro. Um texto com 8% pode ser plágio declarado. O número sozinho não resolve nada.
Como o Turnitin funciona, de fato
A ferramenta recebe o seu arquivo, divide o texto em segmentos sobrepostos e compara cada segmento com o seu banco de dados. Quando encontra correspondência igual ou muito próxima, destaca o trecho e indica a fonte de origem.
O banco de dados do Turnitin inclui:
- Artigos e periódicos acadêmicos (via parcerias com editoras como Elsevier, Springer, Wiley)
- Páginas da internet indexadas publicamente
- Trabalhos enviados por instituições parceiras (a maioria das universidades brasileiras de grande porte está incluída)
- Repositórios institucionais abertos
Cada trecho marcado vem com uma cor que indica a porcentagem de correspondência: azul para citações do banco de alunos, verde para texto sem match, amarelo e vermelho para correspondências em graus crescentes.
O índice total é a soma ponderada de todos os trechos marcados em relação ao volume do documento inteiro.
Faz sentido até aqui? Então agora vem o ponto crítico.
O que o índice de similaridade não é
Não é uma medida de plágio. Essa confusão é a fonte de 90% da ansiedade desnecessária.
Plágio é um ato, não um dado. Ele acontece quando alguém apresenta como própria uma ideia, argumento ou formulação que não é. O Turnitin não consegue avaliar intenção, contexto ou atribuição de autoria por conta própria. O que ele faz é identificar onde as palavras do seu texto aparecem também em outro lugar.
Citações diretas corretamente formatadas com aspas e referência elevam o percentual. Terminologia técnica que toda a área usa (como “revisão sistemática da literatura” ou “análise de conteúdo qualitativa”) também aparece destacada. Listas de referências bibliográficas, quando indexadas, contribuem com pontos percentuais que não dizem nada sobre integridade.
Um departamento responsável lê o relatório completo e analisa trecho por trecho antes de qualquer conclusão. O número global não é argumento suficiente para absolutamente nada.
O que leva o índice para cima (e o que não preocupa)
Alguns elementos elevam o percentual de forma legítima, e saber isso ajuda a interpretar o relatório com mais calma.
Citações diretas com aspas e referência marcam no relatório. Isso é o comportamento esperado da ferramenta. Terminologia técnica que toda a área usa da mesma forma também aparece destacada: em linguística, “análise do discurso” está em milhares de textos; em direito, fórmulas processuais são padronizadas por lei. O match é inevitável e irrelevante.
A lista de referências gera correspondência quando os artigos do seu referencial estão indexados no banco do Turnitin. Algumas versões do relatório permitem excluir referências da contagem; peça ao orientador ou à biblioteca para verificar as configurações da sua submissão.
Texto reaproveitado do TCC na dissertação também aparece marcado, porque o trabalho anterior foi submetido pela mesma instituição. Isso se chama autoplágio e pode ser um problema, mas depende das regras do programa e de como o reaproveitamento foi declarado.
O que efetivamente preocupa é diferente: trecho longo sem aspas e sem referência que bate com outra fonte; paráfrase tão próxima que mantém a estrutura da frase original sem atribuição; substituição de palavras sem citação da ideia de base.
O módulo de detecção de IA: o que ele consegue e onde ele erra
Desde 2023, o Turnitin incluiu um módulo específico para detectar texto gerado por inteligência artificial. Ele funciona por análise de padrões estatísticos: modelos de linguagem tendem a produzir certas distribuições de tokens e construções que diferem do texto humano típico.
O resultado é uma estimativa de proporção de texto possivelmente gerado por IA, não uma certeza.
O problema prático é a taxa de erro. O módulo tem histórico documentado de falsos positivos, especialmente em textos técnicos com vocabulário restrito, textos de não nativos do inglês, e textos que foram gerados por IA mas extensamente editados depois por humanos. A Turnitin própria publicou alertas sobre uso responsável do recurso.
Isso não significa que o módulo é inútil. Significa que ele não deve ser usado como prova única em nenhuma direção: nem para acusar plágio por IA nem para descartar a possibilidade.
Se o módulo sinalizou o seu texto e você não usou IA, a saída não é entrar em pânico. É poder explicar seu processo de escrita, ter rascunhos anteriores, registros de pesquisa, histórico de edições. A autoria se prova por evidência de processo, não por negação.
Como ler o relatório com critério
Quando você (ou seu orientador) recebe o relatório do Turnitin, comece ignorando o percentual global por alguns minutos. Abra o relatório detalhado e filtre as correspondências por tamanho: trechos de uma ou duas palavras são irrelevantes; correspondências de cinco ou mais palavras em sequência merecem atenção.
Depois, verifique a natureza de cada trecho marcado. É citação direta com aspas e referência? Correto. É terminologia técnica universal? Irrelevante. É um parágrafo inteiro sem aspas que aparece quase idêntico em outra fonte? Aí você tem algo para corrigir.
Olhe também a origem de cada correspondência. Um TCC de universidade desconhecida, submetido há cinco anos, que coincide com seu texto escrito de forma independente pode ser simples coincidência ou uso da mesma referência primária. Se a fonte é um artigo que você leu, verifique se a citação está correta.
Com esse mapeamento em mãos, ajuste o que for necessário: insira aspas e referência onde a citação direta não estava sinalizada, reformule trechos onde a paráfrase ficou próxima demais, e revise a lista de referências se o relatório permitir excluí-la da contagem.
Ética no uso: o que está em jogo
Esse ponto importa mais do que qualquer percentual.
A razão de existir de ferramentas como o Turnitin é apoiar a integridade acadêmica, que é o conjunto de práticas que permite à ciência funcionar como sistema coletivo de produção de conhecimento. Quando alguém apresenta ideia de outro como própria, enfraquece a cadeia de atribuição que torna possível rastrear o desenvolvimento do conhecimento.
Tentar burlar o Turnitin trocando palavras, usando sinônimos em massa ou inserindo caracteres invisíveis não resolve o problema ético subjacente. E as versões mais recentes da ferramenta são cada vez mais eficazes em detectar paráfrase próxima e substituições sinonímicas sistemáticas.
A pergunta relevante não é “como faço para o índice baixar”. É “o que escrevi aqui é efetivamente meu, no sentido de ser minha elaboração das ideias que li e citei corretamente?” Se a resposta for sim, o percentual é problema de formatação, não de integridade. Se a resposta for não, a correção é reescrever de verdade.
Isso se aplica também ao uso de IA. Usar um modelo de linguagem para gerar parágrafos e submetê-los como texto próprio sem declaração é uma forma de desonestidade acadêmica que vai além do Turnitin. A questão não é se a ferramenta vai detectar. É se o texto representa o que você pensa e como você argumenta.
O que fazer antes de submeter
Se a sua instituição usa Turnitin (ou qualquer outra ferramenta de similaridade), algumas práticas simples evitam sustos desnecessários:
Revise todas as citações diretas antes de enviar. Cada trecho entre aspas precisa ter referência completa. Cada referência na lista precisa ter a citação correspondente no corpo.
Verifique as paráfrases. Um parágrafo parafraseado ainda precisa de referência ao autor original, mesmo sem aspas. Paráfrase não é escrita própria quando a ideia vem de outro.
Se você usou IA em qualquer etapa, declare. A maioria dos programas de pós-graduação no Brasil ainda não tem política consolidada sobre uso de IA, mas os que têm exigem declaração. Deixe claro no seu texto ou em nota o que foi feito com auxílio de ferramenta e o que foi escrita autoral.
Converse com seu orientador antes de submeter se tiver dúvida sobre algum trecho específico. Isso é infinitamente mais eficiente do que descobrir o problema depois.
O que fica depois de tudo isso
O índice de similaridade do Turnitin é um ponto de partida para análise, não uma conclusão sobre integridade. Um número alto pode ser perfeitamente legítimo. Um número baixo não garante que o texto está correto.
O que a ferramenta mede é correspondência textual. O que a academia avalia é atribuição adequada de autoria e originalidade de elaboração. São coisas relacionadas, mas não idênticas.
Sua responsabilidade é escrever com honestidade: citar o que veio de outros, elaborar genuinamente o que você apresenta como análise própria, e declarar processos auxiliares quando existirem. Se você faz isso, o relatório do Turnitin é uma revisão final de formatação, não um julgamento.
Se você quiser entender mais sobre como a IA está mudando as regras do jogo na escrita acadêmica, esse tema está coberto em detalhes em /metodo-voe e na seção de recursos em /recursos.
Perguntas frequentes
O que significa um índice de similaridade alto no Turnitin?
O Turnitin detecta texto gerado por IA?
Posso reduzir a porcentagem do Turnitin trocando palavras?
Leia também
Receba estratégias de escrita acadêmica direto no seu feed
Siga a Dra. Nathalia no YouTube e Instagram para conteúdo gratuito sobre o Método V.O.E.