IA & Ética

iThenticate: O Que É e Como Funciona na Pesquisa

Entenda o que é o iThenticate, como ele funciona, por que revistas e programas de pós-graduação o usam e o que significa ter um índice de similaridade alto.

ithenticate plagio integridade-academica ia-etica

O que é o iThenticate e por que ele importa

Vamos lá. O iThenticate é um software de verificação de similaridade textual desenvolvido pela Turnitin. Ele é a ferramenta padrão usada por editoras científicas, revistas de alto impacto e muitos programas de pós-graduação no Brasil e no mundo para verificar manuscritos antes da publicação ou aprovação.

Se você está submetendo um artigo para uma revista indexada, existe uma chance grande de que o manuscrito passe pelo iThenticate antes de chegar aos revisores. Se você está em um programa de pós-graduação com exigência de verificação de similaridade, provavelmente vai se deparar com ele na dissertação ou tese.

Entender o que ele faz e o que ele não faz é importante para não entrar em pânico com um relatório alto e para saber quando um índice de similaridade é de fato um problema.

Como o iThenticate funciona

O funcionamento básico é este: você submete um texto (manuscrito, dissertação, artigo) e o software compara o conteúdo com uma base de dados que inclui publicações científicas da Crossref, repositórios de teses, publicações da internet e documentos que foram previamente submetidos ao sistema.

O resultado é um relatório com um índice geral de similaridade, expresso em porcentagem, e uma marcação colorida do texto mostrando quais trechos têm correspondência com outras fontes e quais são essas fontes.

A base de dados do iThenticate inclui conteúdo da Web of Science, Scopus, PubMed, SpringerLink, Elsevier, Wiley e dezenas de outros repositórios. Na prática, se um texto publicado está em uma dessas bases, o iThenticate vai identificar se seu manuscrito tem trechos semelhantes.

O que o índice de similaridade significa

O índice de similaridade é o percentual do texto que tem correspondência com outras fontes. Um índice de 20%, por exemplo, significa que 20% do seu texto tem trechos idênticos ou muito parecidos com textos já publicados.

O problema é que esse número sozinho não diz nada sobre integridade acadêmica. Aqui está o porquê:

Citações diretas legítimas: quando você cita um trecho de outro autor entre aspas e com referência, está fazendo a coisa certa. Mas o iThenticate marca essa passagem como similaridade do mesmo jeito, porque o texto é idêntico à fonte.

Nomenclatura técnica: algumas expressões e frases são convencionais na área. “A pesquisa foi conduzida de acordo com os princípios éticos da Declaração de Helsinque” aparece em centenas de artigos de saúde. O iThenticate vai marcar isso como similaridade entre os artigos que usam a mesma frase.

Seções metodológicas padronizadas: descrições de procedimentos padronizados (escala Likert de 5 pontos, coleta por meio de questionário estruturado) tendem a se repetir com linguagem similar entre publicações da mesma área.

Autoplágio: quando você usa trechos do seu próprio trabalho publicado anteriormente sem indicar que é uma republicação, o iThenticate vai identificar como similaridade com aquela publicação. Isso pode ou não ser problema dependendo do contexto e das normas da revista.

O relatório de similaridade é uma ferramenta para o editor ou o avaliador, não uma sentença. A interpretação do que o índice significa é humana.

Por que o iThenticate virou padrão editorial

O iThenticate ganhou espaço por uma combinação de fatores. O volume de submissões às revistas científicas cresceu muito nas últimas duas décadas, tornando a verificação manual impraticável. A disponibilidade de conteúdo copiável na internet facilitou casos de plágio que antes seriam difíceis de executar. E escândalos de plágio em publicações de alto impacto criaram pressão para que editoras demonstrassem processos de verificação.

Hoje, publicações da Elsevier, Springer Nature, Wiley e IEEE usam o iThenticate como parte padrão do processo editorial. No Brasil, a CAPES e muitos programas de pós-graduação exigem que dissertações e teses passem por verificação de similaridade antes da defesa.

O que não é coberto pelo iThenticate

Algumas limitações importantes:

Falsificação e fabricação de dados: o iThenticate detecta similaridade textual, não problemas com os dados. Um pesquisador que inventa resultados e os escreve de forma original passa pela verificação sem problema.

Plágio de ideias sem cópia textual: se você parafraseia extensamente o trabalho de outro sem dar crédito, o iThenticate pode não detectar, dependendo do quanto a linguagem foi alterada.

Conteúdo em idiomas diferentes: a verificação funciona melhor quando o texto e as fontes estão no mesmo idioma.

Conteúdo fora da base de dados: publicações que não estão nas bases que o iThenticate acessa não serão identificadas como fonte de similaridade.

Isso significa que a ferramenta é útil para detectar uma categoria específica de problema, mas não substitui a avaliação ética do processo de pesquisa como um todo.

O que fazer quando o índice está alto

Se você recebeu um relatório com índice alto e está preocupado, o primeiro passo é abrir o relatório e entender de onde vem a similaridade.

Identifique os trechos marcados e verifique: são citações diretas com aspas e referência? São frases técnicas padronizadas? São trechos sem atribuição de autoria?

Citações legítimas com aspas e referência não precisam ser alteradas. Elas podem ser excluídas da análise de similaridade pelo editor ou avaliador.

Frases técnicas padronizadas geralmente são aceitas como tal pela maioria das revistas.

Trechos sem atribuição que correspondem a texto de terceiros precisam ser revisados: ou adicionar a referência correta, ou reescrever com suas próprias palavras e citar a ideia.

A maioria das revistas aceita pedidos de explicação sobre o índice de similaridade. Se você tem justificativas legítimas para o percentual, comunique isso ao editor.

iThenticate e inteligência artificial

Com o aumento do uso de ferramentas de inteligência artificial para escrita, surgiu uma questão nova: o iThenticate detecta texto gerado por IA?

A resposta curta é: nem sempre, e não é para isso que ele foi projetado. O iThenticate detecta texto idêntico ou similar a texto já indexado na sua base de dados. Texto gerado por IA que não foi publicado antes em nenhum lugar não vai aparecer como similaridade no relatório.

A Turnitin desenvolveu um módulo separado de detecção de IA para complementar o iThenticate, que está disponível em algumas modalidades da plataforma. Mas os dois sistemas operam com lógicas diferentes: similaridade textual é uma coisa, reconhecimento de padrões de texto gerado por IA é outra.

Para pesquisadores que usam IA como apoio à escrita, o que o iThenticate vai detectar é se você copiou trechos de publicações anteriores que foram geradas por IA e estão indexadas. Texto original de IA que você adaptou e integrou ao seu manuscrito tende a não aparecer no relatório de similaridade.

Integridade acadêmica além da ferramenta

Aqui está o ponto que mais importa: o iThenticate é uma ferramenta, não um árbitro de integridade acadêmica. Passar pelo iThenticate com índice baixo não garante que o trabalho é íntegro. E ter índice alto não significa automaticamente que há plágio.

Integridade acadêmica é um valor, não um checklist. Significa dar crédito correto a quem desenvolveu as ideias que você está usando, ser transparente sobre o que é sua contribuição e o que é de outros, não inventar dados, não publicar o mesmo trabalho em múltiplos lugares sem indicação, e ser honesto sobre as limitações da sua pesquisa.

Essas práticas existem independentemente de qualquer software de verificação. O iThenticate pode ajudar a identificar deslizes específicos de atribuição textual, mas não substitui o compromisso genuíno com a honestidade na produção do conhecimento.

Explorar os temas de ética no uso de IA e de integridade na pesquisa científica faz parte do trabalho de qualquer pesquisador que quer produzir com qualidade e responsabilidade. Os recursos disponíveis no site incluem indicações para aprofundar essa discussão.

Perguntas frequentes

O que é o iThenticate e para que serve?
iThenticate é uma ferramenta de detecção de similaridade textual usada por editoras, revistas científicas e programas de pós-graduação para verificar se manuscritos contêm trechos idênticos ou muito semelhantes a textos já publicados. Ele compara o texto submetido com uma base de dados que inclui artigos científicos, livros, teses e conteúdo da internet, gerando um relatório com o índice de similaridade e as fontes correspondentes.
Um índice de similaridade alto no iThenticate significa plágio?
Não necessariamente. O iThenticate identifica similaridade textual, não plágio. Similaridade pode vir de citações diretas (que são legítimas quando entre aspas e com referência), de nomenclatura técnica padronizada, de seções metodológicas com linguagem convencional ou de trechos do próprio autor em publicações anteriores (autoplágio). O relatório precisa ser interpretado por um humano. A ferramenta não substitui o julgamento editorial ou acadêmico.
Qual índice de similaridade é aceitável no iThenticate?
Não existe um número universal. A maioria das revistas e programas considera aceitável até 15% a 25% de similaridade, dependendo da área e do tipo de texto. O que importa mais do que o índice total é de onde vem a similaridade: citações legítimas e referências metodológicas padronizadas são diferentes de parágrafos copiados sem citação.
<