Método

IRaMuTeQ: O Que É e Como Usar em Pesquisa Qualitativa

IRaMuTeQ é um software gratuito para análise textual de dados qualitativos. Entenda o que ele faz, quando usar e o que a banca vai perguntar sobre ele.

metodologia escrita-academica artigo-cientifico pesquisa-qualitativa tese

O software que aparece em cada vez mais metodologias, mas que poucos conseguem explicar para a banca

Nas últimas sessões de qualificação que acompanhei, o IRaMuTeQ apareceu em três bancas diferentes. Em dois dos casos, alguém perguntou: “Como o software chegou a essas classes?” E os candidatos não souberam responder.

IRaMuTeQ é um software gratuito de análise textual que aplica métodos estatísticos para organizar corpus de texto em categorias chamadas classes. O nome vem do francês Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires, porque roda em cima da linguagem R. Mas você não precisa saber programar em R para usá-lo.

O problema não é o software. O problema é usar o software sem entender o que ele faz. E quando a banca pergunta, o silêncio aparece.


O que o IRaMuTeQ faz concretamente

O IRaMuTeQ recebe um corpus de texto como entrada. Esse corpus pode ser transcrições de entrevistas, respostas abertas de questionários, documentos, notícias, ou qualquer conjunto de textos que você quer analisar.

A partir daí, o software executa diferentes tipos de análise. A mais utilizada em dissertações e teses brasileiras é a Classificação Hierárquica Descendente (CHD).

Na CHD, o software divide o corpus em segmentos de texto, calcula a frequência e co-ocorrência de palavras em cada segmento, e agrupa segmentos similares em classes. O resultado é um dendrograma (um diagrama em árvore) que mostra quantas classes foram identificadas e quais palavras caracterizam cada uma.

Outras análises disponíveis:

  1. Análise de similitude: mapeia quais palavras aparecem juntas com mais frequência, gerando uma rede de co-ocorrências
  2. Nuvem de palavras: representação visual por frequência de ocorrência
  3. AFC (Análise Fatorial de Correspondência): distribui as classes num plano bidimensional para visualizar relações entre elas

O que o software não faz: não interpreta o que as classes significam, não relaciona os achados com a literatura, não responde à pergunta de pesquisa. Isso é trabalho do pesquisador.


O IRaMuTeQ ganhou espaço especialmente nas áreas de saúde coletiva, enfermagem, educação e psicologia social. Alguns fatores contribuíram para isso.

É gratuito. Softwares de análise qualitativa como Atlas.ti e NVivo têm licença cara. O IRaMuTeQ roda em Windows, Mac e Linux sem custo.

Produz saídas visuais que aparecem bem em artigos. O dendrograma da CHD é um recurso gráfico que periódicos das áreas de saúde reconhecem e aceitam com facilidade.

Tem boa documentação em português. O tutorial original de Camargo e Justo (2013), publicado na revista Temas em Psicologia, é citado em praticamente todos os artigos que usam o software no Brasil. Se você vai usar IRaMuTeQ em sua pesquisa, leia esse artigo antes.

Faz sentido usar quando o corpus é grande demais para análise manual de todas as co-ocorrências. Para corpus menores (menos de dez entrevistas curtas), a análise temática manual costuma ser mais adequada.


Como o IRaMuTeQ se encaixa em diferentes metodologias

O IRaMuTeQ é um software de apoio à análise, não uma metodologia em si. Isso significa que ele pode ser usado em conjunto com diferentes abordagens metodológicas, mas precisa estar alinhado com elas.

Com análise de conteúdo: o IRaMuTeQ pode ajudar a organizar o corpus antes da categorização temática. A CHD sugere classes que o pesquisador pode usar como ponto de partida para definir as categorias de análise. A análise de conteúdo ainda depende da interpretação do pesquisador para nomear e descrever as categorias.

Com análise do discurso: a relação é mais tensa. A análise do discurso trabalha com sentido, contexto e posições enunciativas, enquanto o IRaMuTeQ trabalha com frequência e co-ocorrência. Usar IRaMuTeQ em pesquisa de análise do discurso requer justificativa metodológica cuidadosa.

Com análise temática (Braun e Clarke): o IRaMuTeQ pode auxiliar na fase de geração de códigos iniciais, especialmente quando o corpus é volumoso. Mas as fases seguintes da análise temática (revisão de temas, definição, produção do relatório) são essencialmente qualitativas e não são automatizadas pelo software.

O Método V.O.E. (Velocidade, Organização, Execução Inteligente) entra especialmente na fase de Organização: antes de rodar o IRaMuTeQ, o corpus precisa estar organizado e formatado corretamente. Corpus com problemas de formatação geram análises inconsistentes, e o software não avisa quando isso acontece.


Preparando o corpus: onde a maioria erra

O IRaMuTeQ exige um formato específico de entrada. Cada texto no corpus precisa ser precedido de uma linha de identificação com asteriscos, que funciona como variável de classificação. A formatação precisa ser precisa.

Erros comuns na preparação do corpus:

  • Caracteres especiais que o software não reconhece (certos símbolos, formatações do Word que ficam invisíveis)
  • Corpus muito pequeno (menos de 500 palavras por classe esperada produz análises instáveis)
  • Texto sem limpeza prévia (palavras de preenchimento, marcadores de entrevista como “[pausa]” ou “[inaudível]” que não foram removidos)
  • Mistura de idiomas no mesmo corpus sem tratamento

A etapa de preparação do corpus costuma levar mais tempo do que a execução da análise em si. Não é incomum gastar dois dias preparando o corpus e dez minutos rodando a análise.


O que a banca vai perguntar sobre IRaMuTeQ

Se você usou IRaMuTeQ em sua dissertação ou tese, prepare respostas para estas perguntas:

“Por que você escolheu esse software?” Resposta esperada: justificativa baseada nas características do corpus (tamanho, natureza do material), na compatibilidade com a metodologia adotada, e na produção acadêmica existente com esse recurso na sua área.

“Como o software chegou a essas classes?” Resposta esperada: descrição do método CHD (divisão do corpus em segmentos, cálculo de qui-quadrado, reagrupamento por similaridade). Você não precisa explicar o algoritmo completo, mas precisa demonstrar que entende que o software usa frequência e associação estatística, não interpretação semântica.

“Quem fez a interpretação das classes?” Resposta esperada: você. O software nomeia as classes por palavras mais frequentes. O pesquisador é quem analisa os segmentos de texto de cada classe, relê o material original e propõe o significado da classe dentro do referencial teórico.

“Que limitações esse recurso tem?” Resposta esperada: trabalha com frequência, não com sentido. Ignora contexto e entonação. Corpus pequenos geram resultados instáveis. A interpretação das classes depende inteiramente do pesquisador.

Responder essas quatro perguntas com clareza é o suficiente para demonstrar domínio metodológico sobre o uso do software.


IRaMuTeQ ou Atlas.ti? A pergunta errada

Uma dúvida que aparece com frequência: devo usar IRaMuTeQ ou Atlas.ti (ou NVivo)?

A resposta honesta é que a pergunta é parcialmente equivocada. Os softwares fazem coisas diferentes.

Atlas.ti e NVivo são softwares de análise qualitativa assistida por computador (CAQDAS). Eles ajudam a organizar, codificar e recuperar trechos do corpus, mas não produzem análises automáticas. O pesquisador codifica manualmente, o software organiza o que foi codificado.

O IRaMuTeQ faz análise estatística do texto. Ele produz classificações automaticamente com base em frequência e co-ocorrência. O pesquisador interpreta as classificações produzidas.

Usar os dois em conjunto é possível e acontece em algumas pesquisas. Mas se você precisa escolher, a escolha depende do que sua metodologia requer, do tamanho do seu corpus, e do tipo de pergunta de pesquisa que você está respondendo.

Para dissertações e teses com corpus de entrevistas de tamanho médio (dez a trinta entrevistas) e metodologia de análise de conteúdo ou análise temática, o IRaMuTeQ como apoio à organização inicial é uma escolha razoável. A análise ainda precisará ser qualitativa.


Citar o IRaMuTeQ corretamente

Dois elementos precisam ser citados quando você usa o IRaMuTeQ em um artigo ou dissertação:

  1. O software: Camargo, B. V., & Justo, A. M. (2013). IRAMUTEQ: Um software gratuito para análise de dados textuais. Temas em Psicologia, 21(2), 513-518.

  2. A versão do software: a versão pode ser indicada na seção de métodos (ex: “foi utilizado o IRaMuTeQ versão 0.7 alpha 2”).

Citar apenas o tutorial sem identificar a versão é uma omissão que bancas de pós-graduação costumam perceber.


O que o software não resolve

IRaMuTeQ é útil para organizar corpus grandes, identificar padrões de co-ocorrência e produzir visualizações para artigos. Não é útil para fazer a análise por você, compensar corpus mal coletados, ou justificar uma escolha metodológica inadequada para a pergunta de pesquisa.

Pesquisas que usam IRaMuTeQ como recurso metodológico mas que não explicam o que as classes encontradas significam no contexto do referencial teórico são pesquisas incompletas. O software faz a parte estatística. A parte analítica continua sendo sua.

Saber usar uma ferramenta é diferente de saber o que fazer com o que ela produz. Para bancas de pós-graduação, a segunda parte é o que importa.

Perguntas frequentes

O que é o IRaMuTeQ e para que serve?
IRaMuTeQ (Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires) é um software gratuito de análise textual que usa métodos estatísticos para organizar e classificar corpus de texto. Serve para identificar classes de palavras, co-ocorrências e padrões em entrevistas, documentos ou respostas abertas de questionários. É amplamente usado em pesquisas qualitativas e mistas em ciências humanas, saúde e educação no Brasil.
O IRaMuTeQ substitui a análise qualitativa feita pelo pesquisador?
Não. O IRaMuTeQ organiza e classifica o corpus textual de forma estatística, mas não interpreta os dados. A análise do significado das classes, a relação com o referencial teórico e a resposta à pergunta de pesquisa são responsabilidade do pesquisador. O software é um apoio à organização, não um substituto para o raciocínio analítico.
Quais análises o IRaMuTeQ produz?
O IRaMuTeQ produz diferentes tipos de análise: Classificação Hierárquica Descendente (CHD), que agrupa o corpus em classes temáticas; análise de similitude, que mapeia co-ocorrências entre palavras; nuvem de palavras por frequência; e AFC (Análise Fatorial de Correspondência). A CHD é a mais utilizada em dissertações e teses brasileiras, especialmente nas áreas de saúde e educação.

Leia também

Receba estratégias de escrita acadêmica direto no seu feed

Siga a Dra. Nathalia no YouTube e Instagram para conteúdo gratuito sobre o Método V.O.E.