IA & Ética

IA para Validar Instrumentos de Pesquisa: O Que Funciona

Como usar IA no processo de validação de instrumentos de pesquisa: análise de conteúdo, clareza dos itens e os limites do que a IA pode fazer nesse processo.

validacao-de-instrumento metodologia ia-na-pesquisa questionario validade-de-conteudo

Antes de aplicar, você validou o instrumento?

Essa pergunta aparece frequentemente nas bancas de qualificação, e muitas vezes pega o mestrando de surpresa. Você escolheu um questionário, adaptou para o seu contexto, e não pensou que precisaria validar.

Mas se você modificou itens de um instrumento já validado, o adaptou de outro idioma, criou itens novos, ou está usando um instrumento em uma população diferente da original, você precisa ter uma estratégia de validação. Isso não é burocracia, é garantia de que o seu instrumento mede o que você diz que mede.

A IA entrou nessa conversa em alguns pontos específicos. Onde ela ajuda e onde ela não substitui o processo formal é o que esse post vai esclarecer.

O que significa validar um instrumento

Validação não é uma coisa só. É um conjunto de evidências que você acumula para sustentar que o instrumento mede o construto adequadamente para a população e o contexto do seu estudo.

As principais formas de evidência de validade que aparecem em dissertações e artigos:

Validade de conteúdo: os itens do instrumento representam adequadamente o domínio do construto? Essa evidência vem da avaliação de especialistas.

Validade de constructo: o instrumento se comporta como esperado do ponto de vista teórico? Isso é avaliado por análise fatorial e por correlações com outros instrumentos que medem construtos relacionados.

Validade de critério: o instrumento consegue predizer ou se correlacionar com um critério externo? Por exemplo, um instrumento de satisfação com a vida deveria se correlacionar com avaliações clínicas de bem-estar.

Confiabilidade: o instrumento produz resultados consistentes? O alfa de Cronbach é o índice mais comum para instrumentos com escala Likert.

Para uma dissertação de mestrado, as evidências mais cobradas são a validade de conteúdo (com juízes) e a confiabilidade (alfa de Cronbach). Análise fatorial pode aparecer quando o instrumento é mais complexo.

Onde a IA pode entrar no processo de validação

Análise textual prévia dos itens: antes de levar o instrumento para os juízes, você pode usar um modelo de linguagem para fazer uma leitura crítica inicial. Peça para a IA identificar itens com dupla negação, itens ambíguos, itens que podem ser interpretados de mais de uma forma, e itens com linguagem técnica desnecessária. Isso não é validação, mas é um filtro útil que pode melhorar a qualidade dos itens antes de chegar nos especialistas.

Organização do formulário para os juízes: a IA pode ajudar a estruturar o instrumento de avaliação para os juízes especialistas. Um formulário de validação bem organizado, com instruções claras sobre os critérios de avaliação, facilita o trabalho dos juízes e melhora a qualidade das avaliações que você vai receber.

Cálculo e interpretação do IVC: o Índice de Validade de Conteúdo é calculado com base nas respostas dos juízes. A fórmula é simples: número de juízes que avaliaram o item como “conteúdo relevante” dividido pelo total de juízes. A IA pode ajudar a organizar esses dados em planilha e a redigir o texto descrevendo os resultados.

Redação da seção de validação: depois que você tem os dados da validação, a IA pode apoiar na escrita do texto metodológico descrevendo o processo, os resultados e as decisões tomadas.

O que a IA não faz na validação

Ser um juiz especialista. A validade de conteúdo exige avaliação de pessoas que conhecem o construto teórico e a população-alvo. Um modelo de linguagem não tem esse conhecimento contextual especializado. Ele pode fazer uma análise textual, mas não pode julgar se os itens representam adequadamente o construto à luz da teoria específica da sua área.

Substituir o pré-teste com participantes reais. Depois dos juízes, você ainda precisa aplicar o instrumento em um grupo pequeno de respondentes semelhantes à sua amostra e verificar se as respostas fazem sentido, se o tempo de preenchimento é adequado e se surgem dúvidas. Isso é trabalho de campo.

Calcular o alfa de Cronbach de forma confiável. Como em outros cálculos estatísticos, não peça para a IA calcular o alfa. Use SPSS, Jamovi ou R para isso.

Quantos juízes você precisa para validação de conteúdo

Essa é uma dúvida frequente. A literatura não tem um consenso único, mas as referências mais citadas sugerem entre 3 e 10 juízes. Lynn (1986) sugere mínimo de 3. Poupart (2003) e Haynes et al. (1995) sugerem entre 5 e 10 para cobrir melhor o domínio do construto.

Para dissertações de mestrado, 5 a 7 juízes é um número que aparece com frequência e que seus orientadores e bancas costumam aceitar. O importante é que os juízes tenham expertise na área do construto ou na população-alvo, ou preferencialmente em ambos.

Como convidar os juízes: profissionalmente e com clareza. Apresente o objetivo da pesquisa, descreva o que se espera deles, forneça o instrumento de avaliação e os critérios de análise, e defina um prazo razoável. A maioria dos professores e pesquisadores aceita contribuir quando o pedido é bem formulado e o trabalho está bem organizado.

O IVC: como calcular e o que reportar

O Índice de Validade de Conteúdo é calculado para cada item e para o instrumento como um todo.

Para cada item: número de juízes que avaliaram como “relevante” ou “muito relevante” dividido pelo total de juízes. Se 4 dos 5 juízes avaliaram o item como relevante, o IVC do item é 0,80.

Para o instrumento (IVC-S): a média dos IVCs de todos os itens.

O critério de aceitabilidade mais usado é IVC ≥ 0,80. Itens com IVC abaixo disso devem ser revisados ou excluídos. Após a revisão, você pode recalcular o IVC desses itens com os mesmos juízes ou com novos especialistas.

No texto da dissertação, você reporta: o número de juízes e seu perfil (área de atuação, nível de formação), o instrumento usado para avaliação, o IVC de cada item e o IVC total, e os ajustes realizados com base nas recomendações dos juízes.

Validação de instrumentos adaptados

Um caso comum no mestrado: você encontrou um instrumento validado em inglês que é exatamente o que precisa. O que fazer?

A adaptação transcultural é um processo formal com etapas específicas. A mais conhecida é a proposta de Beaton et al. (2000), que envolve tradução, síntese, retradução, comitê de especialistas, pré-teste e submissão para aprovação dos autores originais.

Esse processo completo é mais adequado para estudos que vão publicar o instrumento adaptado. Para uma dissertação que vai usar o instrumento uma vez, algumas etapas podem ser simplificadas, mas você ainda precisa ter a tradução revisada por bilíngue, a avaliação de especialistas sobre a equivalência cultural dos itens, e um pré-teste.

A IA pode ajudar na tradução inicial dos itens, como primeira versão que vai ser revisada. Mas a revisão precisa ser feita por pessoa bilíngue com conhecimento da área.

A validação como argumento para a banca

No final, o processo de validação existe para você defender com segurança a qualidade do seu instrumento diante da banca. Quando o examinador perguntar “como você garantiu que esse instrumento mede o que você diz que mede?”, você tem uma resposta estruturada: os juízes, o IVC, o pré-teste, o alfa de Cronbach.

Usar a IA para acelerar partes desse processo é legítimo. Mas cada etapa que você pulou ou terceirizou para um modelo de linguagem é um ponto vulnerável que pode aparecer na qualificação ou na defesa.

Para mais sobre instrumentos e análise de dados, veja os posts sobre IA em pesquisa survey e SPSS vs JASP vs Jamovi.

Perguntas frequentes

A IA pode substituir juízes especialistas na validação de conteúdo?
Não. A validação de conteúdo por juízes especialistas é um procedimento metodológico com critérios estabelecidos que exige julgamento humano qualificado. A IA pode ser usada para uma análise prévia de clareza e consistência dos itens, mas não substitui a avaliação de especialistas da área, que vai verificar a representatividade e relevância teórica dos itens.
Como usar IA para verificar a clareza dos itens do meu instrumento?
Você pode pedir a um modelo de linguagem que simule a perspectiva de um respondente leigo e aponte quais itens podem ser interpretados de formas diferentes, quais têm linguagem técnica desnecessária ou quais têm dupla negação. Isso serve como um pré-teste textual, mas não substitui a aplicação com participantes reais.
O que é validade de conteúdo e como ela é calculada?
Validade de conteúdo é o grau em que os itens de um instrumento representam adequadamente o construto que pretendem medir. O índice mais comum é o Índice de Validade de Conteúdo (IVC), calculado a partir da avaliação de juízes especialistas que julgam cada item em uma escala de relevância. Um IVC acima de 0,80 é geralmente considerado aceitável.
<