Qual a diferença entre AIC e BIC na seleção de modelos?

O AIC (Critério de Informação de Akaike) penaliza a complexidade do modelo de forma mais suave, sendo indicado quando o objetivo é a melhor capacidade preditiva. O BIC (Critério de Informação Bayesiano) aplica uma penalidade maior ao número de parâmetros, favorecendo modelos mais parcimoniosos e sendo preferido quando o objetivo é identificar o modelo verdadeiro subjacente aos dados.

Quando devo usar AIC e quando devo usar BIC na minha dissertação?

Use AIC quando seu foco for a capacidade preditiva do modelo ou quando sua amostra for grande. Use BIC quando quiser parsimônia e tiver uma amostra razoável. Na prática, compare ambos: se concordam, sua escolha está bem fundamentada. Se divergem, escolha com base no objetivo da sua pesquisa e justifique teoricamente.

Modelos com menor AIC ou BIC são sempre os melhores?

Menor AIC ou BIC indica melhor equilíbrio entre ajuste e complexidade, mas não é o único critério. Considere também a interpretabilidade teórica do modelo, o ajuste aos pressupostos (normalidade de resíduos, homocedasticidade) e a relevância substantiva das variáveis incluídas. Um modelo estatisticamente ótimo pode não ser o mais defensável para a sua pesquisa.

AIC vs BIC: Como Selecionar Modelos Estatísticos na Tese

O momento em que AIC e BIC aparecem na sua vida

Você está na fase de análise quantitativa da dissertação, rodou a regressão, tem três ou quatro modelos na tela e precisa justificar qual deles vai para o texto final. O orientador pergunta: “Você usou algum critério de seleção de modelos?” É aí que aparecem, quase sempre juntos, dois acrônimos que parecem irmãos mas funcionam de maneiras distintas: AIC e BIC.

A boa notícia é que entender esses dois critérios não exige matemática avançada. Exige clareza conceitual. E isso é exatamente o que este post oferece.

Critério de informação é uma métrica estatística que avalia a qualidade de ajuste de um modelo em relação à sua complexidade, tornando possível comparar alternativas de forma objetiva.

O que é o AIC (Critério de Informação de Akaike)

O AIC foi proposto pelo estatístico japonês Hirotugu Akaike na década de 1970 e representa uma solução elegante para um problema clássico em modelagem estatística: quanto mais variáveis você adiciona a um modelo, melhor ele se ajusta aos seus dados. O problema é que um modelo com muitas variáveis pode estar “aprendendo o ruído” ao invés de capturar a estrutura real do fenômeno que você estuda.

O AIC equilibra duas coisas: a qualidade do ajuste do modelo (log-verossimilhança) e o número de parâmetros estimados. A fórmula básica é: AIC = 2k - 2ln(L), onde k é o número de parâmetros e L é a verossimilhança máxima.

Na prática, o que isso significa para você? Ao comparar dois modelos com a mesma variável dependente, o modelo com menor AIC oferece o melhor equilíbrio entre ajuste e parcimônia. Não é sobre qual modelo “se encaixa mais” nos dados, mas sobre qual explica mais com menos.

Um detalhe importante: quando sua amostra é pequena (regra geral, menos de 40 observações por parâmetro estimado), use o AICc, que é a versão corrigida do AIC para amostras pequenas. A maioria dos softwares estatísticos calcula os dois automaticamente.

O que é o BIC (Critério de Informação Bayesiano)

O BIC, desenvolvido por Gideon Schwarz em 1978, parte de uma lógica diferente. Enquanto o AIC foca na capacidade preditiva, o BIC foi concebido para identificar o modelo que mais provavelmente gerou os dados observados, em uma perspectiva bayesiana.

A fórmula do BIC é: BIC = k ln(n) - 2ln(L), onde n é o tamanho da amostra. Perceba a diferença em relação ao AIC: a penalidade do BIC para o número de parâmetros cresce com o tamanho da amostra. Isso significa que, quanto maior sua amostra, mais severo o BIC é com modelos complexos.

Na prática? O BIC tende a selecionar modelos mais simples que o AIC, especialmente quando você tem amostras grandes. Se você tem 500 observações e está comparando um modelo com 3 variáveis contra um com 7, o BIC vai penalizar bem mais as 4 variáveis extras do que o AIC faria.

AIC vs BIC: quando cada um é o critério certo

Faz sentido pensar assim: AIC e BIC respondem a perguntas diferentes sobre o seu modelo. Entender qual pergunta você está fazendo é o primeiro passo para escolher o critério certo.

Use o AIC quando:

Seu objetivo é construir um modelo preditivo (você quer prever valores futuros, não apenas explicar a variância do seu conjunto de dados atual)
Você está em uma área de pesquisa onde a teoria ainda é exploratória e você não tem razões fortes para preferir parcimônia extrema
Está trabalhando com dados de séries temporais ou modelos de equações estruturais

Use o BIC quando:

Seu objetivo é identificar o modelo “verdadeiro” ou mais parcimonioso que representa o fenômeno
Você tem uma amostra grande e quer evitar a inclusão de variáveis que contribuem marginalmente
Está em uma área onde a parsimônia teórica é valorizada (psicologia experimental, epidemiologia)

Quando eles concordam: ótimo. Você tem evidência dupla de que sua escolha de modelo está bem fundamentada.

Quando divergem: não entre em pânico. Reporte os dois valores, escolha com base no objetivo da sua pesquisa e justifique. Uma dissertação sólida não foge do desconforto metodológico, ela o nomeia e explica.

Como calcular e interpretar na prática

A maioria dos softwares estatísticos que você já usa calcula AIC e BIC automaticamente. No R, ao rodar um modelo com lm(), glm() ou modelos mistos com lme4, basta chamar AIC(modelo) e BIC(modelo). No SPSS, os valores aparecem na tabela de resumo dos modelos em regressão linear e em modelos mistos. No STATA, use o comando estat ic após estimar o modelo.

Uma dúvida frequente: quanto de diferença é suficiente para preferir um modelo? A regra geral, oriunda da literatura de burnham e Anderson sobre modelos de seleção, é que uma diferença de 2 pontos ou menos indica evidência fraca de que um modelo é superior. Diferenças acima de 10 pontos indicam evidência forte. Isso se aplica tanto ao AIC quanto ao BIC.

Olha só um exemplo prático: você está modelando a satisfação de estudantes com o apoio pedagógico na pós-graduação. Você tem três modelos:

Modelo 1 (frequência de reuniões + feedback escrito): AIC = 234, BIC = 241
Modelo 2 (+ variável de perfil do orientador): AIC = 229, BIC = 238
Modelo 3 (+ diversas interações): AIC = 227, BIC = 251

Pelo AIC, o Modelo 3 ganha por 2 pontos. Pelo BIC, o Modelo 2 ganha por 13 pontos. Aqui, o BIC sinaliza que a complexidade extra do Modelo 3 não se justifica. A decisão depende do seu objetivo, mas você tem informação suficiente para argumentar em defesa de qualquer escolha com clareza metodológica.

Integração com o processo de escrita da dissertação

Quando você escreve o capítulo de métodos, a seleção de modelos precisa aparecer de forma transparente. Não basta reportar o modelo final. Você precisa mostrar o processo.

Uma boa prática é apresentar uma tabela comparativa com os modelos testados e seus respectivos valores de AIC e BIC. Isso demonstra rigor metodológico e permite que o leitor (e a banca) entendam como você chegou à sua escolha.

O Método V.O.E. (Velocidade, Organização, Execução Inteligente) trata exatamente dessa dimensão: não é só sobre o que você encontrou, mas sobre como você mostra que sabe o que está fazendo. A transparência no processo de seleção de modelos é parte do que diferencia uma dissertação defendida com segurança de uma que gera questionamentos evitáveis.

No capítulo de resultados, ao apresentar seu modelo final, mencione brevemente os critérios usados para selecioná-lo. “O modelo final foi selecionado com base nos menores valores de AIC (x) e BIC (y) em comparação aos modelos alternativos, indicando o melhor equilíbrio entre ajuste e parsimônia” é uma frase que banca aprova.

Erros comuns que aparecem na defesa

Olha só: existe uma constelação de equívocos frequentes que eu vejo aparecer em defesas relacionados a critérios de seleção de modelos. Quero que você não cometa nenhum deles.

Erro 1: Usar AIC e BIC sem reportar os valores. Dizer “o modelo foi selecionado com base no AIC” sem mostrar os valores comparativos não convence ninguém. Mostre os números.

Erro 2: Confundir seleção de modelos com teste de hipóteses. AIC e BIC não testam se seu modelo é “estatisticamente significativo”. Eles comparam modelos entre si. Não substitua o teste F ou qui-quadrado pela comparação de critérios de informação.

Erro 3: Aplicar AIC/BIC apenas em regressão. Esses critérios são usados em regressão linear e logística, mas também em modelos mistos, séries temporais, análise fatorial confirmatória, e modelos de equações estruturais. Se você usa qualquer abordagem de modelagem, provavelmente pode (e deve) usar critérios de informação.

Erro 4: Ignorar quando AIC e BIC divergem. A divergência é informação, não um problema a ser escondido. Nomeie-a, explique-a, e faça sua escolha com argumento.

O que levar para a sua dissertação

Vamos lá ao resumo prático. Ao chegar na fase de análise quantitativa da sua pesquisa:

Identifique o objetivo do modelo. Está tentando explicar a variância da variável dependente ou fazer predições? Isso orienta a escolha entre AIC e BIC como critério prioritário.
Rode todos os modelos plausíveis considerando sua teoria e as variáveis disponíveis. Não precisa ser exaustivo, mas teste as alternativas razoáveis.
Calcule AIC e BIC para cada modelo e construa uma tabela comparativa. Isso vai entrar como material suplementar ou no corpo do texto, dependendo do espaço e das normas do seu programa.
Reporte os valores ao escrever, explique o critério de escolha e conecte a decisão metodológica à lógica da sua pesquisa.

Essa transparência é o que separa uma análise quantitativa que convence de uma que levanta dúvidas.

Se você está em busca de mais suporte para a escrita da sua dissertação, veja os recursos disponíveis aqui. A fase de análise é intensa, mas com a estrutura metodológica certa, você chega lá com segurança.

Uma nota sobre alternativas ao AIC e BIC

Antes de encerrar, vale mencionar que AIC e BIC não são os únicos critérios de seleção de modelos. Dependendo da área e do tipo de modelo, você pode encontrar outros critérios sendo usados.

O WAIC (Widely Applicable Information Criterion) é uma extensão bayesiana mais geral que funciona bem com modelos de inferência bayesiana completa. O DIC (Deviance Information Criterion) é frequentemente usado em modelos hierárquicos bayesianos. Em séries temporais, o critério de Hannan-Quinn (HQC) às vezes aparece como alternativa.

Para a maioria das dissertações e teses nas ciências humanas, sociais aplicadas e saúde, o AIC e o BIC cobrem bem os casos mais comuns. Mas saber que o campo tem mais ferramentas é importante para quando a banca perguntar: “você considerou algum outro critério de seleção?”

A resposta “considerei, e o AIC/BIC eram os mais adequados para o meu objetivo porque…” demonstra exatamente o tipo de domínio metodológico que a banca quer ver.

AIC vs BIC: Como Selecionar Modelos Estatísticos na Tese

O momento em que AIC e BIC aparecem na sua vida

O que é o AIC (Critério de Informação de Akaike)

O que é o BIC (Critério de Informação Bayesiano)

AIC vs BIC: quando cada um é o critério certo

Como calcular e interpretar na prática

Integração com o processo de escrita da dissertação

Erros comuns que aparecem na defesa

O que levar para a sua dissertação

Uma nota sobre alternativas ao AIC e BIC

Perguntas frequentes

Leia também

BNCC na pesquisa: os erros mais comuns e como evitá-los

Canva para pôster acadêmico: o que funciona de verdade

Capa ABNT: o que vai na capa e o que vai na folha de rosto

Receba estratégias de escrita acadêmica direto no seu feed