Como saber qual teste estatístico usar na minha pesquisa?

A escolha do teste depende de três fatores principais: o tipo de variável (quantitativa ou categórica), o número de grupos comparados e a distribuição dos dados (normal ou não-normal). Um fluxograma de escolha de testes, como os disponíveis em livros de bioestatística, ajuda a mapear a decisão com base nesses critérios.

O que é valor p e como interpretar na análise estatística?

O valor p indica a probabilidade de obter um resultado igual ou mais extremo que o observado, assumindo que a hipótese nula é verdadeira. Por convenção, p < 0,05 é considerado estatisticamente significativo na maioria das áreas. Mas significância estatística não é o mesmo que relevância clínica ou prática.

Preciso de um estatístico para fazer a análise da minha dissertação?

Não necessariamente, mas depende da complexidade do desenho de pesquisa. Análises simples como qui-quadrado, teste t e correlação de Pearson são acessíveis para pesquisadores com formação básica em estatística. Modelos mais complexos (regressão múltipla, análise fatorial, equações estruturais) se beneficiam de consultoria especializada.

Análise estatística na pesquisa: guia para pesquisadores

Q: Preciso de um estatístico para fazer a análise da minha dissertação?

Não necessariamente, mas depende da complexidade do desenho de pesquisa. Análises simples como qui-quadrado, teste t e correlação de Pearson são acessíveis para pesquisadores com formação básica em estatística. Modelos mais complexos (regressão múltipla, análise fatorial, equações estruturais) se beneficiam de consultoria especializada.

Estatística não é o inimigo da pesquisa qualitativa de vida.

Pesquisadores das ciências humanas, da saúde e da educação frequentemente escolhem abordagens metodológicas menos adequadas ao problema simplesmente para evitar lidar com números. O método paga o preço.

Esse post não vai te transformar em estatístico. Vai te dar o que precisa para entender a lógica da análise estatística, saber o que perguntar ao orientador, escolher caminhos mais informados e não perder o chão quando a banca perguntar sobre seus testes.

O que a análise estatística faz (e o que ela não faz)

Análise estatística é uma ferramenta para extrair informação de dados de forma sistemática e com controle do erro.

Ela permite: descrever características de uma amostra, verificar se diferenças entre grupos são maiores do que o esperado pelo acaso, testar se existe associação entre variáveis, estimar o tamanho do efeito de uma intervenção.

O que ela não faz: não substitui a interpretação do pesquisador, não prova causalidade por si só e não corrige problemas de coleta de dados. Um dado coletado de forma equivocada submetido a um teste sofisticado continua sendo um dado problemático.

Estatística descritiva: o ponto de partida

Antes de qualquer teste, a análise começa pela descrição dos dados.

Estatística descritiva resume e organiza as características da amostra. As ferramentas básicas são:

Para variáveis quantitativas (numéricas): média, mediana, desvio-padrão, mínimo, máximo, quartis. A escolha entre média e mediana depende da distribuição dos dados. Quando há valores extremos (outliers), a mediana representa melhor o centro da distribuição.

Para variáveis categóricas (nominais ou ordinais): frequências absolutas e relativas (porcentagens). Quando a variável é ordinal, também pode ser calculada a mediana das categorias.

Tabelas e gráficos de distribuição fazem parte da análise descritiva e ajudam a visualizar padrões antes de qualquer teste inferencial.

Estatística inferencial: o que muda quando você tem hipóteses

Se a pesquisa tem hipóteses a testar ou comparações a fazer, a estatística inferencial entra em cena.

A lógica básica é a seguinte: você coleta dados de uma amostra e quer fazer inferências sobre a população de onde ela veio. O teste estatístico verifica se o resultado observado na amostra é compatível com o acaso, ou se existe um efeito real.

Daí vem o conceito de valor p: a probabilidade de obter um resultado igual ou mais extremo ao observado se a hipótese nula fosse verdadeira. Por convenção adotada na maioria das ciências da saúde e humanas, p menor que 0,05 é considerado estatisticamente significativo.

Mas há um ponto importante que frequentemente é ignorado: significância estatística não equivale a relevância prática. Um resultado pode ser estatisticamente significativo (p muito pequeno) e ter tamanho de efeito clinicamente irrelevante. Por isso, além do valor p, é recomendável reportar o tamanho de efeito (d de Cohen, r, eta², entre outros dependendo do contexto).

Como escolher o teste estatístico

A escolha do teste depende de três perguntas:

Qual é o tipo das variáveis? Variáveis quantitativas (pressão arterial, escore de ansiedade, tempo) pedem testes diferentes de variáveis categóricas (sexo, diagnóstico, grupo).
Quantos grupos estão sendo comparados? Dois grupos: teste t ou Mann-Whitney. Três ou mais grupos: ANOVA ou Kruskal-Wallis. Medidas repetidas no mesmo participante: ANOVA para medidas repetidas ou Friedman.
Os dados seguem distribuição normal? Testes paramétricos (teste t, ANOVA, Pearson) assumem que os dados têm distribuição aproximadamente normal. Quando isso não acontece, os equivalentes não-paramétricos (Mann-Whitney, Kruskal-Wallis, Spearman) são mais adequados.

Testar a normalidade é parte da análise. Os testes de Shapiro-Wilk (para amostras menores) e Kolmogorov-Smirnov são os mais utilizados. Histogramas e gráficos Q-Q também ajudam a avaliar visualmente.

Para associação entre variáveis: correlação de Pearson (quantitativas com distribuição normal), Spearman (ordinais ou quantitativas sem normalidade), qui-quadrado (categorias).

O que a banca vai perguntar sobre estatística

Se você usou análise estatística na pesquisa, a banca vai perguntar sobre as escolhas. As perguntas mais comuns:

Por que você usou esse teste específico? A resposta precisa mencionar o tipo de variável, a distribuição dos dados e o número de grupos.

Como você verificou a normalidade? Aqui precisa aparecer o nome do teste utilizado (Shapiro-Wilk, por exemplo) e o resultado.

Qual é o significado prático do resultado encontrado? Significância estatística não responde isso. Tamanho de efeito responde.

Você considerou o tamanho amostral antes da coleta? Cálculo de tamanho amostral é uma das questões que aparece mais em bancas de ciências da saúde. Se você fez, explique como. Se não fez, saiba como justificar.

Softwares mais usados

Você não precisa fazer cálculos à mão. Existem softwares que realizam as análises. Os mais comuns no contexto acadêmico brasileiro:

SPSS: interface amigável, amplamente utilizado em ciências da saúde e psicologia. Requer licença, mas muitas instituições têm acesso.

R: gratuito, de código aberto, muito potente. Curva de aprendizado maior, mas comunidade extensa e documentação abundante.

Jamovi: gratuito, interface gráfica simples, voltado para quem quer a praticidade do SPSS sem o custo. Usa R por baixo.

JASP: gratuito, especializado em estatística bayesiana além da frequentista.

Excel: adequado para análises descritivas e algumas análises simples. Não é recomendado para análises estatísticas complexas pela limitação de testes e pela maior chance de erro.

Reportar resultados estatísticos com clareza

Saber calcular um teste é uma coisa. Saber reportar os resultados de forma que o leitor entenda é outra.

Para cada análise realizada, o texto precisa incluir: o nome do teste, os valores calculados relevantes (t, F, χ², r, dependendo do teste), os graus de liberdade quando aplicável, o valor p e o tamanho do efeito.

Um exemplo de reporte adequado: “Não foi encontrada diferença significativa no escore de ansiedade entre os grupos controle e intervenção (t(48) = 1,23; p = 0,22; d = 0,35).”

Esse padrão de reporte fornece ao leitor todas as informações necessárias para avaliar o resultado sem ter acesso aos dados brutos.

Tabelas de resultados devem ter títulos claros, unidades de medida explícitas e notas explicando abreviações ou asteriscos de significância. Uma tabela mal construída prejudica a leitura mesmo quando os dados são bons.

Tamanho amostral: calcular antes de coletar

Um dos aspectos mais frequentemente questionados pela banca em pesquisas quantitativas é o tamanho da amostra.

A pergunta é legítima: se a amostra é pequena demais, o estudo pode não ter poder estatístico suficiente para detectar um efeito real, mesmo que ele exista. Se é grande demais sem necessidade, representa desperdício de recursos.

O cálculo do tamanho amostral deve acontecer antes da coleta. Ele considera: o tamanho de efeito esperado (baseado na literatura), o nível de significância adotado (geralmente 0,05), o poder do teste desejado (geralmente 0,80 ou 80%) e o tipo de teste que será usado.

Existem softwares gratuitos para esse cálculo: o G*Power é o mais utilizado em ciências da saúde e psicologia, disponível gratuitamente. Para pesquisas com amostras de conveniência (comum em dissertações), a justificativa para o tamanho precisa estar no texto, mesmo que não tenha sido calculado a priori.

O que fazer quando os resultados não confirmam a hipótese

Resultado negativo (ou seja, não confirmação da hipótese) não é resultado ruim. É resultado científico.

A pressão para publicar apenas resultados positivos é um problema reconhecido na ciência, e um dos fatores que contribui para a crise de replicabilidade em algumas áreas. Estudos que não confirmam hipóteses são igualmente informativos e, em alguns casos, mais honestos.

Se os seus dados não encontraram o efeito esperado, o caminho é reportar isso com precisão e discutir as possíveis razões: tamanho amostral insuficiente para detectar efeito pequeno, problema de medição, hipótese inicial incorreta, ou ausência real do efeito na população estudada.

A discussão de resultados negativos demonstra maturidade metodológica e contribui para o campo de forma honesta.

Estatística é parte do argumento, não decoração

Termino com o ponto mais importante: os resultados estatísticos não falam por si mesmos.

Um qui-quadrado com p=0,03 informa que existe associação estatisticamente significativa entre duas variáveis. Mas o que isso significa para o campo de pesquisa? O que isso responde do problema inicial? Como dialoga com o referencial teórico?

Essas respostas são sua contribuição como pesquisadora. A estatística organiza os dados. A interpretação é o trabalho intelectual que dá sentido a eles.

Quando você entende isso, a estatística deixa de ser um obstáculo para se tornar parte do argumento que você está construindo.