GPower: Como Calcular o Tamanho da Amostra para Pesquisa
Entenda o que é o GPower, para que serve e como interpretar os principais conceitos de cálculo amostral: tamanho de efeito, poder estatístico e erro tipo I.
O que é tamanho de amostra e por que precisar calcular antes
Vamos lá. Uma das perguntas mais comuns em dissertações de mestrado e doutorado é: “Quantas pessoas eu preciso entrevistar?” ou “Quantos casos minha amostra precisa ter?” Para pesquisas quantitativas, essa não é uma pergunta que se responde na intuição ou escolhendo um número “razoável”. Existe um cálculo para isso.
O GPower é o software mais usado para esse cálculo. Ele é gratuito, desenvolvido por pesquisadores da Universidade de Düsseldorf, e funciona nos principais sistemas operacionais. Se você está desenhando um estudo quantitativo, vai precisar dele antes da coleta de dados.
A lógica por trás do cálculo amostral é esta: um estudo com amostra pequena demais pode não detectar um efeito real mesmo que ele exista. Um estudo com amostra grande demais é desperdício de recursos. O cálculo amostral ajuda a encontrar o número mínimo de participantes que torna o estudo capaz de detectar o que você quer detectar.
Os quatro conceitos que o GPower usa
Para usar o GPower, você precisa entender quatro conceitos que ele trabalha. São eles:
Tamanho de efeito (effect size). É a magnitude da diferença, relação ou associação que você espera encontrar. Um tamanho de efeito pequeno significa que a diferença entre grupos ou a correlação entre variáveis é modesta. Um tamanho de efeito grande indica uma relação ou diferença mais expressiva. Cohen definiu convenções amplamente usadas: para d (diferença entre duas médias), pequeno = 0,2, médio = 0,5, grande = 0,8. Para r (correlação), pequeno = 0,1, médio = 0,3, grande = 0,5.
Poder estatístico (power). É a probabilidade de que o teste detecte um efeito quando ele de fato existe na população. O padrão recomendado é 0,80 (80%), o que significa que o estudo tem 80% de chance de detectar o efeito se ele existir. Para estudos mais críticos, usa-se 0,90 ou 0,95.
Nível de significância (alpha). É a probabilidade de concluir que existe um efeito quando na verdade ele não existe (erro tipo I). O valor padrão é 0,05, que significa 5% de chance de falso positivo.
Tamanho amostral (n). É o número de participantes ou observações. Esse é geralmente o que você quer calcular, a partir dos outros três.
Esses quatro conceitos são interdependentes. No GPower, você define três e o programa calcula o quarto.
Como o GPower funciona na prática
O GPower tem uma interface com menus, não linha de comando. Depois de instalar (download gratuito em gpower.hhu.de), você usa a seguinte sequência:
Escolha o teste estatístico. O menu “Test family” permite selecionar o tipo de teste: t tests, F tests (ANOVA, ANCOVA, regressão), correlação, qui-quadrado, entre outros. A escolha depende do seu delineamento de pesquisa.
Defina o tipo de análise. Em geral, você vai usar “A priori” quando quer calcular o tamanho amostral antes da coleta. Existe também “Post hoc” (para calcular o poder de um estudo já feito) e “Sensitivity” (para calcular o tamanho de efeito mínimo detectável para uma dada amostra).
Insira os parâmetros. Você insere o alpha (geralmente 0,05), o poder desejado (geralmente 0,80) e o tamanho de efeito. O GPower então calcula o n necessário.
Interprete o output. O GPower retorna o tamanho amostral total e por grupo, além de informações sobre o poder calculado e outros parâmetros. Também gera um gráfico de poder que pode ser incluído como figura na dissertação.
Como definir o tamanho de efeito
Esse é o ponto onde muitos estudantes travam: “Mas eu não sei qual vai ser o tamanho de efeito da minha pesquisa, é justamente o que eu vou investigar.”
Exato. Por isso o cálculo amostral é prospectivo, não retrospectivo. Você está estimando. As principais fontes para essa estimativa são:
Estudos anteriores na sua área. Se outros pesquisadores investigaram relações similares às suas, os efeitos reportados por eles são a melhor referência. Revise a literatura e note os tamanhos de efeito reportados.
Convenções de Cohen. Se não houver literatura suficiente, use as convenções de Cohen para definir o tamanho de efeito que considera clinicamente ou praticamente significativo. Para estudos exploratórios, pode-se usar efeito médio como referência.
Piloto. Em alguns casos, um estudo piloto com amostra pequena fornece estimativas iniciais que fundamentam o cálculo principal.
A tendência conservadora é usar um tamanho de efeito menor, o que resulta em amostras maiores. Isso aumenta as chances de detectar efeitos reais, mas pode ser inviável dependendo dos recursos disponíveis.
Erros comuns no cálculo e na apresentação
Calcular depois da coleta. O cálculo amostral é pré-registro, não justificativa post hoc. Calcular o tamanho amostral depois de já ter coletado os dados e ajustar os parâmetros para que o n real “passe” no cálculo é uma prática questionável que pode ser apontada na revisão por pares.
Não relatar o método de cálculo na dissertação. A metodologia do seu estudo deve incluir como você calculou o tamanho amostral: software usado, versão, parâmetros (alpha, poder, tamanho de efeito) e referência do tamanho de efeito adotado.
Confundir poder com significância. Poder estatístico (1 - beta) é diferente de significância (alpha). São conceitos distintos que se referem a erros diferentes.
Usar n menor do que o calculado sem justificativa. Se a coleta resultou em amostra menor do que o calculado (por dificuldades de recrutamento, por exemplo), isso deve ser declarado como limitação e o poder real do estudo deve ser recalculado com o n obtido.
GPower para diferentes tipos de estudo
O GPower cobre a maioria dos designs quantitativos usados em pesquisas acadêmicas:
Para comparação entre dois grupos (teste t independente), você insere o d de Cohen, alpha, poder e o GPower retorna o n por grupo.
Para ANOVA (comparação entre três ou mais grupos), usa-se o f de Cohen como tamanho de efeito.
Para correlação (como Pearson ou Spearman), usa-se r como tamanho de efeito.
Para regressão múltipla, usa-se f² e o número de preditores deve ser informado.
Para qui-quadrado (estudos de associação entre variáveis categóricas), usa-se w como tamanho de efeito.
Em todos os casos, a lógica é a mesma: você define o que quer detectar, com que confiança, e o GPower diz quantos casos precisa.
O que colocar na dissertação sobre o cálculo amostral
O trecho de metodologia sobre cálculo amostral deve informar:
- O software e versão utilizados
- O tipo de análise realizada no software (a priori, bilateral/unilateral)
- Os valores de alpha e poder adotados (com justificativa se diferente de 0,05 e 0,80)
- O tamanho de efeito adotado e sua fonte (literatura, convenção de Cohen)
- O tamanho amostral resultante do cálculo
- Se a amostra obtida difere do calculado, explique por quê
Esse nível de detalhe é o que permite que outros pesquisadores repliquem seu raciocínio e que revisores e membros da banca avaliem a adequação do seu delineamento.
Para mais detalhes sobre como organizar a seção de metodologia no seu projeto de pesquisa, o post sobre o Método V.O.E. traz uma perspectiva sobre como estruturar cada fase da escrita acadêmica com clareza e consistência.
Cálculo amostral como responsabilidade metodológica
Faz sentido? Um estudo com amostra subdimensionada pode gerar resultados inconclusivos, desperdiçar o trabalho de pesquisadores e participantes, e contribuir para o fenômeno de publicação de estudos com poder insuficiente que polui a literatura científica com achados que não se replicam.
O cálculo amostral não é burocracia. É parte do compromisso com a qualidade da pesquisa. O GPower torna esse cálculo acessível, gratuito e bem documentado. A barreira de entrada é baixa. O impacto metodológico, alto.