IA para Calcular Amostra e Poder Estatístico
Como usar IA para entender cálculo amostral e poder estatístico na sua pesquisa. O que a IA pode explicar, onde ela falha e quais ferramentas usar de verdade.
A pergunta que trava mais metodologias
Olha só uma situação que acontece muito mais do que deveria: a mestranda chegou na fase de coleta, já tem o instrumento, já sabe onde vai aplicar, e alguém da banca ou do comitê de ética pergunta: “Como você justifica o tamanho da sua amostra?”
E aí vem o silêncio.
Cálculo amostral e poder estatístico são dois dos conceitos mais mal compreendidos na pós-graduação brasileira, especialmente em programas das ciências humanas e sociais aplicadas. Não é burrice de ninguém, é que raramente alguém ensina isso de forma acessível.
A IA entrou nessa conversa como um atalho tentador. Mas como em outros pontos metodológicos, o atalho tem armadilhas que você precisa conhecer.
O que é tamanho de efeito e por que você precisa saber isso antes do cálculo
Antes de falar de cálculo amostral, preciso falar de tamanho de efeito. Porque sem isso, qualquer calculadora vai te dar um número sem sentido.
Tamanho de efeito é o quanto você espera que o fenômeno que está estudando seja forte ou perceptível. Em termos estatísticos, é a diferença entre grupos, a correlação esperada, ou o quanto sua variável independente vai explicar da variável dependente.
Na prática, na maioria das pesquisas em ciências humanas, você não sabe exatamente qual tamanho de efeito esperar. O que você pode fazer é buscar na literatura da sua área: estudos similares ao seu reportam quais tamanhos de efeito? Se a maioria encontra correlações em torno de 0,30, você pode usar isso como referência.
As convenções de Cohen, Jacob Cohen, que propôs uma classificação amplamente usada, dividem os tamanhos de efeito em pequeno, médio e grande para os principais testes. Para correlação de Pearson: pequeno = 0,10, médio = 0,30, grande = 0,50. Para diferença entre médias (d de Cohen): pequeno = 0,20, médio = 0,50, grande = 0,80.
Se você não tem referência na literatura para o seu contexto específico, usar efeito médio é uma escolha conservadora e defensável.
GPower: a ferramenta gratuita que você deveria conhecer
O GPower é um software gratuito desenvolvido pela Universidade de Düsseldorf que faz cálculo de poder estatístico e tamanho amostral para dezenas de testes diferentes. É o padrão usado em pesquisas na área de saúde, psicologia e ciências sociais no mundo todo.
Você define: o tipo de teste estatístico que vai usar, o tamanho de efeito esperado, o nível de alfa (geralmente 0,05), o poder desejado (geralmente 0,80) e a direção do teste (uni ou bicaudal). O GPower calcula o N mínimo para essas condições.
O resultado precisa ser reportado na sua metodologia. O texto padrão vai mais ou menos assim: “O tamanho amostral mínimo foi calculado com o software GPower 3.1, utilizando análise de [tipo de teste], tamanho de efeito [valor] (baseado em [referência da literatura]), alfa de 0,05 e poder estatístico de 0,80, resultando em um N mínimo de [X] participantes.”
Isso é o que sua banca e seu comitê de ética esperam ver.
Onde a IA ajuda nesse processo
Aqui está o ponto central: a IA pode ser extremamente útil para entender os conceitos e para preparar os parâmetros do cálculo. Mas o cálculo em si precisa ser feito no GPower ou em calculadora equivalente.
O que a IA faz bem:
Explicar o que é cada parâmetro e por que importa. Se você digitar para o ChatGPT “explique o que é tamanho de efeito no contexto de um teste t independente”, você vai receber uma explicação clara e geralmente precisa. Isso ajuda a entender o que você vai inserir no GPower.
Ajudar a interpretar os resultados. Você rodou o GPower, tem os números, mas não sabe o que escrever. Você pode descrever os parâmetros que usou para a IA e pedir ajuda para redigir o parágrafo metodológico. Isso funciona bem.
Sugerir a literatura relevante para justificar o tamanho de efeito. Se você diz “estou fazendo pesquisa sobre satisfação de alunos em EaD e preciso de referências que reportem tamanho de efeito para este contexto”, a IA pode indicar direções para sua busca. Mas confirme as referências: modelos de linguagem inventam títulos de artigos que não existem.
O que a IA não deve fazer:
Calcular diretamente o tamanho amostral. Se você pedir “calcule o N para um teste t com efeito médio e poder 0,80”, o modelo pode fornecer um número. Mas esse número não é confiável porque o modelo não usa as tabelas e fórmulas do GPower. Ele estima. E estimativa em cálculo amostral pode resultar em estudo subdimensionado ou superdimensionado.
Criar referências para o tamanho de efeito. Sempre que a IA citar artigos ou manuais específicos como fonte para um tamanho de efeito, verifique a existência e o conteúdo real do artigo antes de usar como referência.
O poder estatístico nas pesquisas qualitativas
Aqui vai um ponto que confunde muita gente: poder estatístico no sentido formal é um conceito de pesquisa quantitativa. Em pesquisas qualitativas, você não faz cálculo amostral da mesma forma.
Em pesquisas qualitativas, a justificativa do tamanho da amostra é baseada em outros critérios: saturação teórica, intencionalidade da amostra, representatividade dos casos em relação ao fenômeno estudado.
O que a IA pode ajudar em pesquisa qualitativa: explicar os critérios de definição de amostra intencional, ajudar a redigir a justificativa metodológica do tamanho da amostra, e discutir o que é saturação teórica e como ela é determinada.
Para pesquisa mista, você precisa calcular o tamanho amostral para a componente quantitativa e justificar separadamente a componente qualitativa.
Poder estatístico post hoc: quando o estudo já foi feito
Existe uma prática problemática que alguns pesquisadores adotam: calcular o poder estatístico depois da coleta de dados, usando os resultados obtidos como parâmetros. Isso se chama cálculo post hoc de poder.
O problema é que esse cálculo é circularidades: você obteve p>0,05, calcula o poder com o tamanho de efeito encontrado, e descobre “poder baixo” como justificativa para o resultado não significativo. Mas esse raciocínio é falho. O resultado não significativo pode ser genuíno.
A comunidade estatística tem criticado fortemente o uso de poder post hoc como justificativa para resultados nulos. A IA pode não te alertar sobre isso, e alguns tutoriais online tratam isso como prática normal. Não é.
O cálculo de poder deve ser feito antes da coleta, na fase de planejamento do estudo. Isso é o que garante que seu estudo tem capacidade de detectar o efeito que você espera encontrar.
Comitês de ética e o cálculo amostral
Para pesquisas que envolvem seres humanos, o comitê de ética frequentemente exige a justificativa do tamanho amostral como parte do protocolo de pesquisa. Não como formalidade, mas porque a exposição de participantes a riscos e ao tempo demandado por uma pesquisa precisa ser proporcional ao potencial de geração de conhecimento.
Uma amostra subdimensionada pode não gerar resultados confiáveis. Uma amostra superdimensionada expõe mais participantes do que o necessário.
Ter o cálculo bem feito e bem documentado não é burocracia: é responsabilidade ética com quem vai participar da sua pesquisa.
Como abordar isso no texto da dissertação
A seção de metodologia precisa ter um parágrafo claro sobre o tamanho amostral. Esse parágrafo precisa incluir: o tipo de análise que motivou o cálculo, os parâmetros usados (tipo de efeito, alfa, poder), o software ou método usado para o cálculo, o N resultante, e o N real obtido com a coleta.
Muitos pesquisadores calculam o mínimo e coletam acima desse número por precaução de perdas. Isso é legítimo e deve ser mencionado.
A IA pode ajudar a redigir esse parágrafo depois que você tem os dados do GPower. O que ela não pode é fornecer esses dados. Essa ordem importa.
Para mais sobre uso de IA em procedimentos metodológicos específicos, veja os posts sobre IA em pesquisa survey e IA em pesquisa mista.