IA para categorizar respostas abertas em pesquisas
Entenda como usar inteligência artificial para categorizar respostas abertas de questionários sem perder o rigor qualitativo da análise científica.
A tarefa que consome horas e ninguém fala sobre ela
Olha só: você aplicou um questionário. Tinha umas cinco perguntas fechadas e três abertas. As fechadas você tabulou em vinte minutos. As abertas? Estão te olhando há dias.
Respostas abertas são assim: ricas, bagunçadas, cheias de nuance. E quando você tem 200, 300, 500 respostas, ler e categorizar cada uma manualmente é um trabalho exaustivo que come tempo precioso que você poderia estar usando para escrever.
A questão não é se você deveria usar IA para isso. A questão é como usar sem trair o rigor da sua análise.
O que a IA pode fazer (de verdade)
Antes de decidir sobre usar ou não, vale entender o que a IA realmente consegue fazer nesse contexto.
Identificar padrões recorrentes: modelos de linguagem são bons em perceber que várias respostas estão falando sobre o mesmo tema com palavras diferentes. Isso acelera o primeiro mapeamento.
Sugerir categorias iniciais: você pode pedir a uma IA que agrupe respostas similares e proponha nomes para os grupos. Não é a categorização final, mas é um scaffolding para você trabalhar em cima.
Identificar casos discrepantes: respostas que fogem dos padrões mais comuns tendem a ser as mais interessantes analiticamente. A IA pode ajudar a sinalizar o que está fora do esperado.
Reduzir o tempo de leitura inicial: em vez de ler cada resposta do zero, você pode pedir um resumo agrupado por similaridade temática e depois aprofundar nas respostas que merecem mais atenção.
O que a IA não faz, por mais sofisticada que seja: ela não entende o contexto da sua pesquisa. Ela não sabe o que você definiu como unidade de análise. Ela não conhece os pressupostos teóricos que guiam o que é relevante ou irrelevante na sua investigação. Isso é o seu trabalho.
O problema de terceirizar a categorização
Tem uma tentação real de simplesmente jogar as respostas na IA e pedir que ela categorize tudo. Rápido, organizado, acabou.
O problema metodológico é sério: categorização não é uma tarefa neutra. Ela carrega decisões analíticas. Quando você decide que “não tenho tempo” e “fico sobrecarregado” vão para a mesma categoria de “dificuldades de gestão de tempo”, você está fazendo uma escolha teórica. A IA não faz escolhas teóricas. Ela faz agrupamentos estatísticos.
Se você aceitar essas categorias sem revisão crítica, estará tomando decisões analíticas sem saber que está tomando. Isso é o oposto de rigor.
Além disso, há outro problema prático: se você não revisar as categorias e alguém na banca perguntar por que tal resposta foi incluída em determinada categoria, você não terá resposta. Porque não foi você que decidiu.
Como usar de forma defensável
Defensável, aqui, significa: se alguém perguntar na banca como você analisou os dados, você consegue explicar cada decisão.
Passo 1: defina suas categorias teóricas primeiro. Antes de qualquer coisa, defina com base na teoria e nos objetivos da pesquisa quais dimensões você está buscando. Se estiver estudando percepção de qualidade de serviço, quais categorias fazem sentido teoricamente? Esse trabalho é seu, não da IA.
Passo 2: use a IA para pré-classificar. Com as categorias definidas, peça à IA que classifique as respostas segundo aquelas categorias. Dê as definições operacionais de cada categoria. Contextualize o que é a pesquisa. Quanto mais contexto você der, mais útil será o resultado.
Passo 3: revise sistematicamente. Não amostras. Todo o conjunto, pelo menos uma vez. Veja onde a IA acertou e onde errou. Corrija. Ao fazer isso, você vai perceber onde as suas categorias precisam ser refinadas ou onde surgem subcategorias que você não tinha previsto.
Passo 4: documente tudo. No seu método, registre que você usou IA como apoio na pré-classificação, quais ferramentas usou, como foi o processo de revisão e validação. Isso não enfraquece a pesquisa. Fortalece, porque demonstra transparência.
Passo 5: faça um teste de confiabilidade interavaliador (se aplicável). Para pesquisas que exigem rigor alto, peça para um segundo avaliador classificar uma amostra das respostas e compare com o resultado final. Isso existe exatamente para garantir que as categorias não dependem de uma única perspectiva.
Ferramenta prática: como fazer o prompt certo
A qualidade do que a IA devolve depende diretamente do que você pede. Um prompt vago gera categorias vagas.
Um prompt mais útil tem:
- Contexto da pesquisa: o que você está estudando, qual o público respondente, qual a pergunta que gerou essas respostas
- Categorias que você quer usar (se já tiver definido): com definições operacionais claras
- Instrução sobre o que fazer com respostas ambíguas: categorizar na mais próxima? Sinalizar para revisão?
- Formato do output: você quer a resposta original com a categoria ao lado? Quer uma tabela? Um agrupamento narrativo?
Exemplo de prompt melhor do que “categorize essas respostas”:
“Estou analisando 200 respostas à pergunta ‘O que te levou a procurar a pós-graduação?’ de um estudo sobre motivação acadêmica. Preciso classificar cada resposta em uma das seguintes categorias: [categoria A + definição], [categoria B + definição], [categoria C + definição]. Se a resposta contiver elementos de mais de uma categoria, indique ambas. Se não se enquadrar em nenhuma, marque como ‘indefinida’. Para cada classificação, explique brevemente o motivo.”
Esse tipo de prompt gera saídas muito mais úteis para revisão do que um pedido genérico.
E a questão ética: preciso declarar que usei IA?
Sim. Em pesquisa, transparência metodológica não é opcional. Se a IA foi parte do seu processo de análise, isso vai no método. O campo ainda está construindo normas específicas sobre isso, mas o princípio é o mesmo de sempre: qualquer ferramenta ou técnica que influencie seus resultados precisa ser descrita e justificada.
Isso não é uma punição. É o que torna a pesquisa verificável. Se outro pesquisador quiser replicar seu estudo, precisa saber o que você fez. A IA está sendo usada em pesquisa do mundo inteiro agora. Declarar o uso não é uma fraqueza metodológica. Esconder é que pode ser.
No contexto do Método V.O.E., pensar sobre uso de IA com transparência faz parte de uma escrita acadêmica consciente. A ferramenta serve ao processo, não o substitui.
Dois erros opostos para evitar
Na prática, pesquisadores tendem a cair em um de dois extremos quando o assunto é IA e análise qualitativa.
O primeiro extremo: rejeitar completamente. “IA não tem lugar em pesquisa qualitativa.” Essa posição ignora que instrumentos de apoio à análise sempre existiram. Você usa software de análise qualitativa como ATLAS.ti ou MAXQDA? Eles também fazem agrupamentos automáticos, identificam co-ocorrências, criam redes semânticas. A IA é mais um instrumento na caixa. O que importa é como você usa.
O segundo extremo: delegar sem critério. Jogar tudo na IA, aceitar o resultado e passar para a escrita sem revisar. Isso é problemático por razões que já discutimos: a análise deixa de ser sua, as categorias não têm fundamento teórico consciente, e você não consegue defender suas escolhas.
O caminho útil está no meio: usar a IA para o que ela faz bem (identificar padrões, organizar grandes volumes, sinalizar divergências) e manter para si o que só você pode fazer (decidir o que é teoricamente relevante, interpretar o contexto, fazer as conexões com a literatura).
O que fazer quando as categorias não fecham
Tem uma situação específica que aparece com frequência quando você começa a categorizar respostas abertas: uma parcela das respostas não se encaixa em nenhuma das categorias que você definiu previamente.
Isso não é um problema. É informação.
Quando 15% das suas respostas não cabem nas categorias teóricas que você definiu, há duas possibilidades: ou aquelas respostas são ruído (respostas fora do escopo, mal interpretadas, etc.), ou elas estão apontando para uma dimensão que você não havia previsto.
A segunda possibilidade é a mais interessante. Esses casos são candidatos a subcategorias emergentes, o que nas abordagens qualitativas mais fundamentadas é um sinal de que você está de fato explorando os dados e não apenas confirmando o que já sabia antes de coletar.
A IA pode ajudar a identificar esses casos. Mas é você quem decide o que fazer com eles.
Fechando
Respostas abertas são a parte da pesquisa que a análise automática ainda não consegue substituir. Mas ela pode ajudar muito no trabalho preliminar, naquele momento em que você tem 400 respostas e não sabe por onde começar.
Use a IA para agilizar o mapeamento inicial. Mantenha o controle analítico nas suas mãos. Documente o processo. E quando alguém perguntar como você analisou os dados, você vai conseguir responder com clareza, passo a passo.
Isso é rigor. Com ou sem IA.