Posicionamento

Fabricação de Dados na Pesquisa: O Que Você Precisa Saber

Entenda o que é fabricação de dados em pesquisa científica, por que ela acontece, quais as consequências e como a integridade científica se constrói na prática.

fabricacao-de-dados integridade-cientifica ma-conduta-em-pesquisa etica-academica plagito-cientifico

Uma conversa que a academia prefere evitar

Vamos lá. Fabricação de dados é um desses temas que a academia tende a colocar debaixo do tapete. Fala-se de ética em pesquisa em termos gerais, de integridade científica como valor abstrato, mas a conversa sobre o que acontece quando alguém simplesmente inventa resultados? Essa raramente aparece de forma direta nos corredores de pós-graduação.

Isso é um problema.

Porque quando a conversa não acontece, pesquisadoras em formação ficam sem saber reconhecer o que é fabricação de dados, sem entender a extensão das consequências, e sem compreender por que a integridade científica não é uma questão de postura pessoal, mas de funcionamento da própria ciência como sistema.

Então vamos falar sobre isso.

O que é fabricação de dados, exatamente?

Fabricação de dados é a criação de informações que nunca existiram. Não é interpretação errada de dados reais. Não é análise inadequada. É inventar: registrar como observado o que nunca foi observado, como medido o que nunca foi medido, como coletado o que nunca foi coletado.

No campo científico internacional, a fabricação integra o que se chama de FFP (Fabrication, Falsification, Plagiarism), as três categorias de má conduta científica mais graves. Cada uma delas ataca um aspecto diferente da integridade da pesquisa:

Fabricação ataca a base de evidência: os dados sobre os quais os argumentos são construídos simplesmente não existem.

Falsificação ataca a fidelidade dos dados: os dados existiram, mas foram manipulados, selecionados ou alterados para produzir um resultado diferente do real.

Plágio ataca a autoria: o trabalho intelectual de outro é apresentado como próprio.

Das três, a fabricação é frequentemente descrita como a mais grave porque não apenas distorce o conhecimento científico, mas o constrói sobre o nada. Pesquisadoras que baseiam suas pesquisas em estudos com dados fabricados podem gastar anos de trabalho em uma direção que nunca teve fundamento.

Por que acontece?

Essa é a parte da conversa que mais incomoda, porque implica reconhecer que a fabricação de dados não é um comportamento exclusivo de “pessoas ruins” em ambientes distantes. Ela emerge em contextos específicos, sob pressões específicas, que são muito mais comuns do que se admite.

A pressão por publicação é o fator mais citado. O sistema acadêmico em muitas instituições e países avalia pesquisadores pelo número e impacto de publicações. Resultados negativos têm menor probabilidade de publicação. Resultados inconclusivos raramente chegam a periódicos de alto impacto. Esse ambiente cria incentivos perversos: pesquisadores que não encontram resultados “publicáveis” podem sentir pressão para produzi-los de outra forma.

Isso não justifica a fabricação. Explica o contexto em que ela ocorre.

Além da pressão por publicação, há situações de dependência hierárquica: estudantes de pós-graduação sob pressão de orientadores, pesquisadores juniores dependentes de aprovação de pesquisadores seniores para continuidade da carreira. Não é raro que casos de má conduta envolvam subordinados que sentiram que não tinham escolha.

Há também a zona cinza da negligência: pesquisadoras que não fabricam intencionalmente, mas que registram dados de forma descuidada, que selecionam apenas os resultados favoráveis para análise (um problema chamado p-hacking ou HARKing), ou que “ajustam” pequenos detalhes para que os resultados fiquem mais coerentes. Essa zona cinza não é fabricação no sentido estrito, mas alimenta a mesma crise de confiança.

O que acontece quando fabricação é descoberta

As consequências da fabricação de dados são sérias e duradouras. Elas operam em vários níveis.

No nível do artigo: o periódico emite uma retração. Retrações são públicas, aparecem na base de dados do artigo original, e ficam permanentemente vinculadas ao nome dos autores. O Retraction Watch, banco de dados que monitora retrações científicas, tem mais de 40 mil registros. Cada um representa não apenas um artigo removido, mas uma rede de pesquisas que precisam ser reavaliadas.

No nível da pesquisadora: desligamento institucional, perda de financiamentos e bolsas, proibição de submissão a determinados periódicos, processos em conselhos profissionais. Em áreas como medicina e farmacologia, onde pesquisas com dados fabricados podem ter impacto direto na saúde pública, pode haver consequências legais.

No nível do campo: outros pesquisadores que basearam estudos nos resultados fabricados precisam rever suas conclusões. Em alguns casos, políticas públicas foram construídas sobre base científica que depois se revelou fraudulenta. O custo coletivo é enorme.

No nível da confiança: cada caso de má conduta científica descoberto alimenta a desconfiança pública na ciência. Em um momento em que a credibilidade das instituições científicas é um ativo crítico para o debate sobre saúde, clima e tecnologia, esse custo não é abstrato.

A integridade científica não é postura, é estrutura

Aqui está o ponto que mais importa nessa conversa: integridade científica não é apenas uma questão de caráter individual. É uma questão de estrutura.

Pesquisadoras com alto senso ético, colocadas em ambientes com pressão extrema por resultados, prazos impossíveis e sem suporte adequado, podem tomar decisões que jamais tomariam em outro contexto. Isso não as absolve, mas indica que tratar a má conduta científica apenas como problema moral individual é insuficiente.

O que protege é: sistemas de revisão por pares robustos, práticas de ciência aberta (compartilhamento de dados brutos, pré-registro de hipóteses), ambientes institucionais onde resultados negativos têm valor e são comunicáveis, e culturas de orientação que não colocam o orientando em posição de dependência absoluta.

Para quem está no mestrado ou doutorado agora, a pergunta prática é: o que eu faço quando meus dados não mostram o que eu esperava? Essa pergunta não tem uma resposta técnica fácil, mas tem uma resposta ética clara: você registra o que encontrou, analisa o que encontrou, e reporta o que encontrou. Resultados negativos ou inconclusivos são dados. São contribuição. Não são fracasso.

Sobre os dados que “quase” confirmam

Uma conversa honesta sobre fabricação de dados não pode ignorar a zona cinza da manipulação estatística. Não é fabricação, mas pode ter efeito parecido.

P-hacking é a prática de testar múltiplas análises ou subgrupos até que alguma combinação produza um resultado estatisticamente significativo, sem declarar o número de análises realizadas. O resultado é relatado como se fosse o planejado desde o início.

HARKing (Hypothesizing After Results are Known) é a prática de formular as hipóteses da pesquisa após ver os resultados, apresentando-as como se fossem pré-formuladas.

Essas práticas não são fabricação, mas distorcem a literatura científica de formas cumulativas que têm sido chamadas de “crise de replicabilidade”: a descoberta de que muitos resultados publicados em diversas áreas não se reproduzem quando testados novamente.

A solução não é perfeição imediata, mas consciência: saber o que você está fazendo quando faz, declarar as decisões metodológicas tomadas ao longo do processo, e ser transparente sobre as limitações do que você encontrou.

O que é possível fazer, no nível pessoal

Para quem está em formação, algumas práticas concretas contribuem para integridade sem que sejam sobre “não fabricar dados” (o que você obviamente já sabe que não deve fazer):

Manter um diário de pesquisa com registro das decisões metodológicas tomadas ao longo do processo: por que você escolheu esse recorte temporal, por que excluiu determinados casos, quais análises exploratórias você fez antes de chegar à análise principal.

Compartilhar dados brutos com orientador(a) e pares antes de finalizar análises. Não por desconfiança mútua, mas porque olhos adicionais sobre os dados identificam erros que quem está imerso não vê.

Aprender a valorizar e comunicar resultados negativos. Um estudo bem desenhado que não confirma a hipótese original contribui para o campo, especialmente se publicado. A cultura que trata resultado negativo como fracasso é parte do problema.

Entender o que é e o que não é possível afirmar a partir dos seus dados. Resultados preliminares não são evidência definitiva. Correlação não é causalidade. Amostra pequena limita a generalização. Comunicar essas limitações com clareza não é sinal de fraqueza metodológica, é sinal de rigor.

Integridade como hábito

Vamos ser honestas: a maioria das pesquisadoras que começa o mestrado nunca vai fabricar dados. O risco real para a maior parte de vocês não é a má conduta intencional, é a deriva lenta de pequenas negligências que, somadas, comprometem a qualidade e a confiabilidade do trabalho.

A integridade científica não se constrói em um momento de grandes decisões. Ela se constrói nos pequenos hábitos: como você registra seus dados, como você documenta suas decisões, como você comunica suas limitações, como você responde quando os resultados não saem como esperado.

Isso está no centro do que defendemos no Método V.O.E. e em como pensamos sobre produção científica responsável: o rigor não é sobre a forma dos documentos que você entrega, é sobre a postura com que você conduz a pesquisa do começo ao fim.

A fabricação de dados é o extremo de um espectro. Mas o espectro inteiro existe. E entender onde ele começa é o primeiro passo para não percorrer nenhuma parte dele.

Perguntas frequentes

O que é fabricação de dados em pesquisa científica?
Fabricação de dados é a criação de resultados, observações ou medições que não foram efetivamente coletados durante a pesquisa. É considerada má conduta científica grave, junto com a falsificação (manipulação de dados existentes) e o plágio. Os três tipos constituem o que se chama internacionalmente de FFP: Fabrication, Falsification, Plagiarism.
Quais são as consequências da fabricação de dados para um pesquisador?
As consequências podem incluir retração do artigo publicado, desligamento da instituição, perda de financiamento, proibição de publicar em determinados periódicos, processos éticos em conselhos profissionais e, dependendo do campo, consequências legais. A retração de um artigo em bases indexadas é permanente e pública, comprometendo a reputação científica de forma duradoura.
Como identificar sinais de fabricação de dados em um artigo científico?
Pesquisadores que investigam integridade científica observam padrões como: distribuições estatísticas implausíveis, resultados demasiado perfeitos ou sem variabilidade esperada, impossibilidade de replicação, inconsistências entre tabelas e texto, e dados que parecem ter sido gerados e não coletados. A ciência aberta e o compartilhamento de dados brutos são ferramentas importantes de controle.
<