Posicionamento

Dados Abertos na Pesquisa: O Que Significa e Por Que Importa

O que são dados abertos na pesquisa científica, por que a academia discute isso com urgência e o que pesquisadora precisa saber sobre esse tema.

ciencia-aberta dados-de-pesquisa integridade-academica pos-graduacao

Uma conversa que a academia não pode mais adiar

Olha só: se você está na pós-graduação hoje, vai ouvir falar de dados abertos com uma frequência crescente. Nos editais de financiamento, nas políticas editoriais dos periódicos, nas exigências dos programas de pós-graduação. Não é modismo. É uma transformação real no modo como a ciência opera.

E vale entender do que se trata antes de precisar responder a um formulário ou se posicionar numa discussão do seu laboratório.

O que o movimento de dados abertos está dizendo

O argumento central do movimento de ciência aberta é simples: se a pesquisa é financiada com recursos públicos, os resultados deveriam ser públicos. E não apenas os resultados publicados em artigos, mas os dados que embasam esses resultados.

A ideia é que dados acessíveis permitem que outros pesquisadores verifiquem as análises, identifiquem erros, façam perguntas novas a partir dos mesmos dados, e construam conhecimento de forma mais eficiente do que se cada laboratório partisse do zero.

Isso não é utopismo científico. É uma resposta a problemas concretos que a ciência enfrentou nas últimas décadas: crises de replicabilidade em diversas áreas, casos de fabricação de dados que passaram despercebidos por anos, e desperdício de recursos quando pesquisas similares são conduzidas em paralelo por grupos que não têm acesso ao trabalho uns dos outros.

O que “dado aberto” significa na prática

Dado aberto não é simplesmente dado disponível. Para ser considerado aberto no sentido técnico do movimento, um dado precisa atender a alguns critérios que ficaram conhecidos pelos princípios FAIR: Findable (encontrável), Accessible (acessível), Interoperable (interoperável) e Reusable (reutilizável).

Na prática, isso significa que o dado precisa estar depositado em repositório público com identificador persistente (como um DOI), documentado com metadados que permitam entender o que é e como foi coletado, em formato que possa ser lido e processado por outros sistemas, e com licença que especifique o que pode ser feito com ele.

Um arquivo de Excel enviado por e-mail a quem pedir não é dado aberto. Um conjunto de dados depositado no Zenodo, OSF ou em repositório institucional, com documentação, licença Creative Commons e DOI, é.

Por que isso está chegando até você agora

Há alguns anos, o debate sobre dados abertos era mais restrito a determinadas áreas (ciências da vida, psicologia, física) e a pesquisadores em contextos de financiamento internacional. Isso está mudando.

Periódicos científicos estão adotando políticas de compartilhamento de dados como condição para publicação. Alguns pedem apenas que os autores declarem a disponibilidade dos dados mediante solicitação. Outros exigem o depósito em repositório como condição para aceitação do manuscrito. Os de mais alto impacto estão na segunda categoria com cada vez mais frequência.

Financiadores brasileiros estão acompanhando esse movimento. A FAPESP já incluiu exigências de plano de gestão de dados em algumas de suas modalidades. O CNPq tem debatido internamente políticas similares. Quem está na pesquisa agora precisa entender o que essas exigências significam operacionalmente.

O desconforto real: o que a pesquisadora perde com dados abertos

Seria desonesto não nomear os medos legítimos que existem nessa conversa.

O principal é o risco de ser antecipado. Se você deposita seus dados antes de publicar todos os resultados que planeja extrair deles, existe a possibilidade de outro grupo usar esses dados para publicar algo que você planejava publicar. Esse risco existe e é reconhecido.

Há também o trabalho adicional envolvido na documentação adequada dos dados para compartilhamento. Preparar um conjunto de dados de forma que outros pesquisadores possam entender e usar não é trivial. Exige tempo e atenção que competem com outras demandas do processo de pesquisa.

E há a questão dos dados sensíveis. Pesquisas com participantes humanos frequentemente geram dados que não podem ser simplesmente tornados públicos sem comprometer a privacidade dos participantes. O protocolo de anonimização adequado é um requisito ético antes de ser uma exigência técnica.

O posicionamento que defendo aqui

Transparência científica não é opcional para quem quer fazer ciência com integridade. Mas isso não significa que toda pesquisa deve ter todos os dados disponíveis imediatamente e sem restrições.

O que é razoável exigir: que pesquisadores saibam o que será compartilhado, quando e como, antes de começar a pesquisa. Que o plano de gestão de dados seja parte do planejamento, não uma reflexão tardia. Que dados que podem ser compartilhados sem riscos sejam compartilhados. Que dados sensíveis tenham protocolos claros de proteção.

O que não é razoável: exigir abertura irrestrita sem considerar as especificidades de cada área, sem reconhecer os riscos reais que pesquisadoras correm em contextos competitivos, e sem oferecer infraestrutura adequada de repositórios e suporte técnico.

Dados abertos como princípio, sim. Dados abertos como obrigação burocrática sem suporte, não.

O que você precisa saber operacionalmente

Se você está elaborando uma proposta de pesquisa que prevê financiamento externo, verifique as exigências do edital em relação à gestão de dados. Cada vez mais editais pedem um plano de gestão de dados (Data Management Plan ou DMP) junto com a proposta.

Se você está escrevendo um artigo para um periódico que exige compartilhamento de dados, entenda o que aquele periódico especificamente pede: dados brutos, dados processados, scripts de análise, ou alguma combinação.

Se você está num programa que está desenvolvendo sua política de dados abertos, é o momento de entender qual é essa política e o que ela significa para o tipo de pesquisa que você faz.

Repositórios como o Zenodo, o OSF (Open Science Framework) e o Figshare são gratuitos, amplamente reconhecidos e aceitos pela maioria dos periódicos e financiadores. Saber como depositar dados neles é uma habilidade prática que vai ser cada vez mais necessária.

Dados abertos e integridade científica: a conexão que importa

O argumento mais forte para dados abertos não é a eficiência da ciência. É a integridade.

Quando os dados de uma pesquisa são verificáveis, o risco de fabricação e falsificação diminui. Não elimina, porque dados podem ser manipulados antes do depósito, mas cria um nível adicional de responsabilidade que aumenta o custo de práticas desonestas.

Ciência que não pode ser verificada não é ciência. Essa é uma posição que muitos pesquisadores que resistem ao movimento de dados abertos não conseguem refutar, apenas encontrar razões para adiar.

E adiar, como a história recente da ciência mostrou em vários casos de alto perfil, tem um preço que vai além dos pesquisadores envolvidos. Vai até a confiança pública na ciência como instituição.

Se você quer explorar mais sobre o debate de ciência aberta e seus desdobramentos éticos, tem mais discussões sobre isso aqui no blog em posts relacionados ao pilar de IA e ética e sobre integridade acadêmica.

Como se preparar agora, independentemente do que seu programa exige hoje

Independentemente do que o seu programa de pós-graduação ou o seu orientador exige agora, algumas práticas valem ser adotadas desde o início da pesquisa porque facilitam o trabalho no futuro.

Documente os dados ao longo da coleta, não só no final. Um caderno de laboratório detalhado, um registro das decisões metodológicas, um dicionário das variáveis com suas definições operacionais: esses elementos são necessários para qualquer análise séria e se tornam a base da documentação para compartilhamento.

Organize os arquivos de dados de forma que outra pessoa possa entendê-los sem precisar te perguntar nada. Nomes de arquivos descritivos, pastas com lógica clara, scripts de análise comentados. Isso ajuda você mesma quando volta a um dado após meses afastada, e ajuda qualquer pessoa que precise verificar ou usar esses dados no futuro.

Pense sobre os dados sensíveis desde o protocolo. Se sua pesquisa envolve participantes humanos, o protocolo de anonimização precisa ser planejado antes da coleta, não depois. O comitê de ética precisa aprovar a forma como você vai tratar e eventualmente compartilhar os dados.

Dados abertos não são uma tendência que vai passar. São parte de uma transformação mais ampla no modo como a ciência funciona e é avaliada. Entender essa transformação agora coloca você em melhor posição para navegar as exigências crescentes que virão.

Perguntas frequentes

O que são dados abertos na pesquisa científica?
Dados abertos são conjuntos de dados de pesquisa disponibilizados publicamente para que outros pesquisadores possam acessar, verificar e reutilizar. Fazem parte do movimento de ciência aberta, que defende maior transparência no processo científico. Um dado aberto precisa ser acessível, legível por máquina, bem documentado e licenciado de forma que permita reuso.
Os financiadores obrigam o compartilhamento de dados de pesquisa?
Cada vez mais sim. Agências financiadoras importantes, incluindo o NIH nos EUA e alguns editais da FAPESP e do CNPq no Brasil, estão exigindo planos de gestão de dados como parte das propostas de financiamento, e algumas já exigem o depósito dos dados em repositórios públicos como condição para prestação de contas.
Compartilhar dados de pesquisa não coloca meu trabalho em risco?
É uma preocupação legítima, mas há formas de mitigá-la. Dados podem ser compartilhados após a publicação dos resultados principais, ou com embargo de tempo definido. Dados sensíveis (com informações pessoais identificáveis) têm protocolos específicos de anonimização. O planejamento adequado do que será compartilhado, como e quando é parte da gestão responsável da pesquisa.

Leia também

Receba estratégias de escrita acadêmica direto no seu feed

Siga a Dra. Nathalia no YouTube e Instagram para conteúdo gratuito sobre o Método V.O.E.