Método

Dados Abertos de Pesquisa: Como Compartilhar e Citar

Entenda o que são dados abertos de pesquisa, por que compartilhar seus dados científicos importa e como citar dados de outros pesquisadores corretamente.

dados-abertos ciencia-aberta pesquisa-academica repositorios metodologia

O que são dados abertos e por que isso chegou até você

Vamos lá. Se você está no mestrado ou doutorado e ainda não ouviu falar de dados abertos de pesquisa, é questão de tempo. Agências de fomento, periódicos científicos e programas de pós-graduação estão cada vez mais perguntando: onde estão os dados que geraram esse resultado?

Dados abertos de pesquisa são, em termos simples, os dados que você coletou ou gerou durante sua investigação, disponibilizados publicamente para que outros pesquisadores possam consultá-los, verificá-los ou reutilizá-los. Podem ser planilhas com resultados de surveys, transcrições de entrevistas devidamente anonimizadas, imagens de microscopia, registros de observação, bases de dados construídas manualmente, scripts de análise, entre outros formatos.

A lógica por trás disso é a da ciência como bem público. Se a pesquisa foi financiada com recursos públicos, os resultados e os dados que os sustentam também deveriam ser acessíveis ao público. Faz sentido? É um argumento razoável.

Mas há mais do que ética envolvida. Quando você compartilha seus dados, aumenta a visibilidade da sua pesquisa, facilita citações, e contribui para que outros possam replicar ou expandir seu trabalho. Em algumas áreas, um conjunto de dados bem documentado pode ser tão citado quanto o artigo que o originou.

O que entra (e o que não entra) na categoria de dados abertos

Nem tudo que você gerou durante a pesquisa precisa, ou pode, ser compartilhado. É importante entender os limites.

Pode compartilhar:

  • Dados quantitativos anonimizados (resultados de questionários, escalas, testes)
  • Transcrições de entrevistas com identificação removida, após autorização dos participantes
  • Bases bibliométricas construídas para revisões sistemáticas
  • Scripts de análise estatística (R, Python, SPSS)
  • Materiais de coleta como roteiros de entrevista e instrumentos validados

Precisa avaliar antes de compartilhar:

  • Dados de pesquisa com seres humanos: exigem aprovação do CEP e, em muitos casos, TCLE específico para compartilhamento
  • Dados identificáveis: precisam de anonimização adequada
  • Dados obtidos por acordo de confidencialidade com instituições parceiras
  • Dados que envolvam propriedade intelectual de terceiros

A regra geral é: tudo que pode revelar a identidade de um participante ou comprometer um acordo de sigilo precisa de tratamento especial antes de ir a público.

Repositórios de dados: onde depositar

Olha só a variedade de opções disponíveis. Você não precisa criar nada do zero; existem repositórios específicos para dados de pesquisa, muitos deles gratuitos.

Zenodo (zenodo.org) é talvez o mais conhecido no Brasil. É mantido pelo CERN e aceita qualquer tipo de dado, atribui DOI automaticamente, é gratuito e aceita arquivos de até 50 GB. Ótimo ponto de partida para qualquer área do conhecimento.

Figshare (figshare.com) é outra opção bem consolidada, com interface amigável, DOI para cada item depositado e integração com vários sistemas de gestão de referências.

OSF (Open Science Framework, osf.io) vai além dos dados e permite que você registre seu projeto de pesquisa, pré-registre hipóteses, deposite materiais e dados, e compartilhe com colaboradores. Para quem trabalha com ciências humanas e sociais, tem se tornado uma referência.

Repositório Institucional: muitas universidades brasileiras mantêm repositórios próprios. Vale verificar se sua instituição tem um e se ele aceita conjuntos de dados (e não apenas teses e dissertações).

Repositórios temáticos: dependendo da sua área, podem existir repositórios especializados. Na saúde, por exemplo, o DATASUS já é uma referência para dados populacionais. Em genômica e bioinformática, o NCBI e o GenBank são padrão. Na educação, o INEP disponibiliza microdados de avaliações nacionais.

A escolha do repositório deve considerar três critérios principais: ele atribui DOI ao conjunto de dados? É de acesso permanente? É reconhecido pela comunidade da sua área?

Como organizar os dados antes de depositar

Depositar dados brutos sem documentação é quase inútil. Para que outros pesquisadores possam entender e usar o que você gerou, você precisa de um arquivo chamado de README ou dicionário de dados.

Esse arquivo descreve, no mínimo:

  • O que é cada variável ou campo (nome, tipo, unidade de medida)
  • Como os dados foram coletados (instrumento, período, local)
  • Quem participou da pesquisa (perfil geral, sem identificação)
  • Como os dados foram processados ou limpos antes do depósito
  • Qual software é necessário para abri-los
  • Qual licença se aplica ao conjunto de dados

Sobre licenças: as mais comuns para dados de pesquisa são as licenças Creative Commons. A CC BY (atribuição) permite qualquer uso desde que o autor seja citado. A CC BY-NC (não comercial) restringe o uso para fins não comerciais. A CC0 coloca o material em domínio público. Escolha a que fizer mais sentido para o seu contexto e, se houver dúvida, consulte sua instituição.

Nos dados quantitativos, prefira formatos abertos como CSV ou TSV em vez de formatos proprietários como XLS. Arquivos SPSS (.sav) e Stata (.dta) são aceitáveis se você incluir um dicionário em texto plano. Documentos qualitativos podem ser compartilhados em PDF anonimizado ou TXT simples.

Como citar dados de pesquisa de outras pessoas

Aqui está um ponto que muita gente ignora, mas que é cada vez mais cobrado: quando você usa dados de outra pesquisadora em seu trabalho, precisa citá-los corretamente, assim como citaria um artigo.

A estrutura básica de citação de dados é:

Sobrenome, Nome (Ano). Título do conjunto de dados. Nome do repositório. DOI ou URL.

Um exemplo real (estrutura fictícia para fins didáticos):

Santos, C. M. (2022). Dados de observação de salas de aula inclusivas no Ensino Médio. Zenodo. https://doi.org/10.5281/zenodo.xxxxxxx

Nas referências ABNT, ainda não existe uma norma específica consolidada para conjuntos de dados, mas a prática mais adotada é adaptar o modelo de documentos eletrônicos:

SANTOS, Carlos M. Dados de observação de salas de aula inclusivas no Ensino Médio. Zenodo, 2022. DOI: https://doi.org/10.5281/zenodo.xxxxxxx. Acesso em: 8 abr. 2026.

Se você usou microdados públicos (como os do INEP ou DATASUS), cite a fonte, o ano de referência dos dados e o link de acesso. Esses dados também precisam de citação adequada.

A tendência dos periódicos é exigir que os conjuntos de dados citados tenham DOI, o que reforça a importância de depositar em repositórios que atribuam esse identificador.

O Método V.O.E. e a cultura de dados abertos

No Método V.O.E., uma das premissas é que a pesquisa responsável começa com documentação cuidadosa desde o início do processo. Isso inclui planejar, desde a fase do projeto, o que será feito com os dados gerados.

Se você usa o V.O.E. para organizar sua escrita e sua pesquisa, a lógica dos dados abertos se encaixa naturalmente nesse processo: assim como você documenta suas decisões metodológicas, você também documenta seus dados. E assim como você organiza sua escrita em blocos claros e verificáveis, você organiza seus dados de forma que outro pesquisador possa revisá-los.

Pense nos dados abertos não como uma exigência burocrática, mas como uma extensão do rigor que você já pratica. Você não inventaria uma referência bibliográfica; também não deveria deixar seus dados em um HD externo que vai perder em cinco anos.

Pré-registro e dados abertos: a dupla que muda o jogo

Não confunda dados abertos com pré-registro, mas entenda que os dois andam juntos na agenda da ciência aberta.

O pré-registro é quando você registra, antes de coletar os dados, suas hipóteses, métodos e critérios de análise em uma plataforma como o OSF ou o AsPredicted. Isso protege contra o HARKing (formular hipóteses depois de ver os dados) e aumenta a confiança nos resultados.

Já os dados abertos são o produto final, o que você deposita depois que a pesquisa está concluída. Quando as duas práticas se somam, o ciclo fica completo: é possível verificar que a pesquisa foi conduzida como planejado e checar os resultados nos dados brutos.

Para quem está no mestrado e imagina que isso é coisa de pesquisador sênior, vale saber: registrar projetos no OSF não requer nem publicar na sequência. Você pode usar como caderno de bordo do seu projeto, com todos os benefícios da organização e zero pressão de exposição pública antes de estar pronto.

O que fazer agora

Se você ainda não pensou em dados abertos para sua pesquisa, aqui vão passos concretos:

Verifique se o seu TCLE atual inclui autorização para compartilhamento de dados anonimizados. Se não incluir, ajuste nos próximos projetos. Se for pesquisa documental ou bibliométrica, provavelmente não há impedimento para compartilhar.

Escolha um repositório antes de precisar. Conhecer o Zenodo agora, criar uma conta, explorar a interface, já ajuda muito quando chegar o momento de depositar.

Converse com sua orientadora sobre a política de dados do grupo de pesquisa. Em muitos grupos, há um protocolo já estabelecido sobre o que pode e o que não pode ser compartilhado.

E quando você for escrever seu artigo ou dissertação, inclua na seção de metodologia ou nas considerações finais uma declaração de disponibilidade de dados, mesmo que os dados ainda não estejam publicados. Periódicos cada vez mais pedem isso.

Dados bem cuidados são parte da sua herança científica. Daqui a dez anos, quando alguém quiser verificar ou construir sobre o que você fez hoje, seus dados vão dizer muito sobre o tipo de pesquisadora que você foi.

Perguntas frequentes

O que são dados abertos de pesquisa?
Dados abertos de pesquisa são os conjuntos de dados brutos, processados ou analisados que um pesquisador gerou durante seu estudo e que ficam disponíveis publicamente para outros pesquisadores verificarem, reutilizarem ou replicarem. Podem ser planilhas, transcrições, imagens, arquivos de áudio, registros de observação, entre outros formatos.
Sou obrigada a compartilhar meus dados de pesquisa?
Depende do contexto. Muitas agências de fomento (como a FAPESP e o CNPq) estão adotando políticas que recomendam ou exigem o compartilhamento de dados financiados com recursos públicos. Periódicos também estão adotando políticas de dados abertos. Se os dados envolvem pessoas, é preciso garantir anonimização e aprovação do CEP antes de compartilhar.
Como citar corretamente um conjunto de dados de outra pesquisadora?
A citação de dados segue um padrão semelhante ao de artigos: Sobrenome, Nome (Ano). Título do conjunto de dados. Nome do repositório. DOI ou URL. Exemplo: Silva, M. (2023). Dados de entrevistas com professoras do ensino fundamental. Zenodo. https://doi.org/10.5281/zenodo.xxxxxxx. Sempre prefira repositórios que atribuem um DOI ao conjunto de dados.
<