Links

Dataverse

Software aberto para repositórios de dados de pesquisa [https://dataverse.org/]

1.1. Sobre o projeto Dataverse

O software Dataverse [https://dataverse.org/] é uma solução Web, de código-fonte aberto, implementado com o intuito de armazenar, compartilhar, publicar, explorar dados de pesquisa. Trata-se de um repositório de dados de pesquisa. O software facilita a disponibilização de dados, permitindo a replicação de pesquisas com mais facilidade. Pesquisadores, periódicos, autores de dados, editores, distribuidores de dados e instituições afiliadas recebem crédito acadêmico e visibilidade na web.
Um repositório de dados Dataverse é composto por uma instalação do software que pode hospedar várias comunidades de dados também chamadas de Dataverses. Cada comunidade de dados (Dataverses) contém conjuntos de dados (Datasets), que, por sua vez, são compostos por conjunto de dados de pesquisa, seus respectivos metadados descritivos e documentações referentes. Uma comunidade de dados (Dataverses) também pode conter outras sub-comunidades de dados (Dataverses).
Figura 1 - Diagrama semântico do Dataverse e Dataset no Dataverse 4.0
Fonte: Quingley (2016).
A motivação central do software Dataverse é automatizar grande parte do trabalho do arquivista profissional, fornecer serviços de armazenagem e garantir o crédito de autores de dados de pesquisa.

1.2. Histórico

O software Dataverse vem sendo desenvolvido pelo Instituto Harvard de Ciências Sociais Quantitativas (IQSS), mantido em seu repositório de códigos-fonte aberto em: https://github.com/IQSS/dataverse, para permitir a colaboração de desenvolvedores de todo o mundo. O software Dataverse foi construído com base na experiência do projeto anterior de Virtual Data Center (VDC), executado no período de 1999 a 2006 como uma colaboração entre o Data Center Harvard-MIT (agora parte do IQSS) e a Biblioteca da Universidade de Harvard.
Figura 2 - Evolução temporal da Dataverse
Fonte: Adaptado pelos autores de Quingley (2016).

1.3. Sobre o software Dataverse

O software Dataverse é um aplicativo desenvolvido em Web Java Enterprise Edition (EE) fornecido como um arquivo de WAR (arquivo da Web). Desenvolvido em sua maior parte na linguagem Java, utiliza o servidor de aplicação Glassfish como seu serviço de back-end.

1.3.1 Recomendações para instalação do Dataverse:

  1. 1.
    Linux: RHEL / CentOS 7 é o sistema operacional recomendado, segundo a documentação oficial do Dataverse disponível em: http://guides.dataverse.org/en/latest/installation/prerequisites.html
  2. 2.
    Glassfish 4.1: é um servidor de aplicativos Java EE onde o aplicativo Dataverse (arquivo war) deve ser instalado.
  3. 3.
    PostgreSQL 9.6: é o banco de dados relacional utilizado.
  4. 4.
    Solr 7.7.2: um mecanismo de pesquisa. Um esquema específico do Dataverse é fornecido.
  5. 5.
    Apache: servidor web utilizado para a instalação do Dataverse que atua como um proxy para as aplicações em Glassfish.
  6. 6.
    Servidor SMTP: utilizado para enviar e-mails do sistema.
  7. 7.
    Serviço de identificador persistente para dados de pesquisa: DOIs ou Handles, sendo necessário uma assinatura com autoridades oficiais de registro de DOIs (e.g.: http://dataversecommunity.global/) e/ou Handles (e.g., http://handle.net/).

1.3.2 Componentes opcionais

Existem vários componentes opcionais que podem ser instalados e/ou configurados:
  1. 1.
    R, rApache, Zelig e TwoRavens: Tabular Data Exploration.
  2. 2.
    Integração com Dropbox.
  3. 3.
    Shibboleth.
  4. 4.
    OAuth2: um sistema de autenticação descrito no login do OAuth: ORCID, GitHub, Google.
  5. 5.
    Geoconnect: permite criação de mapas a partir de arquivos geoespaciais.

1.4. Formatos de Citação

Autor(es), Ano da publicação, Título do Dataset, Nome do repositório ou arquivo, versão, Identificador Global persistente