Ir ao contido principal

Datos de investigación

Explicación da xestión dos datos de investigación e o depósito en repositorios abertos

Procesamento e organización dos ficheiros

RECOMPILACIÓN DE DATOS

Para recompilar datos sobre un determinado campo científico existen ferramentas para consultar e/ou reutilizar os datos xa almacenados por outros/as investigadores/as, como os directorios de repositorios de datos de investigación e os propios repositorios de datos, tales como:

  • Re3Data.org: rexistro internacional de repositorios de datos de investigación. Trátase dunha importante fonte de información sobre máis de tres mil depósitos de datos de investigación, clasificados por materias, tipoloxía ou países.
  • Dataset Search de Google.
  • Dimensions: plataforma que indexa datasets, de xeito que facilita o acceso a datos depositados en repositorios e bases de datos.
  • RECOLECTA (Recolector de Ciencia Aberta), agregador nacional de repositorios científicos de acceso aberto (FECyT).
  • DataCiteSearch: buscador de datasets abertos con DOI.
  • Zenodo: repositorio de acceso aberto de propósito xeral que ofrece resultados de investigación en Europa a partir da iniciativa OpenAIRE.
  • Dryad: repositorio de datos de investigación orientado a facilitar o seu descubrimento e libre reutilización.
  • Figshare: repositorio de datos de investigación onde preservar e compartir todos os datos e resultados que xera un proceso de investigación.
  • Mendeley Data: repositorio comunitario gratuíto e seguro baseado na nube.
  • Harvard Dataverse: repositorio de datos gratuíto aberto a todo o persoal investigador de calquera disciplina, tanto dentro coma fóra da comunidade de Harvard, onde se poden compartir, arquivar, citar, acceder e explorar os datos de investigación.
  • European Union Open Data Portal: portal de datos abertos da Unión Europea.
  • Datos.gob.es: portal de datos abertos do Gobierno de España.
  • Data Gov: portal de datos abertos do Goberno de Estados Unidos.

FORMATO

Na etapa de planificación da investigación é importante considerar en que formato deben almacenarse os ficheiros. Tanto o formato coma o software co que se crean e dixitalizan os datos de investigación dependen do tipo de análise que realice o persoal investigador, as aplicacións e programas usados e tamén os costumes de cada disciplina.

Cando xa se teñen seleccionado os datos, para conservalos e garantir o seu acceso aberto e usabilidade, o apropiado é convertelos a formatos estándar que a meirande parte dos programas sexan capaces de interpretar. Recoméndanse estándares abertos (ODF, ASCII, formato delimitado por tabuladores, valores separados por comas, XML) en oposición a estándares propietarios (MS Rich Text Format e MS Excel). Ademais, para garantir o acceso e a preservación a longo prazo, hai que ter en conta as seguintes consideracións (FECYT, 2012):

  • O formato utilizado debe permitir a indización do contido para a súa potencial recuperación.
  • Un formato de compresión de datos utiliza menos espazo de almacenamento.
  • O formato elixido deberá ser estándar (IANA mime types é o estándar de facto para a comunidade investigadora).

Tamén deben empregarse formatos estándar para a realización das copias de seguridade.  

CODIFICACIÓN

Unha estrutura de ficheiros ben organizada e coherente, con nomes definidos, claros e significativos, axuda a atopar a información de forma rápida e precisa. É moi importante tomar un tempo para pensar ben a xerarquía, estrutura, nomes e versións dos arquivos, especialmente cando se traballa en equipo. O nome dos ficheiros vai ser o seu identificador principal, polo que é conveniente que conteña información útil, o estado ou versión do arquivo. En investigación colaborativa é esencial conservar todas as versións ou edicións e acceder a elas a través do nome do ficheiro, polo que o nome asignado debería ser independente do directorio onde se almacenen.

Recomendacións para nomear e organizar correctamente os ficheiros:

  • Asignar nomes curtos pero significativos.
  • Usar o nome dos ficheiros para clasificar tipos de arquivos.
  • Utilizar guións (-) ou guións baixos (_) para separar elementos no nome do arquivo.
  • Evitar o uso de espazos, puntos e caracteres especiais.
  • Evitar nomes demasiado longos.
  • Aproveitar as letras de extensión do ficheiro para a aplicación de códigos específicos e a organización dos arquivos.
  • Incluír a versión no nome do ficheiros cando sexa preciso.

Máis información en: ukdataservice.ac.uk: Research Data Management