RECOMPILACIÓN DE DATOS
Para recompilar datos sobre un determinado campo científico existen ferramentas para consultar e/ou reutilizar os datos xa almacenados por outros/as investigadores/as, como os directorios de repositorios de datos de investigación e os propios repositorios de datos, tales como:
- Re3Data.org: rexistro internacional de repositorios de datos de investigación. Trátase dunha importante fonte de información sobre máis de tres mil depósitos de datos de investigación, clasificados por materias, tipoloxía ou países.
- Dataset Search de Google.
- Dimensions: plataforma que indexa datasets, de xeito que facilita o acceso a datos depositados en repositorios e bases de datos.
- RECOLECTA (Recolector de Ciencia Aberta), agregador nacional de repositorios científicos de acceso aberto (FECyT).
- DataCiteSearch: buscador de datasets abertos con DOI.
- Zenodo: repositorio de acceso aberto de propósito xeral que ofrece resultados de investigación en Europa a partir da iniciativa OpenAIRE.
- Dryad: repositorio de datos de investigación orientado a facilitar o seu descubrimento e libre reutilización.
- Figshare: repositorio de datos de investigación onde preservar e compartir todos os datos e resultados que xera un proceso de investigación.
- Mendeley Data: repositorio comunitario gratuíto e seguro baseado na nube.
- Harvard Dataverse: repositorio de datos gratuíto aberto a todo o persoal investigador de calquera disciplina, tanto dentro coma fóra da comunidade de Harvard, onde se poden compartir, arquivar, citar, acceder e explorar os datos de investigación.
- European Union Open Data Portal: portal de datos abertos da Unión Europea.
- Datos.gob.es: portal de datos abertos do Gobierno de España.
- Data Gov: portal de datos abertos do Goberno de Estados Unidos.
FORMATO
Na etapa de planificación da investigación é importante considerar en que formato deben almacenarse os ficheiros. Tanto o formato coma o software co que se crean e dixitalizan os datos de investigación dependen do tipo de análise que realice o persoal investigador, as aplicacións e programas usados e tamén os costumes de cada disciplina.
Cando xa se teñen seleccionado os datos, para conservalos e garantir o seu acceso aberto e usabilidade, o apropiado é convertelos a formatos estándar que a meirande parte dos programas sexan capaces de interpretar. Recoméndanse estándares abertos (ODF, ASCII, formato delimitado por tabuladores, valores separados por comas, XML) en oposición a estándares propietarios (MS Rich Text Format e MS Excel). Ademais, para garantir o acceso e a preservación a longo prazo, hai que ter en conta as seguintes consideracións (FECYT, 2012):
- O formato utilizado debe permitir a indización do contido para a súa potencial recuperación.
- Un formato de compresión de datos utiliza menos espazo de almacenamento.
- O formato elixido deberá ser estándar (IANA mime types é o estándar de facto para a comunidade investigadora).
Tamén deben empregarse formatos estándar para a realización das copias de seguridade.
CODIFICACIÓN
Unha estrutura de ficheiros ben organizada e coherente, con nomes definidos, claros e significativos, axuda a atopar a información de forma rápida e precisa. É moi importante tomar un tempo para pensar ben a xerarquía, estrutura, nomes e versións dos arquivos, especialmente cando se traballa en equipo. O nome dos ficheiros vai ser o seu identificador principal, polo que é conveniente que conteña información útil, o estado ou versión do arquivo. En investigación colaborativa é esencial conservar todas as versións ou edicións e acceder a elas a través do nome do ficheiro, polo que o nome asignado debería ser independente do directorio onde se almacenen.
Recomendacións para nomear e organizar correctamente os ficheiros:
- Asignar nomes curtos pero significativos.
- Usar o nome dos ficheiros para clasificar tipos de arquivos.
- Utilizar guións (-) ou guións baixos (_) para separar elementos no nome do arquivo.
- Evitar o uso de espazos, puntos e caracteres especiais.
- Evitar nomes demasiado longos.
- Aproveitar as letras de extensión do ficheiro para a aplicación de códigos específicos e a organización dos arquivos.
- Incluír a versión no nome do ficheiros cando sexa preciso.
Máis información en: ukdataservice.ac.uk: Research Data Management