Ir ao contido principal

Sexenios de investigación

Guía de axuda ao PDI para concorrer á convocatoria de sexenios de investigación da CNEAI-ANECA

Conxuntos de datos de investigación (datasets)

QUE SE ENTENDE POR DATOS DE INVESTIGACIÓN?

Tal como mencionamos na introdución desta guía, unha das novidades da presente convocatoria de sexenios é que pretende promover o cumprimento do disposto no artigo 37.1 da Lei 14/2011, do 1 de xuño, -tras a súa modificación-, favorecendo que os resultados da investigación, incluídos os datos xerados ou empregados no curso desta, estean dispoñibles en acceso aberto, e cuxo acceso gratuíto e libre debe fomentarse mediante o desenvolvemento de repositorios institucionais ou temáticos de acceso aberto, propios ou compartidos.

**Como recoñece o artigo 37.6 da Lei 14/2011, do 1 de xuño, respéctase o dereito de atribución ou transferencia a terceiros dos dereitos sobre as publicacións que impidan que estas estean en acceso aberto, aceptando achegas que, aínda que estean depositadas, estean embargadas. (Ver O repositorio da USC: Minerva)

A OCDE define os datos de investigación como os rexistros relativos aos feitos (indicadores numéricos, rexistros textuais, imaxes e sons) usados como fontes primarias da investigación científica, que serven para validar os descubrimentos dunha investigación e son aceptados pola comunidade científica para poder refutar ou comprobar o novo coñecemento.

O conxunto de datos reunidos durante a execución dun proxecto de investigación coñécese como dataset. Os conxuntos de datos son parte intrínseca de calquera proceso de investigación.

 

DATOS DE INVESTIGACIÓN E CIENCIA ABERTA

No contexto da Ciencia Aberta os datos cobran especial protagonismo, na medida en que tanto os investigadores como os financiadores, e as propias axencias de avaliación da investigación, cada vez máis avogan por que os conxuntos de datos estean dispoñibles en aberto, para facilitar a súa reutilización e a reproducibilidade da investigación, sen límites legais -por dereitos de autor- ou económicos para o acceso, e garantir a súa correcta preservación, reprodución, difusión, visibilidade e impacto.

Poñer ao dispor da comunidade de investigación novas fontes de información, permitir a reproducibilidade das análises, mellorar a comprensión dos resultados e contribuír a acelerar os descubrimentos a través da reutilización dos datos é un dos piares da Ciencia Aberta, segundo a Estratexia Nacional de Ciencia Aberta 2023-2027.

Compartir datos (data sharing) inclúese dentro da filosofía do acceso aberto, entendendo o intercambio de datos como unha práctica que favorece que a ciencia sexa máis aberta e accesible.

 

DATOS FAIR E DATOS ABERTOS

Para garantir a súa reproducibilidade, os datos deben estar en conformidade cos principios FAIR (encontrable, accesible, interoperable, reutilizable -do inglés findable, accessible, interoperable, reusable-).

Estes principios establecéronse para proporcionar unhas directrices e medidas para a correcta xestión de datos:

  1. Os datos deben ser fáciles de atopar (Findable), se non, carece sentido compartilos.
  2. Que ademais de atopalos, se poidan obter (Accesible).
  3. Que, unha vez atopados e obtidos, sexa posible comprender e traballar con eles (Interoperable).
  4. Que sexan reutilizables (Reusable), de forma que unha vez atopados, obtidos, comprendidos e traballado con eles, tamén se poidan reutilizar con outros fins, quedando clara a súa orixe e as condicións de reutilización.

Os principios FAIR avogan por un maior acceso dos datos, metadatos e outros resultados da investigación. Pola súa banda, os datos abertos son datos dispoñibles sen restricións ou con restricións mínimas.

Se un conxunto de datos aberto está ben documentado e é lexible por máquinas, ten unha licenza aberta (p.ex. CC0 ou CC-BY), e utiliza formatos e estándares abertos independentes do provedor, estes datos abertos son datos FAIR.

Existen ferramentas que permiten valorar se os datos son FAIR:

 

ONDE E COMO DEPOSITAR OS DATOS DE INVESTIGACIÓN?

Os artigos 12.8 e 12.9 da Lei Orgánica 2/2023, do 22 de marzo, precisan que as axencias de calidade utilizarán os repositorios institucionais ou temáticos como forma de acceso á documentación, para garantir a axilidade dos procedementos de avaliación.

A BUSC recomenda o uso do respositorio Zenodo para o depósito dos datos.