Os datos de investigación son aqueles rexistros relativos aos feitos (indicadores numéricos, rexistros textuais, imaxes e sons) usados como fontes primarias da investigación científica, que serven para validar os descubrimentos dunha investigación e son aceptados pola comunidade científica para poder refutar ou comprobar o novo coñecemento (OCDE).
A FECYT recolle esta definición da Universidade de Melbourne: feitos, observacións ou experiencias nas que se basea o argumento, a teoría ou a proba. Poden ser numéricos, descritivos ou visuais. Poden ser en estado bruto ou analizados. Poden ser experimentais ou observacionais. Inclúen: cadernos de laboratorio, de campo, datos de investigación primaria, cuestionarios, cintas de audio, vídeos, desenvolvemento de modelos, fotografías, películas e as comprobacións e respostas dunha proba. As coleccións de datos para a investigación poden incluír diapositivas, deseños e mostras. Na información sobre a procedencia dos datos pódese incluír: como, cando, onde se recolleron e con que instrumentos. O código software empregado para xerar, comentar ou analizar datos tamén pode ser considerado como datos.
Os datos de investigación abertos refírense aos datos que sustentan os resultados da investigación científica e non teñen restricións de acceso, o cal permite que calquera poida acceder a eles.
O conxunto de datos reunidos durante a execución dun proxecto de investigación coñécese como dataset.