La gestión de los datos de investigación es un tema importante relacionado con el proceso de investigación y publicación de los resultados.
RDMKit ofrece la siguiente defininción y menciona algunos formatos de datos: “In the RDMkit, data can be defined as any information or materials that are collected, observed, generated, or used during the research process. Data can take various forms, including experimental results, numerical data, text documents, images, software code, surveys, and more.”
La tecnología existente, los formatos digitales, la existencia de repositorios de datos, el acceso abierto entre otros factores facilitan el uso, el almacenamiento, el compartir y la reutilización de los datos de investigación.
“Data reuse means using data for other purposes than it was originally collected for. Reuse of data is particularly important in science, as it allows different researchers to analyse and publish findings based on the same data independently of one another. Reusability is one key component of the FAIR principles.” (RDMKit)
FAIR principles:
“Good data management is not a goal in itself, but rather is the key conduit leading to knowledge discovery and innovation, and to subsequent data and knowledge integration and reuse by the community after the data publication process.”
La publicación, la preservación y el compartir de los datos de investigación son cada vez más incentivados a través de las políticas de las revistas y editoriales, de las diferentes agencias que ofrecen financiamiento (grants) para la investigación científica.
La importancia del reúso de los datos de investigación sintetizada en RDMKit:
Publicar y compartir los datos de investigación beneficia todos los actores que participan en estos procesos: autores, otros investigadores, revistas académicas y editoriales, agencias de financiamiento como National Endowment for the Humanities (NEH), U.S. National Science Foundation (NSF), National Institutes of Health (NIH), etc. tienen establecidas sus políticas y guías para la gestión de datos.
NIH Data Management and Sharing Policy (2023)
Data Management Plans for NEH Office of Digital Humanities Proposals and Awards
El ciclo de vida de los datos de investigación según ilustrado por REBIUN:
Fuente: CRUE. Red de Bibliotecas REBIUN. (n.d.) Recursos. El ciclo de los datos científicos.
Para gestionar los datos de investigación de manera apropiada el equipo de investigación relacionado tiene que elaborar un Plan de Gestión de Datos (PGD) tomando en cuenta los requierimientos que aplican para el caso.
“Un Plan de Gestión de Datos (PGD) es un documento formal elaborado por el investigador o grupo de investigación, que se desarrolla al inicio de un proyecto de investigación. Describe todos los aspectos de la gestión de los datos, es decir, qué se hará con los datos durante y después del proyecto de investigación… El PGD tiene como propósito proporcionar un análisis de los principales elementos de una política de gestión de datos, y describe el tratamiento que van a recibir los conjuntos datos de investigación recopilados o generados en el curso de un proyecto de investigación. Su finalidad es servir de herramienta de apoyo durante el ciclo de vida de aquellos datos que se recopilen, se procesen o se generen en el ámbito de un proyecto.”
Gestión de datos de investigación. (2024). Biblioguías- Biblioteca de la CEPAL.
Para gestionar exitosamente los datos de investigación hay que tener en cuenta múltiples aspectos:
Fuente: CRUE. Red de Bibliotecas REBIUN. (2016). Recursos. 10 pasos para elaborar un Plan de Gestión de Datos.
Para la gestión de datos, además de los principios FAIR, es recomendable tomar en cuenta cómo se van a preservar, dónde se van a depositar los datos (repositorio institucional, de alguna entidad de financiamiento, (por ejemplo The United States Government’s open data site) o repositorios de datos disponibles como Figshare, etc.), los aspectos de derechos de autor sobre los datos y bajo que Licencias de Open Data se preservarán, entre otros.
Según indica el Consejo Superior de Investigaciones Científicas (CSIC) de España para conocer qué tipo de licencias se pueden utilizar para los conjuntos de datos se puede consultar:
¿Qué tipo de licencias deben acompañar a los datasets en acceso abierto?
Se sugiere también el uso de la herramienta gratuita License Selector para determinar cuál es la mejor licencia según aplica para cada caso.
Para saber cómo citar los conjuntos de datos que reutilizamos en nuestras propias investigaciones podemos consultar Data Set References de APA 7ª ed.
Otras herramientas disponibles sobre el tema de uso ético (citas y referencias) de conjuntas de datos en diferentes estilos de redacción:
La guía temática de la Biblioteca de la Universidad de Puerto Rico en Mayagüez. Gestión de datos de investigación.
PO Box 23302, Ave. Ponce de León San Juan PR, 00931
Comisión Estatal de Elecciones CEE-SA-2020-3538
Aprobado por la Comisión Estatal de Elecciones y el número de radicación correspondiente