La gestión de los datos de investigación es un tema importante relacionado con el proceso de investigación y publicación de los resultados.
“Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.” (Open Data Handbook, n.d.)
RDMKit ofrece la siguiente defininción y menciona algunos formatos de datos: “In the RDMkit, data can be defined as any information or materials that are collected, observed, generated, or used during the research process. Data can take various forms, including experimental results, numerical data, text documents, images, software code, surveys, and more.”
La tecnología existente, los formatos digitales, la existencia de repositorios de datos, el acceso abierto entre otros factores facilitan el uso, el almacenamiento, el compartir y la reutilización de los datos de investigación.
“Data reuse means using data for other purposes than it was originally collected for. Reuse of data is particularly important in science, as it allows different researchers to analyse and publish findings based on the same data independently of one another. Reusability is one key component of the FAIR principles.” (RDMKit)
FAIR principles:
“Good data management is not a goal in itself, but rather is the key conduit leading to knowledge discovery and innovation, and to subsequent data and knowledge integration and reuse by the community after the data publication process.”
La publicación, la preservación y el compartir de los datos de investigación son cada vez más incentivados a través de las políticas de las revistas y editoriales, de las diferentes agencias que ofrecen financiamiento (grants) para la investigación científica.
La importancia del reúso de los datos de investigación sintetizada en RDMKit:
Publicar y compartir los datos de investigación beneficia todos los actores que participan en estos procesos: autores, otros investigadores, revistas académicas y editoriales, agencias de financiamiento como National Endowment for the Humanities (NEH), U.S. National Science Foundation (NSF), National Institutes of Health (NIH), etc. tienen establecidas sus políticas y guías para la gestión de datos.
NIH Data Management and Sharing Policy (2023)
Data Management Plans for NEH Office of Digital Humanities Proposals and Awards
Para saber como citar y hacer referencias a los conjuntos de datos reutilizados se pueden consultar los siguientes recursos de información:
La Ciencias Abierta tiene el propósito de hacer el proceso científico cada vez más democrático, transparente e inclusivo. Tal como lo indica UNESCO en su página web “La Recomendación de la UNESCO sobre la Ciencia Abierta proporciona un marco internacional para la política y la práctica científicas abiertas que reconoce las diferencias disciplinarias y regionales en las perspectivas científicas abiertas.”
Pilares de la Ciencia Abierta. Fuente: UNESCO.org - Understanding open science (p:6) followingUNESCO Recommendation on Open Science.Documents available in:Understanding open science : English, Français,UNESCO Recommendation on Open Science: English, Français, Español, Português, العربية, 汉语, Русский язык, монгол хэл ., CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=130456946
Dentro del marco de la Ciencia Abierta (Pública) existen diferentes maneras de clasificar los datos de investigación.
“Por lo general es obligatorio hacer públicos los datos de las investigaciones financiadas con fondos públicos. No obstante, hay casos que pueden tener restricciones de acceso
Abiertos: según la licencia de uso (ver epígrafe “¿Qué hay de la propiedad intelectual de los datos de investigación depositados?”).
Restringidos: se han de solicitar al responsable.
Embargados: ventana de tiempo sin acceso abierto por decisión de la editorial que ha publicado el trabajo y los datos de investigación.
Cerrados: contienen datos de carácter personal o que afecten a la intimidad, los derechos fundamentales y libertades públicas de las personas (si no es posible anonimizarlos). Los datos personales de los participantes en el estudio requieren el consentimiento de los mismos.” (Biblioguías UCM. Datos de investigación, 2024)
La guía temática de CEPAL Gestión de datos de investigación (2024) clasifica los datos por rasgos tales como:
Característica | Tipos y descripción |
El nivel de procesamiento de los datos |
|
Fuente que provee los datos |
|
Forma o tipo |
|
Formato |
|
También se pueden consultar los siguientes recursos sobre el tema:
UNESCO. (2021). Recomendación de la UNESCO sobre la Ciencia Abierta.
Biblioguías UCM. Datos de investigación. (2024).
Biblioguías de la Biblioteca universitaria de la Universidad de Valladolid. Datos de investigación. (2024).
League of European Research Universities. (2013). LERU Roadmap for Research Data. Advice Paper No.14.
“Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.” (Open data Handbook, n.d.)
El ciclo de vida de los datos de investigación según ilustrado por REBIUN:
Fuente: CRUE. Red de Bibliotecas REBIUN. (n.d.) Recursos. El ciclo de los datos científicos.
Para gestionar los datos de investigación de manera apropiada el equipo de investigación relacionado tiene que elaborar un Plan de Gestión de Datos (PGD) tomando en cuenta los requierimientos que aplican para el caso.
“Un Plan de Gestión de Datos (PGD) es un documento formal elaborado por el investigador o grupo de investigación, que se desarrolla al inicio de un proyecto de investigación. Describe todos los aspectos de la gestión de los datos, es decir, qué se hará con los datos durante y después del proyecto de investigación… El PGD tiene como propósito proporcionar un análisis de los principales elementos de una política de gestión de datos, y describe el tratamiento que van a recibir los conjuntos datos de investigación recopilados o generados en el curso de un proyecto de investigación. Su finalidad es servir de herramienta de apoyo durante el ciclo de vida de aquellos datos que se recopilen, se procesen o se generen en el ámbito de un proyecto.”
Gestión de datos de investigación. (2024). Biblioguías- Biblioteca de la CEPAL.
Para gestionar exitosamente los datos de investigación hay que tener en cuenta múltiples aspectos:
Fuente: CRUE. Red de Bibliotecas REBIUN. (2016). Recursos. 10 pasos para elaborar un Plan de Gestión de Datos.
Para la gestión de datos, además de los principios FAIR, es recomendable tomar en cuenta cómo se van a preservar, dónde se van a depositar los datos (repositorio institucional, de alguna entidad de financiamiento, (por ejemplo The United States Government’s open data site) o repositorios de datos disponibles como Figshare, etc.), los aspectos de derechos de autor sobre los datos y bajo que Licencias de Open Data se preservarán, entre otros.
Según indica el Consejo Superior de Investigaciones Científicas (CSIC) de España para conocer qué tipo de licencias se pueden utilizar para los conjuntos de datos se puede consultar:
¿Qué tipo de licencias deben acompañar a los datasets en acceso abierto?
Se sugiere también el uso de la herramienta gratuita License Selector para determinar cuál es la mejor licencia según aplica para cada caso.
Para saber cómo citar los conjuntos de datos que reutilizamos en nuestras propias investigaciones podemos consultar Data Set References de APA 7ª ed.
Otras herramientas disponibles sobre el tema de uso ético (citas y referencias) de conjuntas de datos en diferentes estilos de redacción:
La guía temática de la Biblioteca de la Universidad de Puerto Rico en Mayagüez. Gestión de datos de investigación.
PO Box 23302, Ave. Ponce de León San Juan PR, 00931