Ir al contenido principal

Apoyo a la investigación y a la publicación

Ofrece infomación para apoyar el proceso de investigación, publicación y divulgación de las publicaciones.

Sobre los datos de la investigación

La gestión de los datos de investigación es un tema importante relacionado con el proceso de investigación y publicación de los resultados. 

“Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.” (Open Data Handbook, n.d.)

RDMKit ofrece la siguiente defininción y menciona algunos formatos de datos: “In the RDMkit, data can be defined as any information or materials that are collected, observed, generated, or used during the research process. Data can take various forms, including experimental results, numerical data, text documents, images, software code, surveys, and more.”

La tecnología existente, los formatos digitales, la existencia de repositorios de datos, el acceso abierto entre otros factores facilitan el uso, el almacenamiento, el compartir y la reutilización de los datos de investigación.  

“Data reuse means using data for other purposes than it was originally collected for. Reuse of data is particularly important in science, as it allows different researchers to analyse and publish findings based on the same data independently of one another. Reusability is one key component of the FAIR principles.” (RDMKit)

FAIR principles:

  • Findable
  • Accessible 
  • Interoperable 
  • Reusable.  (The FAIR Guiding Principles for scientific data management and stewardship, 2016) 

 

Fuente: Universidad de Alcalá Biblioguías Biblioteca: Datos de investigación: Los datos de investigación. (2024).

“Good data management is not a goal in itself, but rather is the key conduit leading to knowledge discovery and innovation, and to subsequent data and knowledge integration and reuse by the community after the data publication process.”

La publicación, la preservación y el compartir de los datos de investigación son cada vez más incentivados a través de las políticas de las revistas y editoriales, de las diferentes agencias que ofrecen financiamiento (grants) para la investigación científica.  

La importancia del reúso de los datos de investigación sintetizada en RDMKit:

Publicar y compartir los datos de investigación beneficia todos los actores que participan en estos procesos: autores, otros investigadores, revistas académicas y editoriales, agencias de financiamiento como National Endowment for the Humanities (NEH), U.S. National Science Foundation (NSF), National Institutes of Health (NIH), etc. tienen establecidas sus políticas y guías para la gestión de datos.

NIH Data Management and Sharing Policy (2023) 

Data Management Plans for NEH Office of Digital Humanities Proposals and Awards 

Preparing Your Data Management and Sharing Plan NSF.

Para saber como citar y hacer referencias a los conjuntos de datos reutilizados se pueden consultar los siguientes recursos de información:

Tipos de datos de investigación

La Ciencias Abierta tiene el propósito de hacer el proceso científico cada vez más democrático, transparente e inclusivo. Tal como lo indica UNESCO en su página web “La Recomendación de la UNESCO sobre la Ciencia Abierta proporciona un marco internacional para la política y la práctica científicas abiertas que reconoce las diferencias disciplinarias y regionales en las perspectivas científicas abiertas.” 

Pilares de la Ciencia Abierta. Fuente: UNESCO.org - Understanding open science (p:6) followingUNESCO Recommendation on Open Science.Documents available in:Understanding open science : English, Français,UNESCO Recommendation on Open Science: English, Français, Español, Português, العربية, 汉语, Русский язык, монгол хэл ., CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=130456946 

Dentro del marco de la Ciencia Abierta (Pública) existen diferentes maneras de clasificar los datos de investigación. 

“Por lo general es obligatorio hacer públicos los datos de las investigaciones financiadas con fondos públicos. No obstante, hay casos que pueden tener restricciones de acceso

Abiertos: según la licencia de uso (ver epígrafe “¿Qué hay de la propiedad intelectual de los datos de investigación depositados?”).

Restringidos: se han de solicitar al responsable.

Embargados: ventana de tiempo sin acceso abierto por decisión de la editorial que ha publicado el trabajo y los datos de investigación.

Cerrados: contienen datos de carácter personal o que afecten a la intimidad, los derechos fundamentales y libertades públicas de las personas (si no es posible anonimizarlos). Los datos personales de los participantes en el estudio requieren el consentimiento de los mismos.” (Biblioguías UCM. Datos de investigación, 2024)

La guía temática de CEPAL Gestión de datos de investigación (2024) clasifica los datos por rasgos tales como: 

Característica  Tipos y descripción 
El nivel de procesamiento de los datos
  •  Datos originales: que han sido recolectados pero aún no han sido procesados o analizados. Algunos ejemplos son los registros sonoros, observaciones, notas de campo o datos de experimentos.
  • Datos procesados: Datos que han sido digitalizados, traducidos, transcritos, limpiados, validados, verificados y/o anonimizados.
  • Datos analizados: Modelos, gráficos, tablas, textos u otros, que han sido creados a partir de los datos primarios y procesados, y que se pretende sean de ayuda en el descubrimiento de información útil, la presentación de conclusiones y la toma de decisiones.
Fuente que provee los datos 
  • Datos canónicos o de referencia: Sets de datos que pueden ser utilizados para validación, comparación o búsqueda de información (por ejemplo, secuencias del genoma humano, estructuras químicas o portales de datos espaciales)
  • Datos experimentales: Datos generados en experimentos científicos. Generalmente son reproducibles y pueden ser generados por equipos de laboratorio.  
  • Modelos o simulaciones: Datos generados en computadores por algoritmos, modelos matemáticos, o simulaciones de experimentos.
  • Datos derivados: Sets de datos creados al tomar datos ya existentes y realizar algún tipo de manipulación sobre los mismos.
  • Observaciones: Datos generados al registrar observaciones de un evento específico y posiblemente irrepetible, en un lugar y tiempo dados.
Forma o tipo 
  • Documentos de texto electrónicos
  • Planillas de datos
  • Cuadernos de campo o anotaciones de laboratorio
  • Cuestionarios o transcripciones
  • Fotografías o películas
  • Registros sonoros
  • Muestras, artefactos, especímenes
  • Objetos digitales
  • Modelos, algoritmos, scripts
  • Bases de datos
  • Metadatos
  • Esquemas de metadatos
  • Configuraciones de software
  • Archivos de pre o post procesamiento de software.
Formato
  • Textuales (Microsoft Wod, PDF, RTF, ODT, etc.)
  • Numéricos (Excel, CSV, etc.)
  • Multimedia (JPEG, MPEG, WAV, etc.)
  • Estructurados (XML, base de datos MySQL, etc.)
  • Código de software (Java, C, etc.)
  • Específicos de un software (Mesh, 3D CAD, modelo estadístico, etc.)
  • Específicos de una disciplina (FITS en astronomía, CIF en química, etc.)
  • Específicos de un instrumento (Olympus Confocal Microscope Data Format, Carl Zeiss Digital Microscopic Image Format).

También se pueden consultar los siguientes recursos sobre el tema:

“Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.” (Open data Handbook, n.d.)

El ciclo de vida de los datos de investigación

El ciclo de vida de los datos de investigación según ilustrado por REBIUN:

Fuente: CRUE. Red de Bibliotecas REBIUN. (n.d.) Recursos. El ciclo de los datos científicos.

Gestión de los datos de investigación

Para gestionar los datos de investigación de manera apropiada el equipo de investigación relacionado tiene que elaborar un Plan de Gestión de Datos (PGD) tomando en cuenta los requierimientos que aplican para el caso.

“Un Plan de Gestión de Datos (PGD) es un documento formal elaborado por el investigador o grupo de investigación, que se desarrolla al inicio de un proyecto de investigación. Describe todos los aspectos de la gestión de los datos, es decir, qué se hará con los datos durante y después del proyecto de investigación… El PGD tiene como propósito proporcionar un análisis de los principales elementos de una política de gestión de datos, y describe el tratamiento que van a recibir los conjuntos datos de investigación recopilados o generados en el curso de un proyecto de investigación. Su finalidad es servir de herramienta de apoyo durante el ciclo de vida de aquellos datos que se recopilen, se procesen o se generen en el ámbito de un proyecto.”

Gestión de datos de investigación. (2024). Biblioguías- Biblioteca de la CEPAL.   

Para gestionar exitosamente los datos de investigación hay que tener en cuenta múltiples aspectos:  

Fuente: CRUE. Red de Bibliotecas REBIUN. (2016). Recursos. 10 pasos para elaborar un Plan de Gestión de Datos. 

Para la gestión de datos, además de los principios FAIR, es recomendable tomar en cuenta cómo se van a preservar, dónde se van a depositar los datos (repositorio institucional, de alguna entidad de financiamiento, (por ejemplo The United States Government’s open data site) o repositorios de datos disponibles como Figshare, etc.), los aspectos de derechos de autor sobre los datos y bajo que Licencias de Open Data se preservarán, entre otros.

Según indica el Consejo Superior de Investigaciones Científicas (CSIC) de España para conocer qué tipo de licencias se pueden utilizar para los conjuntos de datos se puede consultar:  

¿Qué tipo de licencias deben acompañar a los datasets en acceso abierto?

Se sugiere también el uso de la herramienta gratuita License Selector para determinar cuál es la mejor licencia según aplica para cada caso.

Para saber cómo citar los conjuntos de datos que reutilizamos en nuestras propias investigaciones podemos consultar Data Set References  de APA 7ª ed. 

Otras herramientas disponibles sobre el tema de uso ético (citas y referencias) de conjuntas de datos en diferentes estilos de redacción:

PO Box 23302, Ave. Ponce de León San Juan PR, 00931