Menos del 1% de los datos científicos publicados en abierto cumple con los estándares de calidad

Un estudio de la UOC ha analizado las prácticas de publicación de datos abiertos en la red social académica ResearchGate. La gran mayoría de los datasets o conjuntos de datos estudiados cumplen escasamente los criterios de calidad de este tipo de publicaciones.

Publicado el 05 May 2022

58862_25

La ciencia abierta propugna un modelo de investigación científica en el que tanto los resultados como todos los datos generados durante la investigación estén al alcance de la sociedad con el objetivo de lograr un sistema científico más colaborativo, democrático y transparente en todas sus fases. Un estudio de Juliana Raffaghelli, del grupo Edul@b de los Estudios de Psicología y Ciencias de la Educación, y Stefania Manca, investigadora del Institute for Educational Technology del Consejo Nacional de Investigación (Génova, Italia), ha analizado las prácticas de publicación de datos abiertos en ResearchGate, una de las redes sociales académicas más populares en la comunidad científica.

Los resultados, publicados en abierto, en la revista Online Information Review, muestran que la mayoría de los datos de investigación analizados no se han leído ni citado nunca y, además, revelan que se trata de conjuntos de datos que apenas siguen los estándares FAIR (del inglés findable, accesible, interoperable y reusable, es decir, encontrable, accesible, interoperable y reutilizable) de publicación científica en abierto.

“Hay una creciente atención de la comunidad investigadora hacia la ciencia abierta, pero estos hallazgos nos orientan a considerar que publicar datos abiertos podría ser una prueba, una exploración o un hacer ver que está poniéndose en circulación algo, en lugar de una práctica abierta real y rigurosa que permita que los datos puedan ser accesibles y utilizados por otros científicos y la sociedad en general. Esta práctica inconsistente hace que la democratización del conocimiento que promete la ciencia abierta sea menos potente“, explica Juliana Raffaghelli, primera autora del artículo.

A pesar de esta situación, la investigadora señala que “el panorama evoluciona rápidamente y podría estar mejorando“. Y pone como ejemplo la rapidez de la circulación de la investigación durante la pandemia, especialmente en cuanto a las vacunas.

Una red social académica para dar visibilidad a la investigación

El trabajo se ha basado en el análisis de 752 datasets, registros de datos científicos subidos a la plataforma ResearchGate, una red social académica que incluye perfiles y páginas públicas de personal investigador, en las que se pueden enlazar publicaciones y material complementario a la investigación, como por ejemplo conjuntos de datos en forma tabular o de imágenes. Al ser una red social, el personal investigador la usa frecuentemente para fomentar la visibilidad y la circulación del producto de su trabajo académico, a pesar de no ser una plataforma institucional ni considerarse formalmente en procesos de evaluación. Su uso, sin embargo, “plantea los mismos problemas de calidad de la información, de apropiación de datos por parte de los gestores y de privacidad ya vistos en otras grandes plataformas de medios sociales”, puntualiza la investigadora.

Las investigadoras evaluaron los datasets extraídos a partir del estándar FAIR, un conjunto de criterios que una publicación de datos debería seguir para que estos sean encontrables, accesibles, interoperables y reutilizables. Se trata de un estándar impulsado por la Comisión Europea y que ha adoptado la Universitat Oberta de Catalunya (UOC) en el marco de su política de conocimiento abierto.

“Que sean encontrables implica que los datos de investigación estén en repositorios institucionales abiertos y no en una revista para acceder a la cual hay que pagar, o en un archivo privado (incluso en la nube). A su vez, para ser accesibles tienen que almacenarse de una manera que cualquiera pueda desempaquetarlos y que no dependa de un programa propietario. Y para ser interoperables y reusables tienen que incluir metadatos que sigan unos estándares compartidos que permitan entenderlos y poder trabajar con ellos”, detalla la investigadora. “Todas estas características permiten que los datos sean más visibles y, por tanto, que el conocimiento circule más“, incide.

Los albores del uso de datos abiertos para una ciencia abierta

Los resultados de este análisis cuantitativo mostraron que la mayoría (562 de 752) de los datos científicos analizados no cumplían ninguno de los criterios FAIR, y menos del 1 % llegaba a tres de los cuatro parámetros. “Estamos en una fase de prehistoria de los datos abiertos en la cual están publicándose datos en abierto, pero no hay una atención al usuario que viene detrás, ni prácticas para favorecer la reutilización de datos”, subraya Juliana Raffaghelli.

La baja calidad de los datos publicados en abierto no es exclusiva de esta red social académica. De hecho, estos resultados han sido replicados en otra investigación cuantitativa reciente de la misma autora, en la que ha analizado 6 millones de registros en el repositorio de acceso abierto Figshare con resultados convergentes. “Ambos estudios demuestran que, con respecto a la ciencia abierta, tenemos una buena teoría, pero la práctica todavía es débil y requiere mucho trabajo para hacerla coherente con la visión utópica del conocimiento abierto”, destaca Juliana Raffaghelli.

Una réplica del statu quo académico

La investigación también analizó la estructura social de las interacciones al relacionar el número de lecturas en línea y el número de citas de las publicaciones con el perfil público de cada investigador e investigadora. Los resultados dibujaron una réplica del statu quo académico, ya que la mayoría de los conjuntos de datos fueron publicados principalmente por hombres de instituciones de la Unión Europea, América del Norte y Asia, con una posición académica sénior. Además, también fueron los más citados. “Hemos encontrado una asociación entre los datos publicados y el perfil, sénior y de renombre (observada mediante el Research Score alto), a la hora de recibir más citaciones por parte de la comunidad investigadora, lo que nos muestra la importancia de la reputación. Sin embargo, en poquísimos casos estas citas están relacionadas con la calidad de la publicación en abierto: de más de 11.629 lecturas totales, solo 15 van a un conjunto de datos abierto que cumple los cuatro criterios FAIR, y 10.201 van a los 562 conjuntos de datos que no cumplen ningún criterio FAIR”, destaca.

Alfabetización en datos más allá de la formación técnica

Ante esta situación, la investigadora señala “la importancia de la alfabetización en datos de la comunidad investigadora“, pero reclama una formación que vaya más allá de la capacitación técnica: “El desarrollo de datos abiertos de mejor calidad y la reutilización de estos, como prácticas innovadoras de investigación abierta, requieren conocimientos técnicos, pero también compromiso con el contexto político y con estrategias necesarias para impulsar la calidad y la ética de lo que significa ser un investigador abierto, en red y orientado a un impacto social de la propia investigación”.

Apuesta estratégica de la UOC

La UOC aprobó, el año pasado, la Política institucional de conocimiento abierto que favorece que estén disponibles en abierto no solo las publicaciones científicas y académicas —como ya recogía la política de acceso abierto de 2010 a la que sustituye—, sino también las del estudiantado, la documentación institucional y los datos de investigación. El objetivo de este plan, en palabras de Pastora Martínez Samper, vicerrectora de Globalización y Cooperación, es “reforzar y consolidar nuestra apuesta por el modelo de ciencia abierta que se está extendiendo globalmente, que incluye, por ejemplo, los datos de investigación o los recursos de aprendizaje. Estamos transformando la UOC en un nodo abierto que proyecte el conocimiento y que, al mismo tiempo, pueda conectar con contribuciones externas y enriquecerse”.

Este es uno de los avances realizados por la institución a partir del Plan de acción de conocimiento abierto, que se puso en marcha en 2019. A raíz de esta estrategia se ha incrementado la documentación publicada en abierto en el O2 Repositorio UOC, la creación del Servicio de Gestión de Datos FAIR, planes de formación o varias iniciativas vinculadas a hacer de la UOC una universidad más porosa. En este sentido, este artículo se ha publicado en acceso abierto (open access) gracias a los acuerdos a que ha llegado la Biblioteca de la UOC con Emerald (editorial de la revista) a partir de la estrategia de la universidad.

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

T
Redacción TICPymes

Artículos relacionados

Artículo 1 de 2