¿Qué son los Datos Abiertos?

Nov 17, 2021 View this post in English

Los Datos Abiertos son datos a los que todos pueden acceder, utilizar y compartir. Además, deben ser fáciles de compartir, ya que los Datos Abiertos sólo son útiles si se distribuyen de forma que todo el mundo pueda entenderlos.

El concepto de Datos Abiertos no es nuevo, pero cada vez es más importante centrarse en hacerlos accesibles a todo el mundo. En este artículo, hablamos de los beneficios, de lo que hace que los datos sean abiertos (y de las discrepancias respecto a los Datos Abiertos), de  ejemplos de los mismos y de argumentos a favor y en contra. Para concluir, también destacaremos cómo Orvium hace que los Datos Abiertos sean fácilmente accesibles.

Beneficios de los Datos Abiertos

Los Datos Abiertos tienen muchos beneficios cuando se comparten libremente, beneficios que  pueden ser específicos y pertenecer a una categoría particular (cultural, científica, ambiental, gubernamental). Los buenos datos abiertos:

  • están disponibles en un formato estándar y estructurado, por lo que se pueden procesar fácilmente,
  • se pueden enlazar, lo que permite compartirlos fácilmente y hablar de ellos,
  • tienen garantizada la coherencia y la disponibilidad, por lo que otros pueden confiar en ellos,
  • sea rastreables hasta su origen, la trazabilidad de los datos sirve para que otros puedan saber si pueden confiar en los datos o no.

Si se cumplen estos requisitos, los beneficios para los investigadores incluyen:

  • mayor acceso a los datos: compartir abiertamente los datos de la investigación proporciona beneficios a toda la comunidad científica, a los círculos académicos, a los bibliotecarios, etc,
  • la capacidad de desarrollar y crear nuevas investigaciones a partir de datos de acceso público, lo que aumenta la visibilidad de la propia investigación: compartir datos de investigación detallados se ha relacionado con el aumento de las tasas de citación,
  • la capacidad de verificar y reproducir experimentos: los datos brutos pueden utilizarse para explorar nuevas hipótesis, especialmente cuando se combinan con otros conjuntos de datos fácilmente disponibles (se vuelven indispensables al desarrollar e investigar métodos de investigación, implementaciones de software y técnicas de análisis),
  • el aumento de la autenticidad de los investigadores y reducción del fraude académico: el intercambio de datos no sólo fomenta nuevas perspectivas, sino que también ayuda a identificar los errores de los investigadores, desalienta el fraude y es útil para la formación de nuevos investigadores.
  • el cumplimiento de los mandatos de las agencias de financiación y de las políticas de publicación de las revistas: los repositorios de revistas, como OpenAIRE, fomentan la presentación de datos científicos completos y detallados, al tiempo que respetan los principios FAIR para garantizar una estructura estándar. Además, estas revistas de  acceso abierto sin tasas permiten a los investigadores publicar de forma gratuita si una revista de acceso abierto cobra una tasa demasiado elevada.

El uso de los Datos Abiertos y el Acceso Abierto es una parte integral de la ciencia abierta.

¿Qué hace que los Datos sean Abiertos?

Los Datos Abiertos son esencialmente investigaciones que se comunican claramente de forma que permiten a otros contribuir, colaborar y añadir todo tipo de datos y resultados puestos a disposición de forma gratuita en las diferentes etapas del proceso de investigación.

Las tres características más importantes de los Datos Abiertos son:

1. Disponibilidad y acceso: los datos deben estar disponibles de forma cómoda y  modificable, en su conjunto, y a un coste de reproducción razonable (preferiblemente descargable a través de Internet).

2. Reutilización y distribución: los datos deben ser legibles por máquinas y  proporcionarse en condiciones que permitan su reutilización y redistribución,  incluida la mezcla de diferentes conjuntos de datos.

3. Participación universal: todo el mundo debe poder utilizar, reutilizar y redistribuir los datos. No debe haber discriminación contra campos, grupos o personas.

Discrepancias sobre Datos Abiertos

Aunque hay mucho entusiasmo en torno a las iniciativas de Datos Abiertos y su potencial para transformar la sociedad moderna, una distinción importante que hay que hacer es que los Datos Abiertos actualmente disponibles son sólo una fracción de lo que se necesita. Hay una discrepancia entre los Datos Abiertos que existen, por ejemplo, en los portales gubernamentales, y los datos públicos. Los gobiernos tienen que empezar a hacer más de su información pública abierta. Al fin y al cabo, somos todos nosotros los que pagamos por ella.

En casos como este, una limitación significativa de los datos abiertos es que no han estado a la altura de su potencial porque solo representan una pequeña parte de lo que está disponible. Los mismos problemas existen también para la comunidad científica. Para que los Datos Abiertos sean tan eficaces como se prevé, la distinción entre datos abiertos y públicos debe desaparecer.

Los investigadores y científicos deberían animarse aún más a compartir los datos en bruto, no sucumbir a los mitos y temores asociados compartir datos científicos, y seguir las tres  características de los Datos Abiertos. Por desgracia, no siempre es así, lo que complica aún más las iniciativas en muchos sectores.

Ejemplos y usos de Datos Abiertos

Las iniciativas de Datos Abiertos están presentes a diferentes niveles. El número total de iniciativas se cuenta por centenares, pero a continuación se ofrece una (pequeña) lista de los tipos de Datos Abiertos relativos a temas específicos:

- datos abiertos a nivel de país,

- datos abiertos a nivel municipal y subnacional,

- datos abiertos por sector o tema (agricultura, medio ambiente, salud,  educación, etc.)

Puedes encontrar más ejemplos aquí.

Un ejemplo de datos gubernamentales abiertos es la herramienta GotToVote. Esta herramienta, que comenzó como un experimento, pretendía hacer que los datos, que de otro modo estarían bloqueados por el gobierno, fueran beneficiosos para el público en general. Los ciudadanos podían descifrar las noticias y actuar sobre ellas mostrando cómo los acontecimientos nacionales, como las elecciones, les afectan personalmente.

Para ver más ejemplos y usos de los datos abiertos en relación con el medio ambiente, la salud y la educación, entre otros, lea estos elementos esenciales de los datos abiertos.

Un ejemplo de recurso excelente para la colaboración entre múltiples disciplinas es Socrata, de Tyler Technologies. Socrata es una plataforma de datos que permite a los gobiernos utilizar los datos como un activo estratégico en el diseño, el desarrollo y la implementación de programas. Esto mejora el flujo y la calidad de los datos abiertos, aumenta la transparencia y fomentando la colaboración. Consulta la amplia lista de soluciones para los diferentes sectores de: administración pública, tribunales y seguridad pública, salud y servicios humanos, educación y  tecnología.

Otro ejemplo de recurso de Datos Abiertos es el repositorio digital y sistema de publicación de la UMMS, que ofrece acceso mundial a trabajos académicos, investigaciones y conocimientos de la Facultad de Medicina de la Universidad de Massachusetts. Estos archivos de datos incluyen disertaciones, tesis, artículos de revistas y publicaciones académicas que deben cumplir con estrictos requisitos para la difusión de datos. Los beneficios de compartir sus datos aquí incluyen:

● es de uso gratuito,

● proporciona métricas útiles para medir el impacto de la investigación,

● incluye suficientes metadatos para permitir el descubrimiento y la reutilización.

Puedes encontrar más recursos de investigación aquí.

Argumentos a Favor y en Contra

El debate sobre los pros y los contras de los datos abiertos es cada vez más intenso. Los argumentos a favor y en contra de los datos abiertos dependen en gran medida del tipo de datos disponibles y de sus posibles usos.

Los argumentos a favor incluyen:

  • Se utilizó dinero público para financiar la investigación, por lo que los datos (y los  resultados) deberían estar disponibles de forma universal,
  • los Datos abiertos permiten un proceso fluido de las actividades humanas comunes y son un importante factor de desarrollo socioeconómico (como la atención sanitaria, la productividad económica, la educación, etc.),
  • el ritmo de los descubrimientos en la investigación científica se acelera gracias a un mejor acceso a los datos,
  • la apertura de los datos gubernamentales es un punto de partida para mejorar la  educación, los gobiernos y otros problemas del mundo real.

Los argumentos en contra incluyen:

  • Los Datos Abiertos pueden llevar a la explotación de datos en los países en desarrollo por parte de institutos de investigación ricos y mejor equipados, sin mayor  participación ni beneficios para las comunidades locales,
  • la preocupación por la privacidad puede requerir un acceso limitado a los datos para  usuarios específicos o subconjuntos de datos,
  • los patrocinadores no reciben todo el valor si sus datos son mal utilizados, lo que -requiere esfuerzos de gestión de calidad, difusión y creación de marcas que a menudo cobran a los usuarios para obtener los mejores resultados,
  • no hay control sobre la agregación de los Datos Abiertos.

En Resumen

Los Datos Abiertos tienen una gran cantidad de beneficios, pero también una buena parte de desafíos y limitaciones. Hemos hablado de los beneficios de los Datos Abiertos, las soluciones (como las iniciativas de Datos Abiertos y las estrategias de participación), las discrepancias, los ejemplos y los argumentos a favor y en contra. Ahora, vamos a mencionar brevemente cómo Orvium ayuda con las soluciones de Datos Abiertos.

Abierto significa mucho más que poder acceder y leer datos e información. Lo sabemos por nuestro artículo sobre el intercambio de datos. En él se establece:

  • el contexto adecuado para entenderlos,
  • los recursos para replicarlos,
  • las herramientas para colaborar y hacer que los datos sean más útiles.

Es de esperar que nos demos cuenta de que los Datos Abiertos desempeñan un papel crucial en el crecimiento económico, el desarrollo social, el enriquecimiento cultural y el  empoderamiento democrático. Para leer más sobre nuestra implicación en un futuro más colaborativo y de Datos Abiertos, echa un vistazo a nuestra plataforma.

Tags

Antonio Romero

Led several big-data and ML projects for the R&D between CERN and multiple ICT market-leaders. His work accelerating predictive-maintenance and machine-learning solutions at CERN