Actualización 30/10/2013: Complemento este post añadiendo el nuevo portal de Datos Abiertos de la Diputación de Málaga. El resto de datos son de finales de septiembre (no están actualizados a finales de octubre).
Este miércoles estaré participando en el Sexto Encuentro Internacional de Investigación en Información y Comunicación (6eiiic) que se celebrará en la Facultad de Ciencias de la Información de la Universidad Complutense, en Madrid.En concreto, me interesa "sumergirme" de lleno en una cuestión que me preocupa desde hace mucho tiempo: la poca reutilización de los datos que algunas administraciones han puesto a disposición de los ciudadanos de forma totalmente abierta.
Si me centro solo en la oferta de datos abiertos proporcionada por adminitraciones públicas de España (aunque creo que el problema se puede transponer a cualquier país) vemos que actualmente - según el mapa de la Fundación CTIC - en España hay 23 administraciones públicas que ofrecen portales Open Data de como mínimo 2 estrellas (según la clasificación de Tim Berners-Lee):
Notas:
- (a): Este es un observatario donde se ofrece, en un mismo lugar, datos y noticias relacionadas con la ciudad. Es francamente dificil extraer el número de datasets que se ofrecen en abierto.
- (b): Cuando se buscaron el número de datasets disponibles de este portal (22/09/2013), el buscador no funcionaba correctamente y, por lo tanto, fue imposible obtener dicho número.
Claramente el número de datasets no es un indicador fiable, de hecho, recientemente Antonio Ibáñez (de la Junta de Castilla y León, responsable del portal Open Data de esta administración) me comentó "El número de conjuntos de datos de un portal Open Data es engañoso. Un ejemplo sería el conjunto de datos “Superficies de cultivos municipales” donde, de forma anualizada, separada por municipio e indicando el tipo de cultivo se dan una serie de datos. Bien podríamos sacar un fichero por cada año, por cada provincia, o por cada tipo de cereal. Así, mostrando la misma información multiplicaríamos nuestros conjuntos de datos. Entiendo que es complicado tomar un parámetro, pero también es cierto que tiene importantes deficiencias.".
A pesar de que comparto al 100% la afirmación que el número de datasets abiertos es un indicador poco fiable, lo cierto es que creo que puedo afirmar que los más de 7.260 conjuntos de datos abiertos son una cantidad suficientemente importante como para generar una apreciable reutilización.
Sin embargo, la realidad dista mucho de ser esta. La reutilización es muy baja por no decir casi nula. La mayoría de portales, especialmente los que han abierto más datos, promocionan los servicios creados a partir de la reutilización de los datos abiertos, y esta promoción denota la baja reutilización.
No es mi objetivo entrar en exactitudes y detalles, sino sentenciar que aunque ya hay disponible en España un volumen importante de datos abiertos, la reutilización de éstos sigue siendo testimonial.
Os recomiendo leer el siguiente post, ¿Por qué no se reutilizan los datos abiertos?
Marc,
ResponderEliminarMañana os enseñaré un ejemplo de reutilización real, con el objetivo de obtener rendimiento económico. ¿Será que es difícil hacer "tracking" de cuánto se reutiliza cada dataset?
Oscar
Oscar,
ResponderEliminarEncantado de conocer más ejemplos de reutilizaciones de datos abiertos.
Efectivamente es muy difícil realizar un tracking para saber cuánto se reutiliza un dataset.
Sin embargo, y aún a pesar de no poder "contar" con exactitud el volumen de reutilizaciones, sigo pensando que es evidente que la reutilización del Open Data es muy baja.
Seguimos el debate hoy en la Complutense :)
Aquí se puede ver una clasificación más ajustada a la realidad
ResponderEliminarhttp://www.meloda.org/