Inicio > #oGov, alorza.net, Buenas practicas, Normativa, Open Government > El nudo gordiano de la apertura de datos públicos

El nudo gordiano de la apertura de datos públicos


nudo gordianoAlejandro Magno, en su campaña de conquista de Persia, llegó a Frigia tras cruzar el Helesponto. Allí le mostraron un nudo de cuerdas tan intrincado que nadie lo había sabido desatar. Un augurio aseguraba que quien consiguiera desatar el nudo gordiano podría conquistar Oriente.

Alejandro, que no era hombre de manos finas, echó mano de la espada, cortó el nudo de un tajo y dijo «es lo mismo cortarlo que desatarlo».

Si bien con menos épica y más lírica, algo así nos encontramos cuando nos pusimos en la tarea de liberar la información pública de la Administración del País Vasco. Con la legislación en la mano, la solución era complicada; con el consejo de los juristas, inextricable. No había ejemplos cercanos de los que aprender. Traigo aquí el nuestro, con la idea de promover el debate.

A falta de la fortaleza mítica del macedonio, nosotros hemos cortado el nudo de cuatro tajos:

1. No documentos, sino datos

El término «documento» es el que se emplea en la Ley 37/2007 para referirse a la unidad de información reutilizable. Por más que tenga una tradición jurídica, es en sí mismo un nudo que hay que desatar, porque:

  • Despista. La unidad con sentido es el dato, mientras que el documento es una colección de datos reunida de forma temporal para un fin determinado.
  • Abruma. El número de documentos posible a partir de los datos se acerca a infinito, lo que conllevaría un trabajo incalculable.
  • Confunde. ¡Los documentos en PDF no pueden ser considerados como información pública abierta!

Nuestra opción: liberar conjuntos de datos,con el mayor nivel de desagregación posible.

2. No «licencias administrativas», sino datos libres

El término «licencia administrativa» conlleva una petición de uso de la información pública, un trámite administrativo y la expedición de una licencia para un uso determinado durante un plazo dado. Esta complejidad burocrática resulta absurda en un contexto como este:

  • Contenidos web. La información en internet se consume, no se solicita.
  • Información pública. Si es pública, tengo derecho a hacer uso lícito de ella. ¿Por qué limitar mi acceso?

Nuestra opción: dejar libre la información que ya lo es por naturaleza; abrir el resto de la información mediante licencias CC-BY 

3. No demanda de información, sino oferta de datos

Este nudo es una consecuencia de los dos anteriores. Si pensamos en documentos y en licencias administrativas, pensamos en un régimen de información pública a demanda de los interesados. Además de incurrir en los absurdos antes señalados, estaríamos construyendo:

  • Barreras al consumo. Difícil solicitar información que no sabemos si existe
  • Un sistema insostenible. Cada petición supondría un oneroso trabajo administrativo.

Nuestra opción: liberar la información sin esperar a que se nos demande; al tiempo, escuchar las demandas para liberar más información.

4. No al cobro de tasas, sino gratuidad sostenible

La Ley 37/2007 permite el establecimiento de tasas para el consumo de la información pública. Nuevamente, estamos en un paradigma de documentos costosos de elaborar dentro de un sistema de demanda. Sin embargo, cuando se enfoca a datos, en un sistema de oferta, las tasas son innecesarias y contraproducentes.

  • Las tasas son una gran barrera. La reutilización disminuye de manera exponencial con el precio de las tasas. Incluso cantidades pequeñas son una barrera que desanima a la mayoría.
  • Los datos son baratos. Si una Administración ya está ofreciendo la información en su sitio web -lo cual es una obligación-, el coste de ofrecerla además en formatos reutilizables es mínimo.
  • El cobro cuesta. Se está demostrando que los mecanismos de cobro son insostenibles salvo quer se establezcan tasas muy altas.

Nuestra opción: dedicar poco presupuesto, liberar muchos datos y dejarlos libres y gratis (dos veces free)


Bases jurídicas

Quien quiera conocer las justificaciones jurídicas de nuestro sistema no tiene más que descargarse este informe que hemos colgado en el portal Open Data Euskadi.

  1. 11/04/2011 a las 10:39

    Magnífico ejemplo de cómo, con voluntad e inteligencia, se pueden sortear los innumerables obstáculos de la burocracia para poder montar un proyecto. Gracias por contarnoslo.

  2. 05/04/2011 a las 11:36

    En relación con el tema de este debate, en la red LAPSI hemos puesto en marcha un premio para trabajos académicos relacionados con los aspectos jurídicos del acceso y reutilización de la información del sector público. Si conocéis a alguien interesado, la información detallada se encuentra disponible en http://www.lapsi-project.eu/

  3. 04/04/2011 a las 19:17

    @Andres No quisiera contribuir a vuestro empecinamiento mediante una mayor oposición 🙂
    Veamos cómo te suena esto:
    «Siempre he mantenido mis dudas que todos los servicios tengan que ofrecerse de manera electrónica, y mucho menos que toda haya de ofrecerse de modo gratuito. Cuando las cosas tienen un coste, de un modo u otro deben tratar de rentabilizarse.»
    o esto:
    «Siempre he mantenido mis dudas que la cita previa con el médico deba ofrecerse de forma telefónica, y mucho menos que toda haya de ofrecerse de modo gratuito. Cuando las cosas tienen un coste, de un modo u otro deben tratar de rentabilizarse.»
    y así sucesivamente… Con una diferencia: ofrecer datos es muchísimo más barato que mantener los servicios electrónicos, o el call-centre telefónico, o cualquier otro servicio público que se te ocurra.
    Además, como bien dices, la información pública ya está amortizada. Se generó para un fin determinado que ya ha cumplido. Una vez cumplida su misión, aún puede ser útil en manos de terceros.
    Creo que os ponéis la venda antes que la herida. Cuando nos aproximemos a un modelo insostenible de opendata, hablaremos. De momento, no lo veo en el horizonte, ni siquiera desde la cofa del palo mayor.
    Por cierto, «lo de USA» no tiene nada que ver con el coste de data.gov, sino con el de otros proyectos más caros y, en mi opinión, sólo se trata de una jugada de la extrema derecha para no verse amenazada por el Gobierno Abierto. Espero que estemos atentos para que aquí no suceda algo parecido, y menos con excusas como las que se han puesto.

  4. 04/04/2011 a las 19:00

    @alorza , la verdad es que no te había contestado porque creo que ya hemos llegado al acuerdo de nuestro desacuerdo alrededor de las tasas. Visto que @mgarrigap me incita, no me queda más remedio que acudir en su apoyo cuál mosquetero en apoyo del amigo.
    Siempre he mantenido mis dudas que toda la info haya que ponerse en formato reutilizable y procesable automáticamente, y mucho menos que toda haya de ofrecerse de modo gratuito. Cuando las cosas tienen un coste, de un modo u otro deben tratar de rentabilizarse. Cierto que en lo público hay para servicios que esto no ha de ser así, pero unos servicios que si se pagan sirven para compensar los que no se pagan y en otros existe un cierto co-pago.
    En el opendata debe tender a pasar lo mismo. Si bien las cuentas públicas deberían estar de forma gratuita en formato procesable o la información generada por sistemas más que amortizados (e.g. los GPS por donde todo empezó), no creo que a la larga sea un modelo sostenible. A la vista de los hechos en USA me remito.
    En fin que tengo por seguro que no nos vamos a poner de acuerdo nunca, pero en mi modesta opinión, la gratuidad total en este tema no la veo sostenible.

  5. 04/04/2011 a las 18:43

    @Marc, tendremos que quedar un día en serio a seguir discutiendo sobre esto, con una cerveza por medio 🙂
    Te contesto brevemente:
    Sobre la información que sólo esta en .doc, .pdf y similares… tranquilidad. Seguro que tenéis toneladas de información en formatos más reutilizables. Hay que empezar por lo más fácil. Entre tanto, los propios reutilizadores os dirán qué otra información es relevante para ellos, de manera que hagáis el esfuerzo donde merezca la pena.
    En cuanto a lo del formato RDF, me parece que entras en contradicción. Por una parte, estás dispuesto, con dolor de corazón, a contemplar la imposición de tasas porque generar los datos es caro, pero por otra eliges «para todos los casos» el formato que más cuesta generar. Creo que es mejor limitarte al formato que tu presupuesto te permita, y valorar en qué casos merece la pena un esfuerzo mayor.
    Es como con los coches. El «más recomendable» no es el que tengo yo, pero el que tengo que lleva y me trae perfectamente. Hay que buscar la solución «coste-efectiva», que dicen los sanitarios. O, como decía Vázquez Moltalbán en un poema de juventud: «no eres la chica dorada, pero te prefiero a la chica dorada».
    En todo caso, los reutilizadores me repiten con machacona insistencia que su prioridad ahora es contar con muchísimos más datos de los que cuentan, habida cuenta de la penuria actual. Dejemos las virguerías para la segunda fase, ya que cualquier formato que cumpla con estándares es suficiente para poder procesar la información, sin un esfuerzo excesivo por parte del reutilizador.

  6. 04/04/2011 a las 15:33

    Alberto,
    Mucha información que es pública se cuelga en la web en formato documento (ideal para la web).
    Pero no siempre está disponible en la web en formato dato «en crudo».
    Cómo apuntabas, en un portal OpenData hay que ofrecer datos (no docs). Lo que digo yo es que no siempre es inmediato este paso, ni barato!, dado que no siempre tienes en la web estos datos, (la información sí, en formato doc, pero los datos no siempre los tienes).
    Respecto al tema RDF es cierto que no es el único formato, pero sí el más recomendable, y dado que el objetivo de un Portal OpenData es la reutilización de la información, qué mejor que facilitar este acometido… ¿no?

  7. 04/04/2011 a las 15:13

    @Marc, veo que aún colea el debate de las tasas. Veamos si me explico.
    Estaremos de acuerdo en que «información pública = online». Si no está online, no la hemos hecho pública. Por lo tanto, la primera obligación es, simplemente, hacer visible en la web toda la información que debe ser pública.
    Una vez que está online, cuesta poco dejarla «en crudo» para su descarga.
    Lo que no tiene sentido es proceder al revés (¿quizá haya alguna excepción?): hacer opendata con información que ni siquiera hemos subido a la web.
    En cuanto a los «formatos reutilizables», RDF es un óptimo que permite tener datos «enlazados», pero no es el nivel mínimo exigible para que sean datos «reutilizables». Esto no es una opinión mía: es simplemente la definición que se da a este concepto. Para que los datos sen reutilizables basta con que estén en formatos estándar; esto es, basta con que cumplan con el esquema nacional de interoperabilidad. Aquí entran xml, csv, wms…

  8. 04/04/2011 a las 14:54

    Alberto,
    Excelente post.
    Aunque no lo comparto al 100%.
    En el primer apartado comentas que estamos abriendo datos (OpenData) no documentos (OpenDoc).
    Estoy completamente de acuerdo contigo…
    Pero esto no siempre es posible, es posible que te venga algun superior y que te diga que hay que ofrecer documentos en el portal OpenData… es un caso hipotético… 😉
    En el segundo apartado hablas de datos libres (por ejemplo mediante CC-BY).
    Completamente de acuerdo… y no entiendo que haya portales OpenData que no sean así, sinceramente no tiene sentido que no sean así.
    Consecuentemente, también coincidimos en el tercer apartado.
    Pero en el cuarto no coincidimos.
    Es cierto que las tasas son una gran barrera, aunque sean muy bajas (a parte que, como indicas, la gestión del eventual cobro también cuesta).
    Pero es posible – en conjuntos de datos muy específicos – que tenga sentido aplicarlas, tal como ya comentamos en casa de Andrés Nin hace un par de meses.
    Y, desde luego, en lo que no estoy de acuerdo es que «los datos son baratos».
    No comparto tu sentencia «Si una Administración ya está ofreciendo la información en su sitio web -lo cual es una obligación-, el coste de ofrecerla además en formatos reutilizables es mínimo».
    En un sitio web no ofreces tanta información, ni en un formato reutilizable, como tiene sentido que se ofrezca en un Portal OpenData.
    No estoy diciendo que tenga un coste astronómico, pero tampoco es barato.
    Tampoco estoy de acuerdo con una frase de Iñaki: «sin preocuparse mucho de elaborarlos. Ya los «tunearán» los infomediarios. Lo que hace falta es facilitar la información «fresca» y en formato reutilizable.»
    Creo, sinceramente, que es contradictoro este comentario.
    Ofrecer los datos en un formato reutilizable es, a mi entender, ofrecerlos en RDF.
    Y este formato, si se hace bién (o sea, tal como recomienda W3C), requiere elaboración de los datos, en función de cómo estén «originalmente» esta elaboración será más o menos costosa.
    Ahora ya tengo un poco de «experiencia real» en este ámbito… 🙂
    Saludos.

  9. 04/04/2011 a las 03:49

    En América Latina la burocracia estatal ejerce como una norma aquello que informacion es poder y ceder poder no esta en la lista de prioridades de nuestros gobiernos, creo que en la de ninguno realmente, pero en nuestras sociedades el escrutinio publico y el acceso a los datos públicos no es una costumbre arraigada, buscábamos en estos días unas lineas que nos ayudaran a desatar el nudo, publicamos recientemente un articulo en nuestro blog: Gobiernos abiertos con burocracias cerradas? http://bit.ly/eZEBGA , el articulo: El nudo gordiano de la apertura de datos públicos nos da una guia definitiva por donde comenzar!

  10. 02/04/2011 a las 11:05

    Que esta filosofía se popularizase, sería maravilloso. Y si alguien como vosotros, que buceáis a diario en el complicado entramado burocrático de la administración lo estáis consiguiendo e impulsando, no hay excusa para que los demás no lo intentemos.
    Gracias por la inspiración. Un saludo…

  11. 31/03/2011 a las 22:38

    Qué gusto me da encontrarme aquí con este post!!! Me hace sentir un par de años más joven!!! Tenemos que recuperar la buena costumbre de compartir y consultar nuestras reflexiones con esta especie de almohada electrónica!!! A ver si conseguimos sacar tiempo y ganas ;-).
    El planteamiento que expones en este post me parece impecable. Hasta tal punto que no se me ocurre que esto se pueda hacer de otra manera. Hay que ofrecer los datos libremente, de forma proactiva y, por supuesto, gratis.
    Y, además, sin preocuparse mucho de elaborarlos. Ya los «tunearán» los infomediarios. Lo que hace falta es facilitar la información «fresca» y en formato reutilizable.
    Que la fuerza nos acompañe para seguir cortando por lo sano otros nudos gordianos, que todavía nos quedan unos cuantos ;-).

  12. 31/03/2011 a las 21:01

    Gracias. @David Desde luego, lo deseable sería que la normativa y los reglamentos ayudaran un poco más.
    Por ejemplo, los datos geográficos tienen la Ley 14/2010 sobre las infraestructuras y los servicios de información geográfica. No la conozco apenas y quizá tenga sus carencias, pero al menos está consiguiendo que todas las Administraciones armonicen, compartan y abran la información geográfica. Algo así hará falta para el resto de la información pública.

  13. 31/03/2011 a las 19:14

    Me quito el sombrero Maese Alorza. Siempre abriendo camino. Y pregunto yo ahora: si vosotros que os habéis peleado con una normativa virgen habéis llegado a esta conclusión, ¿no sería deseable que se ajustara la Ley a las verdaderas posibilidades?

  14. 31/03/2011 a las 16:47

    Excelente post. Si el gobierno hace algo como http://data.gov.uk/ , puedo llorar

  1. No trackbacks yet.

Deja un comentario