Inicio > #oGov, alorza.net, Eventos, Open Government, Tecnologia > 5 provocaciones para un debate sobre open data

5 provocaciones para un debate sobre open data

08/01/2012

día del W3C en España

En el marco de la Open Source World Conference, el 12 de enero se celebra en Granada el día del W3C en España, bajo el lema “la plataforma web abierta“. Este año, hay dos focos principales de atención: HTML5 y open data.

Yo participaré en la sesión 2: “RISP… ¿hay alguien ahí?”. Carlos de la Fuente (CTIC), que será nuestro anfitrión, pretende que cada uno hagamos una microponencia, con un máximo de 5 diapositivas, de manera que quede mucho tiempo para el debate con los asistentes, con los internautas y entre los ponentes. Buena idea. Podemos empezar desde ahora, si os parece bien.

Como tengo cinco diapos, tengo también cinco ideas, que espero sean lo bastante provocadoras como para mover a un debate interesante.

Idea 1: Se ha hecho muy poco todavía.

El movimiento open data público ha empezado a ganar masa crítica en 2010. España ocupa un lugar destacado en Europa. Sin embargo, lo que tenemos es aún muy poco, pequeños charcos en un desierto. Los portales de open data, que han surgido sobre todo en los niveles autonómico y local, son aún escasos, y pocos de ellos reúnen cantidad y calidad como para ser útiles a los reutilizadores. Sin embargo, tenemos dos excelentes casos que deben servir de ejemplo para todos los demás:

Idea 2: Énfasis en la armonización de algunos datasets, no en abrir portales

Si exceptuamos los dos casos citados, todavía hay una escasa reutilización de la información del sector público. No debería sorprendernos. ¿Qué puede hacer un emprendedor con un dataset que sólo va a encontrar en, digamos, dos comunidades autónomas y un municipio? ¿Qué servicio se puede construir sobre esa información? Por eso, algunos opinamos que la prioridad no es tanto abrir portales opendata, sino alcanzar un compromiso para que todas las Administraciones liberen algunos conjuntos de datos especialmente útiles. A ser posible, con una misma estructura de información. Nuevamente, el ejemplo de los datos espaciales nos muestra el camino.

Idea 3: Énfasis en en los datos, no en el modelo tecnológico.

Hemos cometido un grave error al categorizar la iniciativas RISP según el modelo de 5 estrellas de Berners-Lee. Primero, porque no se puede aplicar a catálogos completos, ya que lo normal es que haya cierta heterogeneidad de formatos. Segundo, porque lo prioritario no es alcanzar la excelencia tecnológica de unos pocos datasets, sino liberar mucha y muy interesante información que pueda ser reutilizada. Lo que debemos hacer es ponernos firmes con la tercera estrella (formatos no propietarios) como estándar mínimo aceptable. Esto es, un pdf no es reutilizable. Ese es un mensaje más claro que el actual. Por cierto, ¿en qué momento la 4ª estrella dejó de ser “una URI para cada dataset” para pasar a significar “RDF”?

Idea 4: Un modelo sostenible de liberación masiva basado en la web corporativa.

En relación a la información del sector público, lo básico y principal debe seguir siendo ofrecer la información -toda la información- de manera clara, usable y accesible, en la web corporativa. La información pública es de la ciudadanía y tenemos la obligación de ponerla a su disposición. Esta es la verdadera transparencia. Una vez en internet, la derivada open data es un subproducto que se obtiene de manera sencilla y barata. XML es un buen formato para la reutilización.

Idea 5: Marcar unas reglas de juego favorables a la reutilización.

La reutilización, ya sea para fines cívicos o económicos, precisa de unas reglas de juego, no solo claras, sino también favorables a la reutilización. Hay que aplaudir el Real Decreto 1495/2011 sobre reutilización de datos para el ámbito público estatal, que resuelve muchas de las dudas. Aún quedan otras por resolver, especialmente en cuanto al contrato social que se debe establecer para un partenariado público-privado-personas (PPPP), donde la Administración sea subsidiaria y no compita con las iniciativas civiles y empresariales.

______________________________________________________________________________

Lista de ponentes:

Jorge Campanillas
Abogado especialista en Derecho de las Tecnologías de la Información y Comunicaciones
Carlos de la Fuente
Director Servicios Tecnológicos, CTIC
María Jesús Fernández
Responsable de la Web Municipal, Ayuntamiento de Zaragoza
Emilio García
Ministerio de Política Territorial y Administración Pública
José Luis Marín
Euroalert
Alberto Ortiz de Zárate
Director General de Atención Ciudadana, Gobierno del País Vasco
Cristina Puente
Jefa de Gabinete de Prospectiva Tecnológica, Junta de Andalucía

Las diapositivas:

Anuncios
  1. 08/01/2012 en 22:52

    sin desmerecer las 5 stars q están bien, pero condiciones más simples y más orientadas a la reutilización básica opendata están aqui
    http://meloda.org

    • 08/01/2012 en 23:26

      Me gustan las condiciones Meloda:

      1) Be a set of data (not a mere document)
      2) Access automated (i.e. unique link, web service, etc)
      3) A licence which enables a commercial use
      4) Released in an open standard. As an exception some standards are admitted because there are stable open source tools implementing it.
      5) It is released for free

      Yo diría que coinciden con los requisitos que nos hemos impuesto en Open Data Euskadi.

  2. 08/01/2012 en 22:58

    ¿Vas a hablar de licencias para esa reutilización de la información?

  3. 08/01/2012 en 23:06

    Creo que esta vez no toca hablar de licencias.

    En muchos casos, los datos públicos son eso, públicos, y sería contradictorio aplicarles una licencia. Para otros casos, estamos aplicando CC-BY.

  4. Antonio Ibáñez
    09/01/2012 en 10:31

    5 ideas más que acertadas, no esperaba menos 🙂

    La armonización de datos (primer paso) debería acompañarse después (segundo paso) de la armonización de los vocabularios.

    De acuerdo especialmente en el punto 3: PDF no es reutilización. Añadiría que HTML tampoco.

    • 09/01/2012 en 10:49

      Gracias, Antonio. Estoy de acuerdo con lo que dices, siempre que no se nos escape cuál es la prioridad. Como bien dices, la armonización de datos es el primer paso, el que más urge, y que además es valioso incluso sin dar el segundo paso. La armonización de vocabularios es deseable, pero debe plantearse (como tú bien señalas) como un segundo paso.

      También de acuerdo con lo segundo que dices: HTML no es un formato reutilizable.

  5. 09/01/2012 en 10:58

    Para ayudarte un poco en el debate yo voy a presentar el análisis de la re-utilización efectiva que hace de Euroalert de los datos de los portales que se han lanzado en España hasta el momento. Vamos un caso práctico en toda regla. Y hasta ahí puedo leer….

    • 09/01/2012 en 11:42

      Guau, eso que es provocativo. Estoy impaciente por conocerlo.

  6. 09/01/2012 en 17:53

    Provocando !! Los datos publicados en los portales open data son poco útiles a los reutilizadores. Totalmente cierto. Por qué? Varios motivos, señalo dos importantes; uno, porque no se produce el dialogo esperado y necesario para conocer la demanda y ajustar la oferta. Open Data tendrá éxito siempre que exista dialogo fluido entre reutilizadores y promotores de la apertura de datos. Hay que escuchar, pero es muy importante saber preguntar y a quien hacerlo, Otro motivo, es el problema eterno de vencer los miedos a la apertura de datos con sensibilidad política. No olvidemos que la necesidad de transparencia tanto de la gestión publica como de la actividad política es un clamor en la calle. No tenemos Ley de Transparencia, es necesaria, pero de momento nos conformaríamos con una buena actitud de la administración publica por cumplir con su obligación de transparencia en su gestión aportando datos, para su reutilizacion, en los portales Open Data.

    Estoy totalmente de acuerdo con la armonización de algunos datasets. Fundamental para acelerar los procesos de apertura por parte de distintas administraciones.

    No seré yo quien cuestione el valor de las 5 estrellas o mejor dicho, el de la mayor calidad en cuanto a la forma de publicar los datos enlazables (Linked Open Data) porque quien sabe aprovechar adecuadamente esta estrategia es capaz de desarrollar herramientas mas potentes y escalables (vease iniciativas de desarrollo de apps como las de la BBC). Nos falta aun recorrido en el lado de la demanda para aprovechar todo el potencial de los estándares abiertos sobre los que se desarrolla la Web. Dicho esto, ya he estado muy de acuerdo contigo y otros promotores Open Data que lo importante es abrir cuanto mas y mejor, independientemente de la sofisticación tecnológica, ya que el momento es el de la atención y generación de la demanda de datos.

    En cualquier caso, 5 buenos planteamientos par aun intenso debate abierto. Y no será el ultimo.

  7. 09/01/2012 en 21:32

    Carlos, si dices cosas tan razonables va a ser difícil tener un debate movido. ¿Has pensado en invitar a Risto Mejide?

    Estoy de acuerdo en algunas de las causas de la baja utilidad de los datos son las que señalas. Lo que pasa es que, en la mayoría de los casos, simplemente no se ha liberado ningún dato, por lo que no hay una oferta que ajustar a la demanda. Yo defiendo que la opción más segura es empezar por liberar rápidamente todos los datos que estén a mano, de manera que el diálogo con los reutilizadores se dé con algo sobre la mesa. Es más fácil trabajar cuando ya hay algo que sobre el vacío.

    Yo tampoco cuestiono los Linked Data, desde luego. El caso del Ayuntamiento de Zaragoza me parece digno de elogio: “El catálogo de datos incluye cientos de conjuntos de datos (…) Este catálogo incluye también, una decena de conjuntos de datos en formato Linked Data”

  8. 09/01/2012 en 22:56

    Para animar el debate (no podré estar con vosotros) os creeis q la liberación de datos fiscales podría acabar (con la cooperación ciudadana) con parte del fraude fiscal y de la economía sumergida?

  9. 16/01/2012 en 03:19

    Muy buenas, tus 5 ideas me parecen excelentes, pero quiero resaltar la tercera idea, se debería enfatizar mas el modelo tecnológico, y comparto tu opinión, creo que tanto los modelos tecnológicos como los datos se deben tener en cuenta a la par…
    gracias…

  1. 09/01/2012 en 09:59
  2. 09/01/2012 en 11:12
  3. 10/01/2012 en 11:32
  4. 12/01/2012 en 23:00
  5. 26/03/2012 en 14:58
Los comentarios están cerrados.
A %d blogueros les gusta esto: