Comprendre l’ouverture des données publiques

20/07/2014

FlightRadar24
FlightRadar 24 suit en temps réel les mouvements des avions qui assurent des vols commerciaux, un exemple de collecte de données mixte s’appuyant sur le crowdsourcing.

Concept d’origine anglo-saxonne, où la tradition de transparence est plus forte qu’en Europe, l’open data (ou données ouvertes) « a vu le jour dans le domaine de la recherche publique », relève Simon Chignard dans « Open data », un ouvrage publié il y a deux ans chez Fypéditions. Qu’est-ce qu’une donnée ouverte ? Quelle est sa finalité ? Quels sont ses enjeux ? Autant de questions analysées tour à tour par l’auteur, qui ne s’intéresse pas qu’aux seules données publiques. Le phénomène a commencé à gagner le domaine privé et plusieurs initiatives participatives permettent de collecter, à plus ou moins grande échelle, des données indisponibles via le crowdsourcing.

« Pour qu’une donnée soit qualifiée d’ouverte, il faut qu’elle réponde à un ensemble de critères techniques, juridiques et économiques », écrit Simon Chignard. « La mise à disposition d’un format technique le plus ouvert possible (…) , l’utilisation de licences juridiques ouvertes (…) , la limitation de redevances susceptibles de constituer des freins économiques. » Pour qu’une donnée publique soit considérée comme ouverte, l’auteur considère que celle-ci doit se conformer à huit principes : données complètes, à jour, accessibles à tous, dont le traitement peut être automatisé, dont l’accès est non-discriminant, dont le format est non-propriétaire et dont la licence est libre. Or, constate-t-il, ces huit critères ne sont pas toujours remplis. Les données ne sont pas toutes publiées à l’état brut, certains formats (comme le PDF) ne permettent pas un traitement automatisé, la mention de licences applicables à la réutilisation de ces données n’est pas toujours apparente.

L’utilisation de données publiques peut être commerciale ou non (développement de sites, d’applis qui, souvent, en oriente l’utilisation). Elle occupe également le terrain du datajournalisme, un « usage de médiation ». Selon Simon Rogers (qui a lancé et animé le « datablog » du quotidien britannique The Guardian avant de rejoindre Twitter), le journalisme de données c’est avant tout une manière de raconter « une bonne histoire » et les datavisualisations ne constituent pas une fin en soi. « C’est 80% de transpiration, 10% d’idée géniale et 10% de résultat final ».

Quant aux limites de l’ouverture des données, elles portent  sur « les bénéficiaires de cette transparence (…), les risques de fragilisation des modèles économiques de la donnée, (…) la privatisation des données publiques », dans un contexte juridique qui encadre strictement la divulgation de données à caractère privé.

Histoire, enjeux et acteurs : voici le portrait de l’open data tiré en 189 pages, illustré de nombreux exemples de données ouvertes.

(L.D.)

Simon Chignard, « Open Data. Comprendre l’ouverture des données publiques », Fypéditions, 2012

Mots-clés: | |