{"id":533,"date":"2012-08-12T04:08:29","date_gmt":"2012-08-12T02:08:29","guid":{"rendered":"http:\/\/gcolpart.evolix.net\/blog21\/?p=533"},"modified":"2012-08-14T11:04:37","modified_gmt":"2012-08-14T09:04:37","slug":"open-data-revolution-ou-effet-de-mode","status":"publish","type":"post","link":"https:\/\/gcolpart.evolix.net\/blog21\/open-data-revolution-ou-effet-de-mode\/","title":{"rendered":"Open Data, r\u00e9volution ou effet de mode ?"},"content":{"rendered":"<p>Le principe de l&#8217;<a href=\"http:\/\/en.wikipedia.org\/wiki\/Open_data\">Open Data<\/a> n&#8217;a rien de r\u00e9volutionnaire. Quoi de plus naturel de mettre \u00e0 disposition des citoyens\/usagers\/clients les donn\u00e9es int\u00e9ressantes ? C&#8217;est donc un simple retour \u00e0 la raison&#8230; m\u00eame si c&#8217;est \u00e9tonnant pour notre soci\u00e9t\u00e9 qui marche sur la t\u00eate dans bien des domaines. En quelques ann\u00e9es, l&#8217;Open Data est devenu un <a href=\"http:\/\/www.google.com\/trends\/?q=%22open+data%22\">effet de mode<\/a> : je suis \u00e0 la fois enthousiaste de voir les valeurs de transparence v\u00e9hicul\u00e9es par les Logiciels Libres s&#8217;\u00e9tendre \u00e0 d&#8217;autres domaines ; et \u00e0 la fois suspicieux d&#8217;entendre des discours politiques pr\u00e9matur\u00e9s, de voir des requins esp\u00e9rant d\u00e9crocher des budgets gr\u00e2ce \u00e0 ce buzzword, de constater la publication de donn\u00e9es sans queue ni t\u00eate, de d\u00e9plorer tant d&#8217;aberrations techniques, etc. Le sc\u00e9nario catastrophe \u00e9tant que les hommes politiques s&#8217;ach\u00e8tent une cr\u00e9dibilit\u00e9 en allouant des budgets \u00e0 des consultants externes pay\u00e9s \u00e0 produire des documents Excel sans int\u00e9r\u00eat.<\/p>\n<p>Pour \u00e9viter ce sc\u00e9nario, je partage quelques points qui me trottent dans la t\u00eate :<\/p>\n<h3>Quelles donn\u00e9es Open Data ont d\u00e9j\u00e0 \u00e9t\u00e9 publi\u00e9es ?<\/h3>\n<p>Il existe bien s\u00fbr des annuaires qui tentent de recenser toutes ces donn\u00e9es. S&#8217;int\u00e9resser aux donn\u00e9es d\u00e9j\u00e0 publi\u00e9es permet de copier les bonnes id\u00e9es ! Voici une petite liste (non exhaustive) :<\/p>\n<p>&#8211; Donn\u00e9es \u00e9mises par des \u00c9tats : <a href=\"http:\/\/data.gov\">USA (data.gov)<\/a>, <a href=\"http:\/\/data.gov.uk\">Grande-Bretagne (data.gov.uk)<\/a>, <a href=\"http:\/\/data.gouv.fr\">France (data.gouv.fr)<\/a> <a href=\"http:\/\/en.wikipedia.org\/wiki\/Open_data#Open_data_in_government\">etc.<\/a><br \/>\n&#8211; Donn\u00e9es locales : <a href=\"http:\/\/data.london.gov.uk\/\">Londres<\/a>, <a href=\"http:\/\/www.trafford.gov.uk\/opendata\/\">Trafford<\/a>, <a href=\"http:\/\/www.data.rennes-metropole.fr\/\">Rennes<\/a>, <a href=\"http:\/\/data.grandtoulouse.fr\/\">Toulouse<\/a>, <a href=\"http:\/\/opendata.paris.fr\">Paris<\/a>, <a href=\"http:\/\/opendata.montpelliernumerique.fr\/\">Montpellier<\/a>, <a href=\"http:\/\/data.loire-atlantique.fr\/\">Loire Atlantique<\/a>, <a href=\"http:\/\/www.datalocale.fr\/\">Gironde et Aquitaine<\/a>, <a href=\"http:\/\/opendata.regionpaca.fr\/\">PACA<\/a>, etc.<br \/>\n&#8211; Donn\u00e9es de transport : <a href=\"http:\/\/www.mta.info\/developers\/\">transports publics \u00e0 NYC<\/a>, <a href=\"http:\/\/www.marinetraffic.com\/\">g\u00e9olocalisation des navires<\/a>, <a href=\"http:\/\/www.flightradar24.com\/\">g\u00e9olocalisation des avions<\/a>, <a href=\"http:\/\/data.sncf.com\">SNCF<\/a>, <a href=\"http:\/\/www.ratp.fr\/fr\/ratp\/r_70350\/open-data\/\">RATP<\/a><br \/>\n&#8211; Donn\u00e9es g\u00e9ographiques : <a href=\"http:\/\/www.openstreetmap.org\/\">OpenStreetMap<\/a>, <a href=\"http:\/\/simbad.u-strasbg.fr\/simbad\/\">base astronomique<\/a>, <a href=\"http:\/\/www.data-publica.com\/editor\/82\">observations m\u00e9t\u00e9o des 7 derniers jours<\/a><br \/>\n&#8211; Donn\u00e9es culturelles : Biblioth\u00e8que Nationale avec <a href=\"http:\/\/data.bnf.fr\/\">data.bnf.fr<\/a> et <a href=\"http:\/\/gallica.bnf.fr\/\">Gallica<\/a>, <a href=\"http:\/\/mp2013.fr\/\">MP2013<\/a>, <a href=\"http:\/\/musicbrainz.org\">Musicbrainz<\/a><br \/>\n&#8211; Donn\u00e9es scientifiques : <a href=\"http:\/\/ckan.net\/group\/bioportal\">donn\u00e9es biologiques<\/a>, <a href=\"http:\/\/www.openedition.org\/\">openedition<\/a><\/p>\n<p>\u00c0 compl\u00e9ter sur <a href=\"http:\/\/pad.evolix.org\/p\/opendata\">http:\/\/pad.evolix.org\/p\/opendata<\/a><\/p>\n<h3>Quelles donn\u00e9es voulons-nous en Open Data ?<\/h3>\n<p>Alors que certaines institutions sont pr\u00eates \u00e0 jouer le jeu, la question essentielle est de savoir quelles donn\u00e9es nous voulons avoir ! En effet, ce sont aux citoyens\/usagers\/clients de r\u00e9clamer certaines donn\u00e9es (avant d&#8217;en cr\u00e9er eux-m\u00eames dans certains cas). Et cette question n&#8217;est pas si simple&#8230;<\/p>\n<p>Vous avez des id\u00e9es d&#8217;analyse de donn\u00e9es ? d&#8217;applications ? de cr\u00e9ation de start-ups ? Alors r\u00e9clamez les donn\u00e9es n\u00e9cessaires ! <\/p>\n<p>Voici quelques id\u00e9es :<\/p>\n<p>&#8211; Les horaires (commerces, \u00e9tablissements\/services publics, mus\u00e9es\/jardins\/parcs, etc.)<br \/>\n&#8211; File d&#8217;attente (temps r\u00e9el et stats) des pr\u00e9fectures, mairies, SS, CAF, m\u00e9decins\/h\u00f4pitaux<br \/>\n&#8211; Remplissage en temps r\u00e9el des parkings publics et priv\u00e9s<br \/>\n&#8211; Donn\u00e9es (temps r\u00e9el et stats) des autoroutes et de points de passage<br \/>\n&#8211; Donn\u00e9es (temps r\u00e9el et stats) des v\u00e9los libres, hors-service et bornes libres<br \/>\n&#8211; Donn\u00e9es de remplissage (temps r\u00e9el et stats) des transports en communs<br \/>\n&#8211; Horaires (et retards) pr\u00e9vus des transports en communs<br \/>\n&#8211; G\u00e9olocalisation en temps r\u00e9el des transports en commun<br \/>\n&#8211; Budgets d\u00e9taill\u00e9s de toutes les structures publiques&#8230; ou subventionn\u00e9es<br \/>\n&#8211; R\u00e9sultats de chaque \u00e9lection<br \/>\n&#8211; Donn\u00e9es et statistiques de l&#8217;INSEE<br \/>\n&#8211; Suivis et r\u00e9sultats de la Recherche publique&#8230; ou subventionn\u00e9e<br \/>\n&#8211; Donn\u00e9es m\u00e9t\u00e9orologiques<br \/>\n&#8211; Donn\u00e9es (temps r\u00e9el et stats) sur la consommation locale et r\u00e9gionale d&#8217;\u00e9lectricit\u00e9, d&#8217;eau et de gaz<br \/>\n&#8211; Les tarifs et stocks des produits vendus un commerce (un supermarch\u00e9 par exemple)<br \/>\n&#8211; La composition d\u00e9taill\u00e9e des produits vendus<\/p>\n<p>\u00c0 compl\u00e9ter sur <a href=\"http:\/\/pad.evolix.org\/p\/opendata\">http:\/\/pad.evolix.org\/p\/opendata<\/a><\/p>\n<h3>Les licences de l&#8217;Open Data<\/h3>\n<p>\u00c9tudier et choisir les licences est important mais souvent ennuyeux. Les Logiciels Libres ont une exp\u00e9rience de plus de 20 ans dans ce domaine, et c&#8217;est dommage que ceux qui publient de l&#8217;Open Data ne s&#8217;y int\u00e9ressent pas davantage : certaines erreurs seraient \u00e9vit\u00e9es, notamment de r\u00e9-\u00e9crire sa propre licence, ce qui entra\u00eene de nombreuses licences sur le &#8220;march\u00e9&#8221; et des probl\u00e8mes de compatibilit\u00e9, de fusion, etc. J&#8217;encourage donc \u00e0 utiliser les licences les plus communes comme <a href=\"http:\/\/opendatacommons.org\/licenses\/odbl\/\">l&#8217;Open Database License (ODbL)<\/a> (utilis\u00e9e par <a href=\"http:\/\/www.openstreetmap.org\/\">OSM<\/a>) ou la <a href=\"http:\/\/opendatacommons.org\/licenses\/pddl\/\">Public Domain and License (PDDL)<\/a>; en France, la <a href=\"http:\/\/www.etalab.gouv.fr\/pages\/licence-ouverte-open-licence-5899923.html\">Licence Ouverte<\/a> a \u00e9t\u00e9 publi\u00e9e <a href=\"http:\/\/www.etalab.gouv.fr\/\">par l&#8217;\u00c9tat<\/a> sp\u00e9cialement pour l&#8217;Open Data et me semble tr\u00e8s int\u00e9ressante en terme de libert\u00e9 et compatibilit\u00e9, et les projets fran\u00e7ais devraient a priori l&#8217;adopter.<\/p>\n<h3>Comment publier techniquement des donn\u00e9es Open Data ?<\/h3>\n<p>Les donn\u00e9es ne pr\u00e9sentent que peu d&#8217;int\u00e9r\u00eat si elles ne sont pas publi\u00e9es sous un format standard et ouvert. Autant dire qu&#8217;un document PDF ou Excel \u00e0 t\u00e9l\u00e9charger n&#8217;est pas vraiment de l&#8217;Open Data&#8230; et c&#8217;est pourtant ce que l&#8217;on trouve majoritairement sur <a href=\"http:\/\/data.gouv.fr\/\">data.gouv.fr<\/a> ! Il faut bien avoir en t\u00eate que les donn\u00e9es ne sont pas destin\u00e9es \u00e0 \u00eatre lues directement par des humains. On privil\u00e9giera donc des formats comme du CSV, XML ou JSON, facilement utilisables par des applications. Pour certains domaines, des nouveaux formats doivent \u00eatre cr\u00e9es (exemple avec les <a href=\"http:\/\/www.dft.gov.uk\/public-transportdatastandards\/\">donn\u00e9es de transport<\/a>) et l&#8217;on veillera donc bien \u00e0 utiliser le bon format.<\/p>\n<p>L&#8217;autre point important d&#8217;une publication de donn\u00e9es (et surtout pour les donn\u00e9es en temps r\u00e9el) est son accessibilit\u00e9 par des URLs simples et logiques. Par exemple, en s&#8217;inspirant du style <a href=\"http:\/\/en.wikipedia.org\/wiki\/Representational_state_transfer\">REST<\/a>, un tarif d&#8217;un produit \u00e0 une date donn\u00e9e sera accessible via une requ\u00eate HTTP GET sur une URL du type <em>http:\/\/data.example.com\/products\/product1\/tarif\/20100701\/EUR<\/em><\/p>\n<p>L&#8217;\u00e9minent Tim Berners-Lee <a href=\"http:\/\/inkdroid.org\/journal\/2010\/06\/04\/the-5-stars-of-open-linked-data\/\">a d\u00e9fini la qualit\u00e9 des donn\u00e9es publi\u00e9es par un syst\u00e8me d&#8217;\u00e9toiles<\/a> ainsi :<\/p>\n<p>\u2605\tmake your stuff available on the web (whatever format)<br \/>\n\u2605\u2605\tmake it available as structured data (e.g. excel instead of image scan of a table)<br \/>\n\u2605\u2605\u2605\tnon-proprietary format (e.g. csv instead of excel)<br \/>\n\u2605\u2605\u2605\u2605\tuse URLs to identify things, so that people can point at your stuff<br \/>\n\u2605\u2605\u2605\u2605\u2605\tlink your data to other people\u2019s data to provide context<\/p>\n<h3>Comment aider le mouvement Open Data ?<\/h3>\n<p>On r\u00e9pond souvent qu&#8217;il faut  <a href=\"http:\/\/openstreetmap.fr\/participer\">contribuer \u00e0 OpenStreeMap<\/a> et promouvoir l&#8217;Open Data. C&#8217;est vrai, mais je vous encourage aussi \u00e0 r\u00e9clamer les donn\u00e9es qui vous paraissent int\u00e9ressantes aupr\u00e8s des institutions\/entreprises ! Et \u00e0 concevoir des proc\u00e9d\u00e9s astucieux (comme <a href=\"http:\/\/www.marinetraffic.com\/ais\/faq.aspx?level1=160#5\">utiliser des r\u00e9cepteurs AIS<\/a>) pour g\u00e9n\u00e9rer de nouvelles donn\u00e9es.<\/p>\n<p>Si vous avez de bonnes id\u00e9es, <a href=\"http:\/\/pad.evolix.org\/p\/opendata\">notez les ici<\/a> ! On pourrait notamment profiter du <a href=\"http:\/\/www.regionpaca.fr\/actualites\/detail-actualite\/article\/open-data-garage-les-donnees-en-toute-liberte.html\">mouvement d&#8217;ouverture de donn\u00e9es en r\u00e9gion PACA<\/a> pour obtenir ces donn\u00e9es ou un appui. Et si des id\u00e9es int\u00e9ressantes \u00e9mergent, avec des personnes motiv\u00e9es, on pourrait participer au <a href=\"http:\/\/hackdatapaca.net\/\">Hackathon organis\u00e9 \u00e0 Marseille fin septembre 2012<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Le principe de l&#8217;Open Data n&#8217;a rien de r\u00e9volutionnaire. Quoi de plus naturel de mettre \u00e0 disposition des citoyens\/usagers\/clients les donn\u00e9es int\u00e9ressantes ? C&#8217;est donc un simple retour \u00e0 la raison&#8230; m\u00eame si c&#8217;est \u00e9tonnant pour notre soci\u00e9t\u00e9 qui marche sur la t\u00eate dans bien des domaines. En quelques ann\u00e9es, l&#8217;Open Data est devenu un [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[72],"tags":[128,131,129,55,127,130],"class_list":["post-533","post","type-post","status-publish","format-standard","hentry","category-french","tag-format","tag-hackdatapaca","tag-licence","tag-marseille","tag-open-data","tag-paca"],"_links":{"self":[{"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/posts\/533","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/comments?post=533"}],"version-history":[{"count":16,"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/posts\/533\/revisions"}],"predecessor-version":[{"id":549,"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/posts\/533\/revisions\/549"}],"wp:attachment":[{"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/media?parent=533"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/categories?post=533"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gcolpart.evolix.net\/blog21\/wp-json\/wp\/v2\/tags?post=533"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}