L'“open data”, pourquoi ça coince

11 févr. 2013, PAR Acteurs Publics
  • 04
    MIN
  • 0

Le gouvernement affiche sa volonté de mener une politique résolue d'ouverture des données publiques, mais le chemin sera long avant de modifier en profondeur les habitudes des administrations. Première partie de notre dossier qui liste les principaux freins à l'ouverture et à la réutilisation des données publiques.


1. Un périmètre limité de données publiables
Qu’est-ce qu’une donnée publique ? Selon la loi “historique” de 1978, modifiée en 2003 à la suite de la transposition d’une directive européenne sur leur réutilisation, les données publiques sont les “informations figurant dans les documents produits ou reçus par les administrations”. Documents administratifs produits ou reçus par un acteur public ou privé dans l’exercice d’une mission de service public – hors établissement industriel et commercial –, études, notes, mais aussi mesures statistiques ou cartes géographiques sont considérés comme des données publiques. En sont exclues les données couvertes par le secret ou celles portant sur la vie privée, sauf si les données ont été anonymisées.
Hormis ces réserves, le champ des données publiques est particulièrement vaste. Sur ces données, les usagers ont un droit opposable à l’administration de les réutiliser, sous réserve, parfois de devoir payer une redevance, ce qui constitue l’une des limites, non négligeables, en faveur du “libre” (open). Ce n’est pas la seule. Car malgré une définition largement entendue de ce qui est considéré comme “donnée publique”, certaines d’entre elles peuvent se situer hors du cadre. Les données détenues par les grandes entreprises publiques, au premier rang desquelles celles de transport, comme le RATP ou la SNCF, ne sont pas soumises à la loi de 1978, pas plus que celles des établissements culturels, du fait d’un droit de propriété. Se pose alors la nécessité, peut-être, et alors que tout produit de la data (donnée), de repenser le cadre de 1978 modifié, trop attaché à une conception ancienne du document administratif.

2. Gratuit vs payant ?
Les administrations qui s’inquiètent pour le devenir de leurs données une fois celles-ci libérées, peuvent en encadrer l’usage par la délivrance de licences. L’enjeu étant de pouvoir maintenir l’intégrité des données tout en facilitant un usage le plus large possible, par un partage et un enrichissement successifs. Dans cette optique, un consensus s’est dégagé parmi la communauté du “libre” en faveur des licences type Odbl ou des licences “ouvertes”, comme celles proposées gratuitement par Etalab. Afin de ne pas tuer l’esprit d’innovation des petits investisseurs et autres start-up la France a fait le choix de la gratuité par défaut. Et de la réutilisation sous licence payante, l’exception. Seul le coût de mise à disposition peut être facturé par un ministère, dès lors que la production des données en tant que telle entre dans le cadre de leur mission de service public, financée par l’impôt. Un principe qui n’est pas du goût des grands éditeurs. Ceux-ci voient en effet d’un mauvais œil l’arrivée sur le marché de nouveaux concurrents et plaident en coulisse pour une mise à disposition payante plus large des données publiques par l’administration, qu’ils seront ainsi les seuls à pouvoir s’offrir, quitte ensuite à les facturer encore plus cher à leurs clients. Non sans avoir au passage demandé à l’administration de prendre à sa charge le coût de retraitement des données.

3. L’absence de moyens
Par décret du 21 février 2011, François Fillon, alors Premier ministre, faisait entrer la France dans l’ère de l’open data en créant la mission Etalab. Son objectif : coordonner l’action des administrations d’État et apporter son appui à ces établissements administratifs pour faciliter la réutilisation la plus large possible de leurs informations publiques. Dix mois plus tard, Etalab ouvrait son portail Data.gouv.fr. Un tour de force salué par nombre d’experts de la communauté du web. À peine nommés, les correspondants Etalab, avec l’aide d’un ou deux adjoints, n’ont pas démérité pour parvenir à publier un maximum de jeux de données dans des délais très courts.
L’idée selon laquelle, en un seul clic, les données peuvent être extraites d’un système d’information dédié et transférées sur le portail d’Etalab est un peu simpliste. Les spécialistes d’Etalab ont buté sur des difficultés techniques. Toutes les données ne sont pas classées et répertoriées proprement, ce qui a nécessité un travail fastidieux de recensement. Une fois les données récupérées, il fallait encore les mettre dans un format réutilisable, à l’état “brut”, et casser les codes. Normal, dans ces conditions, que les administrations, faute de moyens, aient pourvu au plus pressé et “publié les données les plus facilement mobilisables”, souffle un haut fonctionnaire, et cela sans se soucier de leur qualité ni de leur fiabilité. Or, si les administrations ont pu jusqu’à présent faire le travail de recensement avec les moyens du bord, très vite, la question des compétences risque de rebondir, tant il est vrai que la mise à jour et la diffusion de données en temps réel risquent de bouleverser durablement les méthodes de travail des agents. Et de nécessiter des outils informatiques adaptés.

Les données publiques de l’État en chiffres
200 correspondants dans les administrations
350 000 jeux de données sur le portail Data.gouv.fr
87 millions d’euros tirés des licences

 

 

ÉGALEMENT SUR ACTEURS PUBLICS