Un aperçu de l’Open-data via l’expérience de Regards Citoyens
François Massot, administrateur de Regards Citoyens
Tous les administrateurs sont bénévoles, l’association n’a pas de salariés. Six citoyens qui se sont rencontrés sur internet ont décidé de créer l’association en 2009 autour de la question de l’activité parlementaire, décrypter ce qui s’y passe, ce qui s’y vote, y compris dans le domaine du numérique.
Le site "nos députés.fr" est créé en septembre 2009 pour donner accès aux citoyens à l ’information sur leur députés, donner des informations objectives issues des sites officiels sur leurs députés (mettre en valeur l’activité des parlementaires à l’Assemblée nationale). Les sites sont mis à jour toutes les 8 heures. Il y a deux sites "nos députés" (www.nosdéputés.fr) et "nos sénateurs" (www.nossénateurs.fr).
Regards Citoyens compile des données et les structure (travail de codage important), puis, par une recherche par mots-clés, on peut connaitre toutes les activités des parlementaires français et les sujets sur lesquels ils interviennent.
Open-data : définition
Il s’agit d’une information gratuite, libre de droits, et ce sont des données publiques. L’Open data concerne par définition les données publiques et non privées : les dimensions liées à la liberté et à la protection de la vie privée n’entrent pas en ligne de compte ici.
75% du travail de RC est dédié à la reconstruction des données publiques, via des robots ou des personnes et elles sont structurées. Cela implique un travail de codage et de maintenance important.
Une fois restructurées, elles sont redistribuées : c’est la définition de l’open-data.
L’open data existe à partir du moment où on fait tomber 3 barrières :
barrière financière : données gratuites -> favoriser l’accès à tout citoyen (ici il est question des licences, voir plus bas)
barrière juridique : licences libres -> libres de droits de propriété, réutilisation et partage des données qui peuvent être améliorées
barrière technique : formats ouverts -> format lisibles (pas de pdf pour les machines ni de textes illisibles pour les personnes. donc le plus courant est un tableur en format csv).
Dans le monde de l’open-data dès qu’on commence à partager les données, elles ont davantage de valeur, elles deviennent des biens-communs. RC a "épousé" le mouvement open-data qui est né en France en 2009/2010
L’Open Data : 2 types de licences
Licence ouverte (LO) : juste une obligation de citation du producteur des données (mise en place par le gouvernement). Licence la plus libre que l’on peut imaginer
Licence ODBL-Open Database Licence (http://vvlibri.org/fr/licence/odbl/10/fr) : obligation de citer la personne qui a produit les données + obligation de republier les données que l’utilisateur peut modifier mais SOUS LA MEME LICENCE -> personne ne peut s’approprier ces données. Exemple : cela est un des fondements d’OpenStreetMap, le wiki de la cartographie (http://openstreetmap.fr/)
Avec ces licences, l’utilisateur est obligé de reverser au pot commun ce qu’il modifie/corrige/améliore. L’idée est d’éviter une appropriation de données, notamment pas les entreprises privées qui en tirent ensuite des profits. Ce type de licence permet que les grandes multinationales s’approprient des données sans contrepartie, conséquence donc de la privatisation des données publiques (cartographie) Exemple avec Google qui achète ou utilise toutes les données cartographiques.
Cela permet de poser un cadre sur la notion de données publiques et communes, et de les protéger d’une logique de privatisation de la valeur ajoutée. Ici, contrairement à la logique privée selon laquelle les données non partagées sont celles qui ont le plus de valeurs, ce sont les données partagées qui ont davantage de valeur car elles sont modifiées, améliorées, enrichies. Il s’agit d’une logique de biens communs.
Historique de l’open-data en France
1978 : loi CADA (accès) : n’importe quel citoyen a le droit de demander à une administration un document qu’elle possède (ex. le cadastre) . C’est la CADA qui tranche si on peut ouvrir des documents, à part pour certaines exception notamment le secret défense
2009 : premier opendatacamp à Paris (multiacteurs : hackaton sur la donnée)
2010 : Regards Citoyens sort deux sites : DataPublica et Nosdonnées.fr
2011 : mise en place d’Etalab et de data.gouv.fr, un portail unique interministériel de données publiques
La CADA
La commission d’accès aux documents administratifs a pour rôle de contraindre les administrations à fournir les données publiques. Les journalistes y ont régulièrement accès. La CADA tranche sur la validité de la requête.
Qui est concerné par la loi CADA ? Toutes les autorités publiques (collectivités, services de L’État...) sauf : la justice, la police, l’armée, le Conseil des ministres et le Parlement. Il s’agit d’un bon outil sur le plan législatif mais sur la pratique de l’open-data, d’une manière générale, la France est en retard.
Projet de loi du numérique
Une nouvelle loi oblige les administrations à ce que leurs données soient publiées dans des formats ouverts réutilisables. Noter que le pdf n’est pas un format réutilisable car il n’est pas lisible par les machines
Il y a eu des apports des citoyens qui ont été pris en compte dans le projet de loi, et la proposition de Regards Citoyens est d’augmenter la loi CADA pour qu’elle aille plus loin et que non seulement l’administration donne accès aux documents mais aussi qu’elle soit obligée de le publier en open data. Un projet de loi CADA allant dans ce sens permettrait d’aller vers un renforcement de la démarche OPENDATA en France.
Comment on pratique l’OP à Regards Citoyens
Tous les projets chez RC est basé sur la récupération des données.
Le scraping : récupérer les informations disponibles sur le web (Assemblée Nationale, Sénat, Journal Officiel, Collectivités locales etc). Cela est la première phase qui est souvent compliquée.
Le crowdsourcing : méthodes, hors robot, qui consiste à faire appel aux citoyen-nes, qui décodent un document. Principe : proposition d’une participation aléatoire et on considère que à partir de 4/5 personnes à peu près d’accord sur la transcription, elle est fiable.
Ex : RC a demandé à plus de 3000 citoyens à décoder des extractions des lobbies, à partir des documents d’auditions annexées aux rapports de l’AN, pour monter une analyse de quels sont les lobbys auditionnés à l’AN. Projet mené avec Transparency international.
Ex : Numérisation des déclarations d’intérêts manuscrites des parlementaires : Résultats : 925 élus - 11 000 extraits en PDFs et relues par 7924 citoyens -> 10 jours de travail. Il faut 4/5 citoyens qui disent la même chose sur le même document.
La demande à la CADA : la demande à la CADA peut être réalisée par n’importe qu’elle citoyen à partir du moment où une administration ne répond pas à une demande d’information dans un délais d’un mois -> délais considéré comme un refus tacite de mise à disposition des données et là, le recours à la CADA est possible.
La diffusion et le partage des jeux de données de RC (voir le diaporama ci-joint page 18).
Le Dataviz : Il faut rendre les données compréhensibles par tout le monde. Maximun synthétiser : la visibilité des données est très puissant. Ex. : les cadeaux des labos pharmaceutiques aux médecins.
A noter que le fonctionnement de l’association Regards Citoyens épouse les principes de l’open date :
fonctionnement collégial : pas de président, pas d’administrateur
tout ce qui est fait figure sur les comptes bancaires qui sont accessibles
refus de dons des députés et sénateurs
partage des travaux via git hub (site web ou l’on partage son code informatique) et des pads
Budget de 5,000 euros par ans et seulement du travail bénévole, le plus collaboratif possible (système de validation par l’autre : 3 "plus" donne une validation).
Liens avec associations semblables
Projet La fabrique de la loi : http://www.lafabriquedelaloi.fr/
« La Fabrique de la Loi » est un projet collaboratif associant les membres de Regards Citoyens, une association promouvant par la pratique la libération et la réutilisation de données parlementaires à des fins démocratiques, et les équipes de deux laboratoires de recherche de Sciences Po Paris, le Centre d’Études Européennes et le médialab. Le design du site a été réalisé par le laboratoire de recherche de l’École Polytechnique de Milan, Density Design.
La Quadrature du Net : https://www.laquadrature.net/fr/
Association de défense des droits et libertés des citoyens sur Internet. Elle promeut une adaptation de la législation française et européenne qui soit fidèle aux valeurs qui ont présidé au développement d’Internet, notamment la libre circulation de la connaissance. À ce titre, La Quadrature du Net intervient notamment dans les débats concernant la liberté d’expression, le droit d’auteur, la régulation du secteur des télécommunications ou encore le respect de la vie privée.
Open Knowledge Foundation : cours de base sur un apprentissage de la donnée. Formation sur comment trouver les données et les réutiliser.
L’École des données : site pédagogique
Autres Informations
Il existe des alternatives à Skype, Dropbox, Googledrive, Explorer, Outlook !!
Vous pouvez trouver des alternatives libres dans cet article issu de l’atelier "Libérons nos logiciels : les alternatives libres à…"
Contacts Regards Citoyens :
www.regardscitoyens.org
contact@regardscitoyens.org
Contacts Ritimo (Un réseau d’information et de documentation pour la solidarité et le développement durable. 90 lieux ouverts au public pour informer et agir) :
www.ritimo.org
www.coredem.info
Viviana Varin : v.varin@ritimo.org
Erika Campelo : e.campelo@ritimo.org