Contribuez à la Mission Politique publique de la donnée : tel est le titre de la page Web du site Mission open data pilotée par le député Éric Bothorel.

Alors voici ma contribution en ligne ici en totalité car le texte que j'ai enregistré sur le site Web de la Mission avait un format de 500 caractères maximum : je n'y ai donc mis que la ligne ci-dessous et le lien vers cet article.

Ma contribution peut avoir un format très court : appliquer l'article 4 de la LCEN.

Mais cela est certainement trop court : alors voici une série de points explicatifs,

  1. la LCEN est la Loi sur la Confiance en l'Economie Numérique
  2. c'est la loi n° 2004-575 du 21 juin 2004
  3. elle a la référence NOR: ECOX0200175L
  4. elle a été publiée au JORF le 22 juin 2004
  5. son article 4 indique ceci : On entend par standard ouvert tout protocole de communication, d'interconnexion ou d'échange et tout format de données interopérable et dont les spécifications techniques sont publiques et sans restriction d'accès ni de mise en oeuvre. (gras ajouté)
  6. l'URL sur Légifrance est www.legifrance.gouv.fr/jorf/id/JORFTEXT000000801164
  7. cette définition en une seule phrase traite donc de format ouvert de données et cite les caractéristiques qu'il doit avoir pour être qualifié d'ouvert
  8. on remarquera que cet article date d'il y a plus de 16 ans, date d'ouverture de ce blog (avec des interventions sur le sujet du format depuis 2000 et jusqu'à maintenant)
  9. appliquer cet article 4 de la LCEN signifie que les données des structures publiques doivent respecter et utiliser cette définition avec ses caractéristiques
  10. quelles sont ces données ?
  11. quels sont les enjeux du format ouvert des données ?

Pour répondre aux questions des deux derniers points ci-dessous, il est nécessaire de passer à un format encore plus textuel.

Données : la data et aussi le code

Il y a les données qui sont des informations diverses et variées comme du texte, des images (animées ou fixes), de l'audio, des graphiques (2D, 3D), des statistiques, etc. Le format de ces données est défini par les spécifications techniques du format utilisé dans les fichiers qui les contiennent.

Il y a aussi les données qui sont des lignes de code : il s'agit alors des coulisses techniques écrites dans des langages de programmation, c'est-à-dire le code source des logiciels. Les logiciels libres ont un code source dans un format ouvert.

Structures publiques : quel que soit l'échelon ou le domaine

Toutes les structures publiques, du local au national, produisent des données, utilisent des données, utilisent des logiciels, voire produisent des logiciels ou du code.

Et cela dans tous les domaines, de l'enseignement à la Gendarmerie, de la recherche à la gestion des cimetières, de la la comptabilité à la cartographie.

Les enjeux du format des données

Un format ouvert des données (y compris des logiciels) tel que défini dans l'article 4 joue un rôle central dans les domaines suivants, qui sont capitaux :

  • l'interopérabilité (un format vers tout autre format) et non pas la simple et seule compatibilité (un format vers un autre format)
  • la portabilité des données pour passer d'un environnement vers un autre
  • la reproductibilité comme dans l'approche de la science ouverte
  • la sécurité avec la possibilité d'audit, de vérification
  • le contrôle et la maîtrise technologique qui concernent l'indépendance technologique, sans verrouillage (lock-in) ni sans être prisonnier d'un fournisseur de logiciel/de service seul capable d'utiliser le format des données
  • les archives et l'archivage du patrimoine numérique et de notre mémoire numérique et dans l'approche des archives ouvertes
  • la création de valeur autour, et à partir, de ces données, sans barrière à l'entrée
  • le libre choix des outils de traitements des données et le changement de ces outils, sans coût de sortie ni perte d'informations
  • l'enrichissement de la connaissance au travers de la disponibilité de toutes les informations des données et des logiciels.

La licence : capitale

La licence juridique de ces données doit aussi avoir un format ouvert au sens de possibilités ouvertes d'utilisation et de réutilisation (comme certaines licences Creative Commons, la licence CeCILL, la licence EUPL, les licences GNU-GPL ou BSD, la licence GFDL).

D'autres structures

Les structures associatives ou professionnelles comme l'ADULLACT, l'AFUL, l'APRIL, le CNLL, Framasoft, Software Heritage ou la très récente Cellule nationale de veille sur les formats sont sans aucun doute des structures à associer.