English version

Le titre pourrait être suffisant. Mais il pourrait aussi être considéré comme un format trop court ! Il faut donc le développer.

Si vous connaissez l'excellent projet Software Heritage (SWH) et son travail indispensable avec son équipe brillante [1], l'idée est la même... mais au lieu de porter sur le code source des logiciels, c'est à propos du code source du format de fichier.

Si le paragraphe précédent avec SWH n'est pas assez clair et si vous lisez toujours (ce que j'espère !) alors vous attendez plus de détails : les voici.

Les logiciels sont les outils. Les données sont ce que les logiciels manipulent (en entrée) et génèrent (en sortie).

Les logiciels qui ont un code source ouvert peuvent être étudiés, ré-utilisés, améliorés, archivés, même être cités [2] et cela conserve notre mémoire numérique. Les pages Web, les documents ou les conférences de Software Heritage expliquent cela de manière très claire et bien plus détaillée [3].

Les données utilsées par les logiciels, en tant qu'informations en entrée ou en sortie, ont un format : c'est leur structure, écrite dans un code source. Cela est techniquement appelé les spécifications du format de fichier.

Avec des spécifications ouvertes, il est possible de comprendre comment les données sont structurées, il est possible de les utiliser dans plusieurs logiciels (pas seulement un), il est possible des les étudier, de les archiver ou de les réutiliser. Bien sûr, une licence ouverte doit permettre cela aussi.

Avec des spécifications fermées, les données sont en prison (utilisables par 1 seul logiciel, peut-être dans seulement une seule version) ou alors sont des données mortes (si les auteurs des spécifications fermées décident d'arrêter de les utiliser dans leur loigiciel, ou s'ils décident d'arrêter le seul logiciel qui sait utiliser leurs spécifications... sans oublier s'ils décident de tout arrêter, leur spécifications et le seul logiciel qui les utilise !) - comment utiliser des fichiers créés avec le logiciel Aldus Pagemaker 1.0 [4] qui contiennent les données enregistrées dans son format de 1985 ?).

Les formats ouverts de fichier sont indispensables, et stockés à l'intérieur d'un dépôt avec de puissantes fonctionnalités pour les utiliser, comme celui de Software Heritage, cela serait un excellent emplacement.

Notre monde est de plus en plus un monde numérique avec ses outils, les logiciels, et leurs données : elles sont notre mémoire numérique. C'est pourquoi nous avons besoin de Software Heritage et d'un Format Heritage.

Références :

Post-scriptum :

Un titre est une manière d'exprimer une idée, il peut se voir comme un format. Comme un ''abstract" dans une publication universitaire est peut-être le format moderne de l'acronyme anglais "TLDR" :-) (Trop Long J'ai Pas Lu). Et cet article, en anglais, sur un blog, ce sont aussi 3 formats non-numériques, et ouverts ! Enfin pour finir vous pourriez préférer ce dernier format : s/Software/Sotware+Format/g

J'ai parlé de cette idée de Format Heritage lors d'une rencontre de logiciels libres, Capitole du Libre, à Toulouse en novembre 2017. Mais c'était dans une intervention au format conférence, en tant que simple point de ma conférence sur les formats ouverts.

Dernier point, un exemple : imaginez les possibilités avec le format Refer ou le format Groff dans un dépôt FMH (pour Format Heritage) ?