Les formats dans les archives numériques : un accord privé-public, et des questions

Ce mercredi 4 juillet 2007, les Archives Nationales du Royaume Uni (The National Archives, TNA, [1]) et Microsoft ont annoncé un « Memorandum of Understanding (M.O.U) » qui « assure la préservation des enregistrements numériques nationaux, passés, présents et futurs ».

La lecture du contenu du communiqué de presse [2] peut soulever questions et remarques à propos des formats et de l'archivage.

Les Archives Nationales du Royaume Uni vont « participer aux futures versions des produits de Microsoft ». Pour les documents aux formats de Microsoft, c'est une bonne chose. Mais pour les autres formats ? Et ces liens forts auront sans doute un poids dans les conseils et les préconisations futures des archives officielles.

Il est indiqué que des « logiciels qui prennent en charge des formats de fichiers anciens ne sont plus disponible à la vente ». C'est exact, pour Microsoft comme pour d'autres éditeurs : de plus, quand le format de ces fichiers anciens est fermé et n'était lisible qu'avec ces logiciels, le piège est là, et il se referme.

Natalie Ceeney, Chief Executive de The National Archives, parle du « travail avec l'industrie des technologies de l'information » mais aussi pour la collaboration avec Microsoft « des outils clés pour accéder aux informations du gouvernement des années à venir. » Mais est-il sûr que les informations du gouvernement seront toutes dans des formats Microsoft ? n'y a-t-il aucune diversité ?

C'est le logiciel Microsoft Virtual PC 2007 [3] qui « permet d'accéder aux anciennes versions de Microsoft Windows et Office ». Il ne s'agit donc pas des ordinateurs et logiciels d'époque mais d'une émulation des logiciels anciens et de leurs formats : remonte-t-il assez loin dans le temps ? et si les informations sur les formats ont été perdues ?

Une des perspectives citée est « d'augmenter l'accessibilité de ces documents en convertissant ces informations dans de nouveaux formats ouverts de fichiers » : donc passer de formats fermés anciens à des formats ouverts actuels d'Office 2007 comme PDF ou ODF ou seulement OpenXML.

Gordon Frazer, Managing Director UK et Vice President Microsoft International déclare que « les formats de fichiers basés sur le XML déverouillent les données des documents » : mais les formats de la catégorie XML ne sont pas obligatoirement des formats ouverts.

Adam Farquhar, Chef de eArchitecture à la British Library (qui a un partenariat de bibliothèque numérique et d'archivage de courriels avec Microsoft) et co-président du comité de standardisation Office OpenXML ECMA, parle d'« accéder demain au informations numériques d'aujourd'hui ». Donc ces informations officielles sont (seront) toutes aux formats Microsoft. Il parle aussi du « défi de préserver l'hétitage de la nation », ce qui est très important à voir le documentaire Sauve qui peut le numérique.

Finalement :

  • comment faire pour les documents Wordperfect ou 123 ou XPress conservés : car la question se pose aussi pour ces formats fermés ;
  • pour des structures moins importantes que les Archives Nationales (comme les petites et moyennes entreprise, les associations, les particuliers), il n'y a pas d'accord avec l'éditeur et les formats fermés emprisonnent les informations ;
  • concernant les anciens fichiers, il n'y a aucune mention du problème des formats fermés ;
  • à propos de l'avenir, il n'est pas envisager ici d'autres formats que ceux de Microsoft (en évitant la situation de la Corée du Sud...), et encore moins d'avoir des formats ouverts pour être indépendant et maître de ses données, ce que des États ont exigé.

Pour l'interopérabilité, la conservation, l'indépendance et le contrôle des données, l'approche consistant à utiliser des standards ouverts reste la plus pertinente, mais aussi celle qui est combattue avec des États qui reculent.

Autres articles sur l'archivage numérique :
Sources et liens :
Et sur Formats-Ouverts.org :