Des recommandations officielles de formats

Quelles procédures et techniques mettre en œuvre pour la pérennisation des données numériques ? Comment archiver les documents électroniques ? Quels formats et quels supports choisir ?

Telles sont certaines des questions posées par le livre Les archives électroniques Manuel pratique de Catherine Dhérent, publié par la Direction des Archives de France à la Documentation Française, et auxquelles ce manuel donne des réponses concrètes et claires au long de ses 104 pages.

Le manuel a été écrit par Catherine Dhérent, experte reconnue, Conservateur général du patrimoine et alors responsable du département Innovation technologique et normalisation de la Direction des Archives de France du Ministère de la Culture. Elle fait aussi partie du groupe de travail international sur le format XML EAD (représentante française au sein du groupe de 12 membres). Elle travaille actuellement à la Bibliothèque nationale de France en tant que chef de la Mission pour la gestion de la production documentaire et des archives et s'occupe notamment de Records Management.

Le manuel a été publié en 2002, mais ses recommandations officielles restent valables et sont claires quant aux formats à employer : des formats ouverts. Ainsi la version papier, Chapitre IV (chapitre V dans la version HTML), Garantir la conservation, dans sa partie Choix des formats et des supports, traite en sous-partie 1 des Formats et langages d'encodage (gras, italique et liens ajoutés) :

Il faudra non seulement vérifier les contenus, l’existence et la transmission de toutes les métadonnées indispensables à la survie des documents électroniques mais également le format des données. (page 46)

Mais un format d’encodage n’est qu’un élément dans un ensemble d’outils qui le rend intelligible : un fichier Word par exemple est toujours conçu pour être jumelé à une version du logiciel Word, lui-même conçu pour un certain modèle d’ordinateur et pour son propre système d’exploitation. Un document électronique n’est lisible que grâce à l’interaction de l’encodage avec un logiciel et du matériel informatique permettant de l’interpréter. (page 46)

Critère de choix des formats : Pour la conservation à long terme, en fonction des besoins et capacités de l'institution : on choisira donc, de préférence, des langages et formats standards ou faisant l’objet de recommandations internationales (XML, HTML, TXT pour les documents textuels) ; en cas d’impossibilité, on retiendra des formats ouverts (PDF pour les documents textuels, TIFF, ou PNG pour les images) et on évitera les formats fermés. (page 52)

La conservation à long terme est aussi affaire de fiabilité des supports et de pérennité des matériels. Elle implique une révision périodique des choix opérés afin de vérifier la conformité des solutions et des équipements adoptés avec les évolutions de la technologie car l’expérience prouve que chacun des deux éléments du couple support-matériel peut se révéler obsolète en quelques années. (page 52)

L'ensemble du chapitre et du manuel, sur lesquel il est possible de s'appuyer officiellement, est d'une lecture à recommander avec des informations précises pour l'archivage des documents électroniques, dont le processus commence en fait dès la création de ces documents.

Sources et liens :