Des recommandations officielles de formats
Quelles procédures et techniques mettre en œuvre pour la pérennisation des données numériques ? Comment archiver les documents électroniques ? Quels formats et quels supports choisir ?
Telles sont certaines des questions posées par le livre Les archives électroniques Manuel pratique de Catherine Dhérent, publié par la Direction des Archives de France à la Documentation Française, et auxquelles ce manuel donne des réponses concrètes et claires au long de ses 104 pages.
Le manuel a été écrit par Catherine Dhérent, experte reconnue, Conservateur général du patrimoine et alors responsable du département Innovation technologique et normalisation de la Direction des Archives de France du Ministère de la Culture. Elle fait aussi partie du groupe de travail international sur le format XML EAD (représentante française au sein du groupe de 12 membres). Elle travaille actuellement à la Bibliothèque nationale de France en tant que chef de la Mission pour la gestion de la production documentaire et des archives et s'occupe notamment de Records Management.
Le manuel a été publié en 2002, mais ses recommandations officielles restent valables et sont claires quant aux formats à employer : des formats ouverts. Ainsi la version papier, Chapitre IV (chapitre V dans la version HTML), Garantir la conservation, dans sa partie Choix des formats et des supports, traite en sous-partie 1 des Formats et langages d'encodage (gras, italique et liens ajoutés) :
Il faudra non seulement vérifier les contenus, l’existence et la transmission de toutes les métadonnées indispensables à la survie des documents électroniques mais également le format des données. (page 46)
Mais un format d’encodage n’est qu’un élément dans un ensemble d’outils qui le rend intelligible : un fichier Word par exemple est toujours conçu pour être jumelé à une version du logiciel Word, lui-même conçu pour un certain modèle d’ordinateur et pour son propre système d’exploitation. Un document électronique n’est lisible que grâce à l’interaction de l’encodage avec un logiciel et du matériel informatique permettant de l’interpréter. (page 46)
Critère de choix des formats : Pour la conservation à long terme, en fonction des besoins et capacités de l'institution : on choisira donc, de préférence, des langages et formats standards ou faisant l’objet de recommandations internationales (XML, HTML, TXT pour les documents textuels) ; en cas d’impossibilité, on retiendra des formats ouverts (PDF pour les documents textuels, TIFF, ou PNG pour les images) et on évitera les formats fermés. (page 52)
La conservation à long terme est aussi affaire de fiabilité des supports et de pérennité des matériels. Elle implique une révision périodique des choix opérés afin de vérifier la conformité des solutions et des équipements adoptés avec les évolutions de la technologie car l’expérience prouve que chacun des deux éléments du couple support-matériel peut se révéler obsolète en quelques années. (page 52)
L'ensemble du chapitre et du manuel, sur lesquel il est possible de s'appuyer officiellement, est d'une lecture à recommander avec des informations précises pour l'archivage des documents électroniques, dont le processus commence en fait dès la création de ces documents.
Sources et liens :
- Les archives électroniques Manuel pratique, Direction des Archives de France, de Catherine Dhérent, 2002, 104 pages, La Documentation Française, référence 9782110051318, ISBN 2-11-005131-0, 16x24 cm, 15 euros
- La fiche du Manuel sur le site de la Documentation Française, http://www.ladocumentationfrancaise.fr/catalogue/9782110051318/index.shtml
- Le Manuel en intégralité, au format HTML (une seule page longue), site du Ministère de la Culture, Direction des Archives de France, http://www.archivesdefrance.culture.gouv.fr/fr/archivistique/DAFmanuel%20version%207.html
- Les membres du groupe de travail sur l'EAD, http://www.loc.gov/ead/eadwg.html
- La Bibliothèque nationale de France, http://www.bnf.fr.
5 réactions
1 De nicor73 - 11/01/2005, 12:31
Extrait du code source du manuel au format html :
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1252">
<META NAME="Generator" CONTENT="Microsoft Word 97">
Utiliser un format ouvert comme le HTML ou le TXT, c'est bien. Mais il ne faut pas oublier le format d'encodage des caractères qui est aussi TRES important et qui doit être également ouvert.
2 De Thierry Stoehr - 11/01/2005, 13:01
Comme l'indique l'extrait du code cité, le document HTML en ligne a en effet été réalisé avec l'enregistrement au format HTML depuis Word 97, outil sans doute utilisé pour écrire le document. Avec l'encodage des caractères propre à Windows. La remarque est exacte et la critique est possible. Cependant le document HTML est tout de même en ligne et disponible. Y compris pour en faire un document XHTML avec CSS. Sous réserve d'accord si on veut le diffuser sur un site. Mais cette transformation vers un format ouvert de type XML et avec un encodage ouvert ne se fait pas aussi rapidement ni facilement.
3 De Catherine - 11/01/2005, 18:35
Un autre document a connaitre sur la question la conservation des documents électroniques est le "Guide de conservation des informations et des documents numériques" de l'ATICA (devenue ADAE). La dernière version date aussi de 2002 et aborde les questions de format, de support, de métadonnées, de normalisation sans oublier XML bien entendu !
Pour en savoir plus : www.adae.gouv.fr/article....
4 De BlogOKat - 12/01/2005, 08:41
Conservation des documents électroniques
Hier j'ai abordé la question de l'archivage de BlogOKat. Pour
5 De fil2blog - 13/01/2005, 13:56
Pour sysin : Gestion de données techniques
Un manuel sur les formats à utiliser pour conserver les documents qui va dans le sens exposé en SySin 1,2,3,4? (j'ai jamais su les numéros) sur la gestion de données techniques....