Conférence de presse : bibliothèques numériques, conservation du patrimoine numérique, donc des formats et aussi...

Le 13 novembre 2007, Bruno Racine, président de la Bibliothèque nationale de France (BnF), a donné une conférence de presse intitulée Trois chantiers d'avenir [1] que sont « le numérique, le projet Richelieu, le développement durable ».

Le contexte : l'archivage et les bibliothèques numériques

L'une des missions de la BnF concerne le dépôt légal, qui touche maintenant le numérique. Cela signifie collecte puis archivage, conservation et aussi records management : la BnF a de grand(e)s expert(e)s en la matière.

La bibliothèque numérique de Google fut annoncée en décembre 2004 sous le nom de Google Print. Depuis, rebaptisée Google Book Search, 18 bibliothèques sont devenues partenaires [2]. Yahoo!, Microsoft, Amazon participent aussi à des projets de bibliothèque numérique.

La Bibliothèque nationale de France :

  • le président Jeanneney : le 22 janvier 2005, il publiait un article dans Le Monde, réagissant au projet de Google et lançant un « appel solennel » ;
  • une nouvelle équipe de direction : le 2 avril 2007, Jean-Noël Jeanneney [3] fêtait son 65e anniversaire et quittait ses fonctions de président de la BnF, atteint par la limite d'âge ; Bruno Racine [4], ancien président du Centre Georges-Pompidou, lui a succédé ; quant à Agnès Saal, directrice générale de la BnF (depuis 2001), autre poste clé, elle a été nommée directrice générale du Centre Georges-Pompidou le 23 août [5].

La BnuE, Bibliothèque numérique européenne a connu une accélération après la réaction de Jean-Noël Jeanneney qu'il a porté auprès des différents interlocuteurs et responsables en France et en Europe.

« La BnF à l'ère du numérique » et les formats

Pour le chantier du numérique, il y a 3 volets : « collecter-conserver ; organiser ; diffuser », avec notamment le projet SPAR (Système de Préservation et d'Archivage Réparti) pour « entreposer de manière sécurisée et pérenne les objets numériques ».

Pour ce « projet de grande ampleur » SPAR, « la BnF a lancé le 14 juin dernier un appel d'offres pour la réalisation de la partie logicielle et a adopté une orientation en faveur du logiciel libre afin de s'assurer une indépendance maximale. ». Donc des logiciels avec des formats ouverts. C'est à souligner, à saluer et à soutenir !

En ce qui concerne la préservation, la pérennisation et l'archivage électronique des données avec l'outil SPAR, « la diversité de leurs formats placent la BnF devant le défi de leur conservation. ». Pour SPAR, le problème des formats (notamment fermés) est indiqué et il faut composer avec :

Mais il permet également, grâce à une reconnaissance précise et complète des formats de données versées, de garantir la continuité d'accès en procédant aux transformations nécessaires en cas d'obsolescence technologique des outils informatiques de restitution. Ainsi, par exemple, lorsque le format d'image JPEG deviendra obsolète, SPAR sera en mesure de transformer les images concernées dans un nouveau format plus performant. Apporter cette garantie implique un travail permanent de veille technologique sur les formats, de prototypage et de tests des outils. L'ensemble de cet arsenal est intrinsèquement prévu dans la conception de SPAR. De plus, SPAR permet à tout moment de revenir en arrière pour restituer les objets dans leur format d'origine.

Enfin SPAR est un « véritable magasin numérique », dont la conception « s'appuie sur des normes internationales faisant autorité dans le monde de la pérennisation des informations numériques. » Les formats ouverts EAD (pour l'archivage) ou Dublin Core (pour les métadonnées) peuvent relever de cette approche. Il ne s'agit pas tant de recommander des formats en vue de l'archivage (comme dans le Manuel pratique Les archives électroniques de Catherine Dhérent) mais de prendre en compte l'existant.

Le records management, très présent à la BnF n'est pas cité mais concerne directement les sujets « d'indexation et d'accès aux archives » : les formats ouverts sont là aussi de mise.

Autre volet : « La BnF a aujourd’hui un rôle à jouer pour contribuer à organiser l’information à l’ère du numérique » et lance 3 « axes de recherche : OCR, traitement automatique des données et Web sémantique ». Si l'OCR peut poser un problème de format fermé des logiciels, le Web sémantique [6] repose sur des formats ouverts qui permet un traitement plus puissant des informations avec le format texte (plutôt que le format image).

Un point concerne les « choix de normalisation nécessaires pour l'inclusion des données concernant les livres sous droits (formalisme de transmission des contenus des documents, format des métadonnées, format de fourniture des données). » : formats et protocoles ouverts seraient bien plus efficaces que s'ils étaient fermés et utilisables avec un seul système d'exploitation.

Enfin pour le volet « Diffuser en ligne », la BnF agit dans le dossier des bibliothèques numériques « autour de trois cercles » :

  • sa propre bibliothèque numérique Gallica qui va évoluer et devenir Gallica 2 pour décembre 2008 [7] ;
  • la Bibliothèque numérique européenne (BnuE) avec le prototype Europeana qui continue son développement, et où Catherine Lupovici, ancienne directrice du département de la bibliothèque numérique de la BnF, est désormais très impliquée ;
  • le Réseau francophone des bibliothèques nationales numériques (RFBNN) qui présentera un prototype en août 2008.

Le « grand format » des cartes et des plans est aussi cité... mais cela s'applique aux dimensions physiques de ces documents !

Finalement, que ce soit pour le patrimoine numérique, pour l'archivage (après les exemples récents de la capsule Yahoo!, des bandes de la NASA, du DAFF de l'INA, de la British Library, de « l'informatique immortelle »,...) ou pour les bibliothèques numériques, la BnF continue d'être présente et active pour ces dossiers. Souhaitons vivement que ce sera avec toujours plus de standards ouverts et en faisant la promotion.

Sources et liens :
Et sur Formats-Ouverts.org :