La Dublin Core 2006, sur un format ouvert de métadonnées

Début octobre 2006, il y a en France la manifestation « Pérenniser le document numérique » à Amboise. Et à Manzanillo au Mexique se déroule la manifestation « DC-2006 » [1].

DC signifie Dublin Core [2], le nom d'un ensemble d'informations (comme le titre, l'auteur, la date, la langue,...) qui servent à décrire un document : ce sont des données sur les données, des métadonnées.

L'édition DC-2006, la quatorzième, se déroulera du 3 au 6 octobre et portera sur Metadata for Knowledge and Learning (les métadonnées pour la connaissance et l'apprentissage). En 2004, elle se déroulait à Shanghaï et en 2005 en Espagne.

Les métadonnées, c'est important ? OUI, c'est capital !

Les métadonnées renseignent les données et permettent ainsi de les retrouver.

Voici un exemple : comment trouver la photo d'une personne ? En utilisant son nom... Mais il faut que ce nom soit associée à la photo, qui ne contient pas de texte. C'est donc une donnée en plus de la photo, le nom de la personne photographiée. Si aucune information n'est disponible avec la photo, impossible de faire le rapprochement. Même chose pour d'autres informations sur la photo comme l'auteur ou la date.

Et quand on utilise un moteur de recherche d'images, on peut trouver des couvertures de livres à partir d'un nom... mais ce n'est pas (encore) dû aux métadonnées de l'image de la couverture [3], mais à la présence du nom sur une page Web où se trouve aussi la couverture du livre (où le nom peut figurer... mais dans l'image).

Il ne faut pas que ces métadonnées soient à un format fermé, connu d'un seul éditeur, avec un seul logiciel sachant les exploiter. Les formats ouverts de métadonnées sont capitaux pour que tous ceux qui produisent de l'information puissent les utiliser en les renseignant et pour permettre ainsi de se retrouver dans les « océans de données ».

Sources et liens :
Et sur Formats-Ouverts.org :