La Dublin Core 2006, sur un format ouvert de métadonnées
Début octobre 2006, il y a en France la manifestation « Pérenniser le document numérique » à Amboise. Et à Manzanillo au Mexique se déroule la manifestation « DC-2006 » [1].
DC signifie Dublin Core [2], le nom d'un ensemble d'informations (comme le titre, l'auteur, la date, la langue,...) qui servent à décrire un document : ce sont des données sur les données, des métadonnées.
L'édition DC-2006, la quatorzième, se déroulera du 3 au 6 octobre et portera sur Metadata for Knowledge and Learning (les métadonnées pour la connaissance et l'apprentissage). En 2004, elle se déroulait à Shanghaï et en 2005 en Espagne.
Les métadonnées, c'est important ? OUI, c'est capital !
Les métadonnées renseignent les données et permettent ainsi de les retrouver.
Voici un exemple : comment trouver la photo d'une personne ? En utilisant son nom... Mais il faut que ce nom soit associée à la photo, qui ne contient pas de texte. C'est donc une donnée en plus de la photo, le nom de la personne photographiée. Si aucune information n'est disponible avec la photo, impossible de faire le rapprochement. Même chose pour d'autres informations sur la photo comme l'auteur ou la date.
Et quand on utilise un moteur de recherche d'images, on peut trouver des couvertures de livres à partir d'un nom... mais ce n'est pas (encore) dû aux métadonnées de l'image de la couverture [3], mais à la présence du nom sur une page Web où se trouve aussi la couverture du livre (où le nom peut figurer... mais dans l'image).
Il ne faut pas que ces métadonnées soient à un format fermé, connu d'un seul éditeur, avec un seul logiciel sachant les exploiter. Les formats ouverts de métadonnées sont capitaux pour que tous ceux qui produisent de l'information puissent les utiliser en les renseignant et pour permettre ainsi de se retrouver dans les « océans de données ».
Sources et liens :
- [1] Site de DC-2006, Metadata for Knowledge and Learning, en anglais, http://dc2006.ucol.mx/
- Site du Dublin Core Metadata Initiative, en anglais, http://dublincore.org
- [2] Article Dublin Core, encyclopédie Wikipédia, http://fr.wikipedia.org/wiki/Dublin_Core
- [3] Exemple : une recherche d'images avec la personne « Prénom Nom » donne comme réponse la page suivante, http://www.mincoin.com/infos/voyages.php, avec l'image « réponse », http://www.mincoin.com/images/bibliographie/beffrois-du-quesne.jpg qui ne correspond pas vraiment à la personne « Prénom Nom » !
Et sur Formats-Ouverts.org :
- il y a 1 an : Conférence à Ouagadougou (presque 3h30 sur les formats !)
- il y a 2 ans : Prisonnier d'une capsule (xxpliquer les problèmes des formats avec le café...)
1 réactions
1 De axc - 30/09/2006, 17:58
J'ai bon espoir sur les métadonnées, car il est dans l'intérêt des détenteurs de droits sur les œuvres protégées de pousser à l'utilisation des formats ouverts.
En effet, lors des débats sur DADVSI et plus précisément sur le grand registre des œuvres, les formats ouverts ont été mentionnés à plusieurs reprises et même inscrits dans la nouvelle version de l'article 14 quater qui créait ce registre (qui depuis est passé à la trappe). L'intérêt évident pour eux est de pouvoir invoquer que ces métadonnées sont lisibles par tous, et que nul ne peut les ignorer - nul ne peut ignorer les restrictions d'usage associées à ces œuvres.
L'important est que les industries produisant du contenu poussent à l'adoption de formats ouverts, car si tous les intérêts corporatistes y étaient opposés nous n'aurions que peu d'espoir de pouvoir aller dans le bon sens. Espérons donc qu'ils ne changeront pas d'avis.