L'Association Francophone des Utilisateurs de Linux et des logiciels libres (AFUL)

Pour les formats ouverts !


Aller au contenu | Aller au menu | Aller à la recherche

Le site Formats-Ouverts.org, (FOo), traite des formats, protocoles et standards ouverts, dans différents domaines (comme l'interopérabilité, l'archivage), depuis le 1er juillet 2004 (plus de 1600 jours) - Les formats se rencontrent presque partout - Il y a actuellement 1771 articles en ligne, dont 23 pour le mois de décembre - Les 1000 articles : le communiqué de presse (inédit et exclusif) - Les statistiques mensuelles du site - Attention : vote électronique - Les conférences - Les 4 ans ! - Le 1700e article - Un index du site - Où en est le patrimoine numérique ?


2008, les 10 ans de XMLXML10 : les 10 ans de XML en 2008


Un passage sur les formats

Extrait d'un livre

Le livre La bataille du logiciel libre est paru fin octobre, aux éditions La Découverte. Sa lecture fournit une présentation claire et progressive des logiciels libres et de leurs enjeux : à conseiller. Un passage traite des formats de fichiers :

«Cette position de force sur le marché a, par exemple, fait du format de fichier Word un standard de facto (13), obligeant les produits concurrents à permettre l'interopérabilité (autrement dit la possibilité de lire un fichier fait avec Word à partir du logiciel concurrent). Comme souvent, il ne s'agit pas d'un simple problème technique : la distillation parcimonieuse des informations sur ses produits par Microsoft contribue à ce que cette interopérabilité soit imparfaite (fichiers illisibles, données corrompues, mises en forme altérées, etc.) et donc à ce que ces concurrents soient considérés comme peu fiables par les utilisateurs (14).»
Chapitre La fin du monopole de Microsoft ?, partie Assurer le succès des applications, page 66

Pour être précis, on doit plutôt parler de compatibilité avec les fichiers Word assurée dans les produits concurrents. Donc accord entre éditeurs pour savoir lire du Word voire savoir en écrire. Mais il ne s'agit pas d'interopérabilité c'est-à-dire avec un format ouvert. Une erreur assez classique, parfois érigée en argument marketing/publicitaire par Microsoft ou Novell.

«Un standard sans les avantages d'une vraie «norme» : les modifications du format Word que pratique Microsoft lors des changements de version obligent tôt ou tard ses utilisateurs à acquérir une mise à jour. Pire, les documents écrits avec une ancienne version de Word ne sont pas toujours lisibles avec les versions ultérieures ! Lire : «Les travers du format MS Word», http://oumph.free.fr/textes/format_msword.html
Note de bas de page n°13, page 66

Une bonne page Web que celle donnée ci-dessus, avec une liste des dangers du format MS Word.

«Un hebdomadaire informatique français comparant, au printemps 2004, Word et OpenOffice, concluait à la primauté du premier sur le second avec l'argument imparable que le logiciel libre ne produisait pas des fichiers lisibles par le propriétaire. reprocher à celui qui ouvre toutes ses sources, et permet à quiconque le désire de le lire, de ne pas être lu par celui qui verrouille tout montre l'illogisme devenu naturel en ce domaine.»
Note de bas de page n°14, page 67

En effet, cette remarque montre combien le format fermé et enfermant semble hélas normal. Jusqu'à d'éventuelles mauvaises surprises (abandon du format, arrêt du logiciel,...).

La fiche du livre : La bataille du logiciel libre, Dix clés pour comprendre, de Perline et Thierry Noisette, aux éditions La Découverte, 6,40 euros, 128 pages, ISBN 2-7071-4384-7.

Sources et liens :

  • Le site du livre avec table des matières détaillée, bibliographie du livre (avec parmi les sites, la mention de Formats-Ouverts.org), présentations des auteurs, errata, http://labatailledulogiciellibre.info

La Suisse change de format

La fin d'une époque

Presque chaque pays a sa radio internationale (Radio France Internationale, Radio Suisse Internationale,... ) : c'est un des moyens d'informer ses ressortissants à l'étranger, mais aussi de diffuser la culture du pays au travers de sa langue et d'affirmer sa présence internationale au travers de programmes spécifiques en langues étrangères.

Il en est ainsi par exemple des RFI, BBC Worldservice, Deusche Welle, Voice of America et autres La voix de la Russie. Ces radios ont la particularité d'émettre en utilisant les ondes courtes, une gamme de fréquence particulière qui permet une propagation importante.

La Suisse disposait aussi de sa radio internationale, Radio Suisse Internationale, créée en 1934 : mais elle cesse d'émettre le 31 octobre 2004.

«A la fin octobre, Radio Suisse Internationale (SRI), l’ancien Service suisse des ondes courtes (SSOC), met fin à ses émissions radiophoniques multilingues à destination des Suisses de l’étranger.» (site Swissinfo)

En effet, c'est Internet qui prend la relève avec le site Swiwwinfo.org, «la plate-forme suisse d’actualités et d’informations en neuf langues».

«La radio tire sa révérence trop tôt» a indiqué Nicholas Lombard, son directeur, à l'AFP. «L'internet ne peut pas remplacer la radio si facilement. Mais avec l'internet, nous pouvons offrir des quantités d'information, qui n'étaient pas possibles avec la radio».

C'est donc le format Internet qui supplante le format hertzien. Pourtant, quand on sait que 90% de la population mondiale ne sont pas connectés, qu'une écrasante majorité de lieux n'est pas reliée au téléphone, on peut douter de l'impact réel.

A contrario, avec une radio à ondes courtes, cela suffit, en plein désert ou ailleurs. A condition d'être en zone couverte, ce qui est tout de même bien plus fréquent que relié au réseau téléphonique. Sans parler des aspects de déplacement. Et c'est toujours le format radio qui est privilégié en cas de crise, du moins en France.

Sources et liens :

  • Un excellent site d'informations sur les radios internationales (liste par pays, émissions en français, radios sur Internet,...), de Jean-Michel Aubier, http://perso.wanadoo.fr/jm.aubier/

La dernière utilisatrice est morte

Une chinoise particulière...

Fin septembre 2004, Yang Huanyi, est décédée. Cette chinoise habitant la province du Hunan, avait plus de 90 ans et résidait dans le comté de Jiangyong. Mais ce n'est pas son âge qui en faisait une personne tout à fait unique.

...parlant une langue particulière

Elle était la dernière femme à encore connaître et à utiliser la langue nushu. Cette langue avait été inventée par les femmes du comté depuis plus de 400 ans semble-t-il, transmise uniquement entre elles et donc exclusivement parlée par elles. De plus, presque aucun des documents écrits (poèmes, lettres ou autres textes) de la langue nushu n'est plus disponible : ils étaient détruits à la mort de sa propriétaire et locutrice.

Révélé en 1995, le nushu avait suscité l'intérêt des autorités, avec des efforts lancés pour tenter de comprendre cette langue et de la conserver. Malgré cela le nushu est resté une langue toujours quasi secrète, presque sans trace et sans plus personne pour permettre sa compréhesion. Son code écrit (en faible quantité), ou oral (disparu) sont donc incompréhensibles. De manière irrémédiable.

Aucun dictionnaire complet ni aucune grammaire ne pourront donc être établis pour la langue nushu. Et aucun enseignement ne pourra s'effecturer (à l'INALCO par exemple) pour continuer d'accéder à ces informations.

Mais quel est le lien avec l'informatique et les formats ?

Les documents informatiques ont aussi en quelque sorte une langue, qui est le format des données. Et on a deux types de langues (ou formats) :

  • des langues connues, avec des dictionnaires et des grammaires disponibles qui en expliquent le fonctionnement : on peut continuer de comprendre la langue, de l'utiliser, d'accéder aux informations écrites dans ces langues connues. En informatique, on parle de formats ouverts ;
  • des langues inconnues, perdues, ou conservés que par certains : pas de grammaire ni de dictionnaire disponibles largement. Et si celui qui établit la langue disparait, la langue disparait aussi, et la compréhension des informations dans cette langue. En informatique, on parle de formats fermés, comme ceux établis par les sociétés dont la langue du fichier est détenue par elles seuls.

(La comparaison entre nushu et formats de fichiers n'est peut-être pas la seule possible, ni totalement et parfaitement valable, notamment aux yeux des spécialistes linguistes, mais cette description se veut générale dans le cadre de la catégorie Premiers pas).

Sources et liens :

  • Le site de l'INALCO, l’Institut national des langues et civilisations orientales (aussi appelé Langues O'), http://www.inalco.fr

Syndiquez, simplement ou sémantiquement

Puissant ou trés puissant ?

Le RSS est une technologie puissante : elle permet de récupérer les informations dynamiquement et automatiquement. Et c'est un format ouvert.

Quand on se penche sur le RSS, on découvre qu'il y a le RSS 0.91, le RSS 0.92, le RSS 1.0 et le RSS 2.0 ! On lit que RSS signifie Really Simple Syndication, mais aussi RDF Site Summary ! Alors, quelle différence, quel intérêt ?

  • Le RSS en tant que Really Simple Syndication, concerne les formats 0.91, 0.92 et 2.0 : le principe est de fournir des informations simplement, c'est-à-dire sans trop de détails, sans trop de possibilités poussées mais efficacement pour le but d'origine, fournir des informations à reprendre.
  • Le RSS en tant que RDF Site Summary concerne le RSS 1.0 : il est basé sur le RDF, Resource Description Framework, qui consiste à fournir une description précise et riche des informations, avec notamment l'utilisation d'informations sur les informations (les métadonnées) en vue de traitements plus puissants.

En fait la différence entre ces deux approches concerne la notion importante de Web sémantique : des informations structurées et riches, afin d'appréhender les contenus en vue de traitements automatiques puissants. Et derrière cette approche se trouve le puissant format ouvert XML. Avec le W3C là encore comme structure pilote.

Pour aller plus loin, un mémoire d'études rédigé par Marc Robial explique clairement et en détails ces points.

Sources et liens :

Le support avant le format (ouvert) !

Format ouvert, oui... mais sur support utilisable !

Utiliser des formats ouverts de données est capital pour l'archivage (par exemple avec l'EAD) et la pérennité. Mais il y a plus important encore, avant même ce point : le support ! En effet, le support physique sur lequel se trouve les informations est la première cause possible de problème :

  1. si le support physique est endommagé car mal conservé, trop manipulé, trop fragile ;
  2. si le format physique du support n'a plus de lecteur approprié car plus fabriqué, trop âgé.

Il ne s'agit pas de posséder une sauvegarde des données numériques, mais de les avoir sur un support intègre et lisible. Ainsi :

  • les disques durs peuvent avoir une défaillance physique, ou ne plus être utilisable car les câbles sont différents (autre format des connecteurs...)
  • les CD Rom et les DVD actuels, peuvent se rayer, se casser, ou ne plus être lisibles sur de futures machines qui auront abandonnées ce format de support... comme c'est le cas des disquettes de huit pouces, de cinq pouces, ou de plus en plus pour les disquettes de trois pouces et demi... ou comme les disquettes Zip si le fabricant disparaissait sans plus de lecteur...
  • les bandes ou cartouches (support très utilisé dans le monde de l'informatique professionnelle) peuvent être abimées, mais aussi ne plus avoir de machines pour les lire...

Illustration dans l'actualité récente :

"un lecteur à cette norme (SDLT 600) ne peut pas lire les cartouches au format DLT 8000 (...). A terme, les utilisateurs actuels du format DLT n'auront donc pas le choix : il faudra faire migrer les données de leurs anciennes cartouches" (Formats de bande magnétique : rupture de compatibilité chez Quantum, Le Monde Informatique du 17 septembre)

"Alors que la compatibilité avec les formats antérieurs faisait partie de son argumentaire jusqu'ici, Quantum a choisi de ne pas assurer de façon parfaite celle du SDLT 600". (01net)

Le numérique et la mémoire ne sont pas un couple aussi évident, comme déjà cité pour les SMS, les répertoires, les archives de l'INA ou dans un documentaire alarmant récent.

Source et liens :

Baladeurs à deux formats (fermés)

Sony sait lire son ATRAC et le MP3

L'information avait été dévoilée à la mi-septembre, puis confirmée fin septembre, et voici maintenant les appareils en question : deux baladeurs Sony utilisant son format maison ATRAC et aussi le MP3. Il sera donc possible d'écouter des fichiers musicaux achetés sur le site d'achat en ligne de musique Connect (site de Sony, qui ne propose que son format ATRAC), et aussi les fichiers au format MP3.

Une petite ouverture, pas vraiment d'interopérabilité, et toujours des fausses notes dans la guerre des formats de musique. Mais finalement, DRM oblige, toujours deux formats qui ne sont pas des formats ouverts. Alors que les baladeurs proposant le format ouvert Ogg Vorbis existent (iRiver, Rio) et des enseignes en parlent (Boulanger) ou l'explique (FNAC).

Source et liens :

Mais alors comment les administrations vont échanger avec les citoyens...

...si elles n'utilisent pas le format du marché ?

Cette question est l'une des remarques faites vendredi 22 octobre dernier lors d'un débat organisé par la FNAC Digitale avec pour thème «Qui peut encore concurrencer Miscrosoft ?» (avec Jérôme Bonaldi comme animateur, des personnes de Microsoft ou favorable, des personnes du logiciel libre, et l'assistance).

Avec plus de détails :

  • L'information suivante a été donnée : le Ministère de l'Intérieur a décidé d'utiliser dans son administration à Paris, dans les préfectures, dans les commissariats, la suite bureautique logiciel libre OpenOffice.org, soit 55000 postes. Décision prise officiellement en 2003.
  • Réaction alors : mais alors comment les administrations vont échanger avec les citoyens si elles n'utilisent pas le format du marché ?

En reprenant cette phrase, on a en arrière plan les points suivants :

  1. le marché utilise Word, traitement de texte leader
  2. donc les entreprises, voire les citoyens, utilisent Word, donc ne connaissent que le format de Word
  3. si une administration diffuse des documents faits avec OpenOffice.org, ils auront le format d'OpenOffice.org
  4. donc impossible de lire les documents produits alors qu'ils devraient s'adresser à tous (c'est-à-dire les utilisateurs de Word car tout le monde utilise Word)

Ce à quoi on doit souligner point par point :

  1. être leader, aussi important qu'il soit, ne signifie pas être le seul
  2. les entreprise n'utilisent pas toutes Word, ni les citoyens : Word est un logiciel qu'il faut acquérir et Word n'existe pas pour toutes les machines. Quant au format de Word, de quel Word s'agit-il ? Il n'y en n'a pas qu'un seul.
  3. exact si on garde le format par défaut, mais même dans ce cas, pour lire le fichier il suffit d'avoir OpenOffice.org, disponible pour tous sans prix d'acquisition
  4. les formats des administrations doivent s'adresser à tous, donc ne pas être au format Word (quel que soit le Word), ni à celui d'un logiciel contraignant (achat d'un logiciel pour lire l'information ou disponible uniquement pour certaines machines)

C'est donc bien mal juger et connaître les recommandations dans l'administration française (via l'ADAE, Agence pour le Développement de l'Administration Electronique) et européenne (via le programme IDA, Interchange of Data between Administrations) pour les échanges avec les citoyens et entre les administration: il est demandé d'avoir une information électronique accessible pour tous et interopérable, donc à des formats ouverts. C'est d'ailleurs le thème d'une prochaine conférence européenne le 18 novembre.

Source et liens :

Un stand avec des formats ouverts

Firefox, Thunderbird & Co tiennent salon à Networld + Interop 2004

Internet repose sur des protocoles et des formats ouverts, qui garantissent l'interopérabilité. Les deux principaux outils utilisés sont le navigateur Web et le logiciel de courriels. Et un logiciel se détache dans chacune de ces catégories :

Firefox, un navigateur sachant vraiment naviguer (avec des formats ouverts)

La préversion de Firefox 1.0 est sortie le 14 septembre, téléchargée à plus de 6 millions de fois depuis. Firefox dispose de fonctionnnalités puissantes livrées en standard (blocage des pop-up, navigation par onglets, suivi de flux RSS, barre de recherche), il est léger, sûr et facile à installer, disponible pour Windows (XP, mais aussi les précédentes), Mac OS et Linux. Et il intègre les standards ouverts du Web avec toute leur puissance. Firefox est un logiciel libre.

Thunderbird, la messagerie efficace (avec des normes ouvertes)

Logiciel de messagerie électronique, pour traiter vos courriels, pas le spam. Plus aussi le suivi de flux RSS, le tout disponible pour les Windows, Mac OS et Linux. Avec là aussi avec le respect des normes ouvertes du courriel et du RSS. Thunderbird est un logiciel libre.

Et un stand dédié à ces logiciels

  • du 3 au 5 novembre, porte de Versailles, salon Networld + Interop 2004 ;
  • avec la sortie toute proche de Firefox 1.0 ;
  • avec un stand imposant pour tester, s'informer, échanger ;
  • et des conférences permanentes (sur les logiciels, les formats ouverts,...).

Sans oublier la conférence le mercredi 3 novembre à 17h15, «Mozilla Firefox 1.0 : efficacité, liberté, sécurité» par Tristan Nitot, président de Mozilla Europe. Alors rendez-vous à Networld + Interop 2004 !

Sources et liens :

Une collection de formats

Vous avez demandé le format...

Qu'ils soient ouverts ou fermés, les noms des formats des fichiers peuvent être connus :

  • soit par le nom du logiciel qui a servi à les créer (par exemple un fichier OpenOffice.org tableur ou un fichier LaTeX) ;
  • soit par les lettres de l'extension du fichier, généralement les trois lettres qui suivent le point après le nom du fichier (par exemple le toto.pdf est un fichier PDF ou le foo.dng est un fichier DNG).

Cette extension peut donc être un moyen de lister les formats de fichiers, en les classant par catégories (musique, graphisme, Internet, texte,...) ou simplement par ordre alphabétique. C'est ce que propose le site en anglais Wotsit's format, maintenu par Paul Oliver, avec une collection impressionnante de formats différents et un lien pour chacun vers un site référence ou un document technique.

Sources et liens :

Photo numérique : images en danger et nouveau format ouvert

Le DNG, nouveau format ouvert

La société Adobe a annoncé le 27 septembre la création du nouveau format Digital Negative (DNG) pour l'archivage des fichiers bruts générés par les appareils numériques.

Pourquoi un tel format et quel intérêt ? Car la photo numérique repose actuellement sur des formats fermés, et la situation est inquiétante. Voici ce qui se passe :

  1. Vous prenez une photo avec votre appareil numérique ;
  2. L'appareil créé un fichier numérique ;
  3. Mais ce fichier lui est totalement spécifique : autant d'appareil, autant de fichier ;
  4. Ce fichier est dénommé fichier brut (raw en anglais) ;
  5. Ce fichier brut n'a donc pas de format connu ni commun à d'autres : chaque photo a le format fermé lié à l'appareil utilisé ;
  6. Seuls les logiciels du fabricant de l'appareil savent traiter correctement ces formats fermés.

C'est la conservation des photos qui est en directement menacée : comment archiver quelque chose d'inconnu, quelle pérennité ont des fichiers au format fermé ? Il n'y a pas de réponse positive...

La réponse d'Adobe à cette situation est la suivante :

  • proposer un format ouvert, le DNG, publié, disponible, utilisable par les industriels de la photographie ;
  • conserver au format DNG de manière connue les informations de départ à des formats fermés ;
  • fournir un outil de conversion entre 65 formats bruts fermés et le DNG ;
  • intégrer dans ses produits l'utilisation du format DNG.

On peut saluer cette initiative qui repose sur l'utilisation de formats ouverts. En souhaitant son adoption dans le secteur. Car l'archivage de données numériques est un sujet délicat (un récent documentaire télé tirait la sonnette d'alarme). Avec déjà l'utilisation de formats ouverts comme l'EAD et l'EAC dans ce secteur.

Sources et liens :

Le format de la TNT : nouvel épisode

Le feuilleton de la TNT

TNT : Télévision Terrestre Numérique. Après une lutte politique (CSA, ministres) et économique (TF1-M6, la concurrence) dans les coulisses pour le choix de son format, elle devait débuter en mars 2005, en utilisant le format MPEG-2. C'est ce qui avait été décidé fin juillet par le Premier ministre.

Double revirement de situation :

  • les 6 autorisations accordées par le CSA à 6 chaines pour mars 2005 ont été annulées par le Conseil d'Etat saisi par TF1 ;
  • un rapport technique a été remis au Premier ministre, qui privilégie le MPEG-4 et un report du lancement de la TNT en MPEG-2, solution soutenue par TF1 et M6.

Le format est bien au centre du problème. Avec des enjeux économiques. Comme par exemple aussi pour la musique numérique, les futurs DVD ou les téléphones portables.

Sources et liens :

« Machines à voter...

...machines à ratés »

Pour voter, format électronique ou format papier ? Le format électronique, fermé ? Et le format papier, ouvert ? La question était d'actualité lors des élections européennes de juin en France, et le sera à propos des élections américaines de novembre.

Le sujet revient dans l'actualité à l'approche de l'échéance présidentielle américaine. Avec un article de Libération qui laisse songeur :

(...) Plus d'une fois, ces machines de vote à écran tactile ont montré des signes de défaillance lors d'élections régionales dans d'autres Etats.(...)

(...) De plus, les logiciels utilisés dans ces machines nouvelle génération, n'ayant pu être examinés par des experts indépendants, sont rarement au-dessus de tout soupçon.(...)

La question du format de vote mérite bien d'être étudiée.

Sources et liens :

C'est rentré et c'est perdu

Le répertoire des téléphones portables...

Une campagne d'information a lieu en ce moment, avec affiche où on peut lire sur fond rouge :

Faites monter 150 personnes dans votre mobile. Pensez à rentrer tous vos contacts dans votre repertoire (NDLR : le é est bien oublié). Parlons mieux. Parlons mobile. SFR. (Autre texte d'affiche : Rentrez vos contacts dans votre carte SIM. C'est enregistré.)

Le problème est que ces contacts seront stockés dans ledit répertoire, mais sans moyen aisé de les transférer. Ils seront donc comme emprisonnés dans le téléphone, soit dans sa mémoire soit sur la carte SIM. Quel que soit l'opérateur.

Il peut tout de même y avoir des solutions de transfert :

  • via le site Web de son opérateur, mais parfois que dans le sens du site vers le répertoire, pas l'inverse !
  • en synchronisant avec un ordinateur via un câble (ou une liaison sans fil, infrarouge ou Bluetooth).

Encore faut-il que le modèle de téléphone le propose, et à condition d'avoir un ordinateur qui le permette ! Or la proportion des possesseurs d'ordinateur est bien moindre que celle de ceux ayant un téléphone portable. Sans oublier de faire ce transfert.

Il n'est donc même pas question jusqu'ici du format ouvert (il faut l'espérer) ou fermé des informations du répertoire transféré sous forme d'un fichier (lorsque cela est donc possible). Il s'agit tout simplement du danger du support physique, ici le téléphone portable, sur lequel on place ses données, sans avoir de double (numérique ou pas). En cas de perte, de vol, de détérioration... les informations disparaissent. Certains ont retenu le papier, pour des informations bien moins personnelles mais plus sensibles...

Finalement, pour les SMS, c'est reçu et c'est perdu, ou presque. C'est assez similaire avec le répertoire.

Sources et liens :

Deux dossiers sur un format ouvert pour syndiquer !

La syndication de contenu avec le RSS

Le Web, c'est une multitude de sites qui proposent des informations, régulièrement mises à jour, notamment sur les sites d'actualité, les webblog (ou blog), voire ceux de sociétés ou d'institutions. D'où le problème :

  • comment être informé de ces publications le plus efficacement si on est lecteur de sites ?
  • comment les reprendre dans son site si on est webmestre ?

Pour répondre à ces deux questions, un seul principe : que les informations viennent automatiquement à vous ! C'est ce que fait la technologie RSS : un fil (ou flux) RSS est proposé par le site (sous forme d'un simple fichier), et il est surveillé et traité, soit par un logiciel sachant lire les fils RSS (pour l'internaute lecteur), soit par le site qui l'intègre (pour le webmestre). Les informations viennent alors à vous automatiquement et sont directement lisibles !

Et le RSS est un format ouvert. Qui permet donc de syndiquer (au sens de regrouper) les informations. Cela peut sembler anodin, mais c'est d'une puissance redoutable.

Pour en savoir plus : deux dossiers publiés il y a quelques jours par le site OpenWeb et par le CRI74 (Centre de Ressources Informatiques de Haute-Savoie) vous donneront des détails pour aller plus loin.

(Formats-Ouverts.org propose aussi son fil RSS. Et le logiciel libre de messagerie Thunderbird est aussi un lecteur de fil RSS, pour Linux, Mac OS et Windows).

Sources et liens :

GEIDE : et les formats ouverts ?

La gestion des documents électroniques, sans formats ouverts ?

Du 19 au 21 octobre se tient le 11e Forum de la GEIDE (Gestion Electronique d'Informations et de Documents pour l'Entreprise). Cette manifestation organisée par l'association APROGED (Association des PROfessionnels de la GEIDE) concerne tout ce qui touche à la gestion de contenu, d'archivage, de stockage électroniques.

Quelle est la situation ? Que ce soit en entreprises (ici visée par la manifestation) mais plus généralement encore (particuliers, associations, administrations), on a au départ des documents électroniques (textes, tableaux, base de données,...) créés par différentes applications. Cela constitue la première richesse, qu'il faudra :

  • échanger (en interne, avec l'extérieur) ;
  • publier (papier, Web, PDA,...) ;
  • organiser (établir un classement) ;
  • gérer (savoir ce que l'on a) ;
  • stocker (conserver efficacement) ;
  • archiver (rendre pérenne et réutilisable) ;
  • indexer (avoir des informations sur les informations, comme les métadonnées) ;
  • réutiliser (exploiter les informations produites).

Or pour mener à bien toutes ces actions de manière efficace, indépendante, économique et pertinente, l'utilisation de formats ouverts s'impose. Et cela est déjà en place ou réalisée, comme avec l'EAD/EAC (pour l'archivage), les métadonnées ouvertes ou vaste la famille du vrai XML structuré.

Un petit regret donc, que parmi toutes les pages des sites et dans le programme des 3 jours, nulle mention explicite des formats ouverts, et de leur importance, qui sont derrière chaque point. A moins que cela ne soit si évident que nul besoin de le citer.

Sources et liens :

Un livre blanc fédéral belge sur (et pour) les formats ouverts

En juin 2004, il y eut coup sur coup : le 22, une loi française qui définissait un standard ouvert ; et le 25, une décision du Conseil des ministres belge qui obligeait à ne plus utiliser que des standards ouverts.

Voici la suite du côté belge. Le 6 octobre, le Service public fédéral Technologie de l’Information et la Communication a publié un livre blanc intitulé : «Directives et recommendations pour l’usage de standards ouverts et/ou specifications ouvertes dans les administrations fédérales». En vue d'une meilleure interopérabilité des différents systèmes entre eux et des échanges facilités entre les pouvoirs publics fédéraux et les citoyens, entreprises, fonctionnaires et autres pouvoirs publics.

Le document assez court (une dizaine de pages) pose clairement les définitions (page 5, schéma à l'appui) et donne des directives et recommandations fortes : pas de dépendance, des standards ouverts, des logiciels libres.

Sources et liens :

Documentaire «Sauve qui peut le numérique !»

Les données informatiques contenues dans les ordinateurs et les supports numériques seront-ils encore lisibles dans les cent prochaines années ? Les scientifiques s'interrogent : les données informatiques actuelles pourront-elles encore être disponibles dans le futur ? La banalisation du stockage numérique (ordinateur, banques de données, CD-ROM, etc.) a façonné l'archivage et la mémoire du monde. Aujourd'hui, la plupart des sauvegardes est faite via des logiciels toujours plus complexes, toujours plus évolutifs. Cela sera-t-il préjudiciable ? Des scientifiques et des philosophes du monde entier sonnent l'alarme. Cette perte de la mémoire collective à brève échéance sera tout à fait tangible. On pourrait appeler cette période de notre développement : «le haut Moyen-Age de l'ère de l’informatique». (Source : site Telerama.fr)

Le problème de l'archivage est bien posé, déjà mentionné ici au travers du format EAD ou d'une conférence européenne récente. Sans oublier le problème du format physique du support.

Lire la suite

Microsoft copie les erreurs de Novell !

Une même définition fausse de l'interopérabilité

Le 12 ocotobre, Bill Gates a été interviewé par USA Today à l'occasion du lancement à Los Angeles du dernier Windows XP Media Center. Parfois, quelques lignes et mots tout simples en apparence peuvent faire passer bien des idées fausses... Extrait commenté :

Question :

Quelle est votre position à propos de rendre Windows Media compatible avec Apple ? (What's your take on making Windows Media compatible with Apple?)

Commentaire 1 : "compatible avec Apple"

Le journaliste emploie bien ces termes. Sa question est donc : "Faire en sorte que Apple (son format) soit lu par Windows Media". Il ne dit pas "rendre Apple compatible avec Windows Media".

Commentaire 2 : le rappel des faits

  • le format de Apple pour la musique est le AAC, celui de Windows Media est le WMA ;
  • ils ne sont pas compatibles : Apple vend du AAC (pas du WMA) et ses baladeurs lisent le AAC (pas du WMA) ;
  • le format de Apple est actuellement le plus utilisé dans le secteur des ventes de musique en ligne : record avec iTunes Music Store (plus de 150 millions de morceaux vendus... au format AAC), baladeurs numériques iPod leader (plus de 82% de part de marché des appareils à disque dur... et lisant donc du AAC) ;
  • à l'inverse, le site de vente de musique en ligne de Microsoft (et d'autres) ne vend que du WMA (donc pas de AAC), et les baladeurs WMA ne lisent pas le AAC (seuls les iPod le font).

Réponse, partie 1

Bill Gates : Nous sommes de grands convaincus de l'interopérabilité. (We're big believers in interoperability.)

Commentaire 3 : bon début !

Bravo ! Cette réponse positive va même encore plus loin que la question posée. Même si on peut être convaincu d'une chose et ne pas la mettre en œuvre pour autant... La suite...

Réponse, partie 2

Bill gates : Nous avons clairement annoncé que si Apple voulait supporter l'interopérabilité, nous le leur permettrons super facilement. (We've stated very clearly that if Apple wanted to support interoperability, we'd make that super easy for them.)

Commentaire 4 : tout s'écroule, et revoilà l'erreur (qui arrange) !

Bill Gates propose pour permettre l'interopérabilité... de faciliter l'utilisation du WMA (son format)... pour que Apple utilise le WMA sur ses appareils et sur son site de vente ! Il inverse les termes de la question de départ.

On ne peut pas alors parler d'interopérabilité, car il ne s'agit que de prise en compte d'un format par un éditeur d'un format concurrent. Un accord, entre deux sociétés, pour seulement deux formats (ceux de OpenOffice.org et de MS Office, ou du WMA et du AAC. Et les baladeurs Sony qui ne lisent que le format Atrac3 de Sony ?

Commentaire 5 : mais cela ressemble trés fortement à une déclaration de Novell ?

Des responsables de Novell parlaient en juillet à propos d'OpenOffice.org de "l'interopérabilité avec les environnements Microsoft". Même erreur, puisqu'il s'agit en fait de compatibilité momentanée avec certains formats. Compatibilité limitée car ne reposant pas sur des formats ouverts qui sont le seul moyen d'obtenir une réelle interopérabilité.

Conclusion

La compatibilité, qui est limitée, n'est pas l'interopérabilité, universelle. A partir d'une bonne question de départ, on peut commenter ainsi la réponse fournie : "n'a pas répondu à la question, a copié une réponse, et une réponse fausse" ! Mais qui arrange bien. Comme parler de format répandu, donc compatible, autre erreur.

Sources et liens :

Le projet 1dok.org

Permettre l'établissement d'un format standard ouvert

Le fait d'être basé sur des standards ouverts est l'une des causes majeures du succès d'Internet.

L'Internet, dans sa puissance et son étendue actuelles, serait inconcevable sans un accord mondial sur les protocoles de communication, les jeux de caractères et les langages à utiliser.

Ce qui manque toujours aujourd'hui, c'est un format de document ouvert, standardisé, qui faciliterait l'échange de documents électroniques.

Ces trois courts paragraphes sont le début de la description du projet d'origine allemande 1dok.org qui vise à permettre l'élaboration d'un format standard, "sans réinventer la roue" (celle du format d'OpenOffice.org par exemple, comme indiqué dans la partie "Questions and answers" du thème "Service"). Avec une base en vrai XML et des métadonnées.

Le projet fait partie d'un programme du Ministère allemand de l'Economie, de la Techhnologie et des Transports. Il a plusieurs partenaires, dont la région Schleswig-Holstein et s'inscrit dans un cadre de financement européen. 1dok.org est membre du consortium OASIS (Organization for the Advancement of Structured Information Standards).

La première phase du projet est achevée, et actuellement il s'agit d'intégrer les résultats du travail réalisé dans le cadre d'une implémentation de référence plus large.

Ce projet va dans le sens des récentes déclarations de l'Europe pour avoir des formats ouverts ou de la conférence sur les standards ouverts du 18 novembre prochain.

Sources et liens :

Journée mondiale de la normalisation

"Les normes connectent le monde"

Le 14 octobre de chaque année, se déroule la journée mondiale de la normalisation (JMN), organisée par l'ISO (Organisation internationale de normalisation), la CEI (Commission électrotechnique internationale) et l'UIT (Union internationale des télécommunications). Il s'agit de marquer le travail d'élaboration des normes et leur importance. L'édition 2004 est la trente-cinquième, avec pour thème "Les normes connectent le monde".

En effet, sans norme internationale commune, établie et reconnue, pas d'échange possible, quel que soit le domaine : l'informatique, les technologies de l'information et des télécommunications (TIC) ou le vaste domaine non-électronique (l'alimentaire, les services, l'énergie, les transports,...).

Pour ce qui est des TIC, des informations produites par les logiciels ou des réseaux informatiques, les normes sont à la base des interconnexions et des échanges. Et donc de l'interopérabilité. C'est ce qui figure entre autres dans les textes diffusés à l'occasion de cette journée (communiqué de presse et message des présidents).

Encore faut-il que ces normes soient des normes ouvertes, ce qui n'est pas seulement à souhaiter, mais qui est le moyen le plus sûr et le plus puissant, illustré par le réseau mondial Internet, dont on fête au travers du W3C les 10 ans de standards ouverts.

Sources et liens :

10 ans de formats ouverts !

W3C10 : le dixième anniversaire du W3C

Le World Wide Web Consortium, W3C, a été créé en octobre 1994 par Tim Berners-Lee au MIT, avec la collaboration du CERN, de la DARPA et de la Commission européenne, et rejoint en avril 1995 par l'INRIA.

Depuis donc 10 ans, il travaille "pour mener le Web à son plein potentiel en développant des protocoles communs pour promouvoir son évolution et assurer son interopérabilité".

Un travail qui repose donc sur des formats et des protocoles ouverts, garantissant l'interopérabilité et l'accessibilité. Avec une liste impressionnante de standards ouverts, dont les premiers HTML, le XHTML (et CSS) des sites Web modernes ne sont qu'une mince partie visible (la famille XML est au cœur du travail du W3C).

Le 7 octobre, le W3C a annoncé la tenue le 1er décembre à Boston d'une journée de célébration de ce dixième anniversaire, avec 7 sessions et de nombreux intervenants (comme Tim Berners-Lee, directeur du W3C ; Michel Cosnard de l'INRIA ; Charles Vest, directeur du MIT ; Tim O'Reilly, président des éditions O'Reilly).

Le W3C est sans aucun doute le meilleur exemple de l'importance, de la puissance et de la réussite des formats et des protocoles ouverts : le Web et ses standards ouverts sont désormais incontournables. Et ils se sont largement répandus au-delà des seuls sites consultables sur les ordinateurs personnels : les PDA, les téléphones portables, les formulaires "parlent Web" de plus en plus. Le Web et le navigateur sont une plate-forme.

Excellent anniversaire au W3C ! Que les formats ouverts continuent d'être déployés !

Sources et liens :

Conférence internationale sur un format ouvert de métadonnées

Le Dublin Core à Shanghaï

Qu'est-ce que les métadonnées ? Ce sont des données à propos de données : des renseignements à propos des informations fournies. Par exemple, l'auteur, le titre, la date, la langue d'un document.

Ces métadonnées (metadata en anglais) sont capitales pour retrouver une information, pour archiver, pour tirer partie des données produites. Il existe plusieurs ensembles de métadonnées : l'un d'eux s'appelle le Dublin Core, du nom de l'université de Dublin (Ohio, Etats-Unis) où s'est tenue la première réunion du groupe de travail qui a défini un ensemble de métadonnées qui portent son nom.

Un point capital, est que ces métadonnées soient interopérables. Donc à un format ouvert, utilisable par tous, pour faire gagner en puissance les informations produites. C'est d'ailleurs l'un des buts indiqués par le Dublin Core Metadata Initiative (DCMI) sur son site.

Et du 11 au 14 octobre se tient à Shanghaï la conférence internationale Dublin Core 2004 ("DC-2004, International Conference on Dublin Core and Metadata Applications 2004"). Le sujet est : Metadata across Languages and Cultures.

Sources et liens :

Un protocole ouvert en voie de standardisation internationale

Le protocole XMPP

Les messageries instantannées sont un haut lieu de non-interopérabilité : avec ICQ on n'échange qu'avec ICQ, avec MSN qu'avec MSN, avec Wanadoo Messenger qu'avec Wanadoo Messenger, avec iChat qu'avec iChat (et AIM), avec AIM qu'avec AIM (et iChat) !

L'origine de cette situation ? Des technologies d'échanges propres à chaque messagerie, sans installer celles des autres. Pourtant, certains logiciels proposent d'échanger avec les autres messageries instantannées, par exemple GAIM. Qui plus est, il existe une technologie disponible et utilisable par toutes les messageries instantannées, un vrai protocole ouvert, XMPP.

XMPP (Extensible Messaging and Presence Protocol) est même en passe de s'imposer de manière officielle comme un standard ouvert établi par l'IETF (Internet Engineering Task Force), depuis la publication de ses spécifications comme RFC (Request For Comments). Et XMPP va plus loin que la simple messagerie instantanée, en proposant en fait un protocole d'échanges d'informations structurées entre machines.

Après récemment le SSML, voici donc un autre format ouvert d'avenir en faveur de l'interopérabilité.

Sources et liens :

Un article sur les formats ouverts à l'EPFL

"L'avenir dure longtemps"

La revue "Flash Informatique" est une publication de l'école polytechnique fédérale de Lausanne (EPFL). Elle existe en version papier diffusée sur place, mais aussi en version ligne (en PDF et pour PDA).

Le dernier numéro, FI 8/04, numéro 8 d'octobre 2004, propose un article sur les formats de fichiers et leurs problèmes, sous forme d'un dialogue entre une grand-mère et son petit-fils, intitulé "L'avenir dure longtemps", écrit par Anne Possoz et moi. Avec un encart sur Formats-Ouverts.org signé Marc Geiser.

Un studio pour un format

20th Century Fox adopte le Blu-ray

Quel sera le format de lecture des futurs DVD (indépendamment du format du contenu) ? Deux formats s'opposent, le Blu-ray et le HD, avec chacun son groupe d'industriels rassemblés en consortium, dont Sony, LG, Panasonic, Philips, Sharp pour le premier (au sein du BDF, Blu-ray Disc Founders) ; et Toshiba, Sanyo, NEC pour le second (au sein du HD-DVD).

Mais quel contenu proposer sur ces futurs DVD ? De la video par exemple, donc des films : il est ainsi capital qu'un détenteur d'un gros catalogue s'allie à l'un ou à l'autre des groupements...

Et le 4 octobre dernier, le studio 20th Century Fox a annoncé son ralliement au BDF, donc au format Blu-ray. Soit une collection importante de films. Il faut aussi y ajouter le catalogue de la Metro Goldwyn Mayer, racheté par Sony. Avec les futurs Playstation 3 (de Sony), capables de lire les Blu-ray.

Outre la guerre pour imposer son format, c'est aussi la guerre pour avoir des contenus. Contenus à des formats (son, video,...) qui ne sont pas ouverts, avec aussi la volonté d'avoir un "environnement sécurisé" (déclaration du président de la Twentieth Century Fox Home Entertainment). Donc des DRM.

Sources et liens :

Rendre compatibles les fichiers qui rendent incompatibles !

Les DRM interopérables ?

Un fichier (musical ou video ou autre) "protégé" contre le piratage, c'est :

  1. le fichier des données (son, image, texte,...), généralement dans un format fermé ;
  2. un fichier de limitation des droits (de copier, de graver, de transférer), le DRM.

Donc, pas d'interopérabilité : un fichier de musique acheté sur iTunes, ne sera pas lisible sur un balladeur Sony ni sur un lecteur ne connaissant que le format WMA ! Une situation largement dénoncée. Une des deux origines de l'incompatibilité : les DRM, qui ne sont pas les mêmes. La seconde : pas de formats ouverts des données.

D'où l'idée de rendre compatibles entre eux les DRM. C'est ce que veulent certains industriels qui se sont regroupés au sein du consortium Coral (HP, Sony, Philips, Samsung, Matsushita, Twentieth Century Fox et Intertrust). Mais, deux absents : Apple, qui a sa technologie DRM, et Microsoft, qui a la sienne. Mais cela ne règle pas le problème posé par les DRM, qui ne fonctionnent pas.

Toujours est-il que ce projet de comptatibilité des DRM est souhaité par l'Europe selon un rapport de l'été dernier. Les DRM continuent de faire parler d'eux...

Source et liens :

Voici votre reçu de vote

Quel format pour les élections : électronique, papier ?

Peut-on voter autrement qu'avec les classiques bulletins, urnes et listes d'émargement que nous connaissons en France ?

  • Oui, avec des cartes perforées par exemple. C'était le cas encore en 2000 lors des élections présidentielles américaines. Avec un certains nombre de problèmes pour établir la validité des cartes et comptabiliser.
  • Oui, via le réseau Internet, avec des machines équipées de logiciels qui transmettent le vote, évitant les dépouillements, permettant de voter sans se déplacer et de proclamer plus rapidement les résultats. Ce fut le cas à Vandoeuvre lors des élections européennes de juin 2004. C'est aussi ce que certains homme politiques ont récemment souhaité comme François Fillon ("Enfin, je propose que soit autorisé, pour les élections universitaires, le vote par Internet.", le 28 septembre) ou Jean-Pierre Raffarin (" Je fais un rêve, je souhaite pour ce referendum, que l'on puisse faire voter toute la jeunesse de France. Je souhaite même qu'il soit possible de voter par Internet.", le 5 septembre).
  • Oui, avec des écrans tactiles, comme ce sera le cas pour les élections présidentielles américaines en novembre prochain. Comme relaté par un article du Monde.

Pour les deux derniers cas, un problème se pose : comment être sûr de ce qui est pris en compte par la machine et transmis ? La solution est donnée dans l'article du Monde : un reçu est délivré à chaque électeur. En cas de doute, on pourra demander à chacun de fournir son reçu et les comptabiliser... Mais cela resssemble fort à un dépouillement de bulletin papier ! Avec cependant le secret du vote qui disparait : le candidat pour qui on a voté est inscrit...

Alors, le vote électronique (et les problèmes qu'ils posent) aura-t-il recours au format papier en cas de contestation ? En tout cas, le Conseil de l'Europe, assemblée consultative de 46 pays, a émis une série de recommandations pour éviter certains problèmes du vote électronique : contrôle des machines, second dépouillement, vote secret. Avec aussi la demande d'une liste officielle des logiciels utilisés, l’utilisation de "normes ouvertes" pour "garantir l’interopérabilité".

Pour les échanges, il faudrait en effet des formats ouverts. Et pour les logiciels, il faudrait une transparence totale, donc avec un accès au code source librement consultable. Ce que la CNIL indique dans sa recommandation. Mais impossible pour tout un chacun de vérifier le bon fonctionnement de ces lignes de programme... Alors que le format avec bulletin, isoloir, urne et dépouillement est un système compréhensible par tous les électeurs, et transparent.

Format papier, format électronique : chacun a ses caractéristiques ; une situation déjà rencontrée pour la conservation d'informations sensibles à long terme...

Sources et liens :

Manifestation importante : OSLSG Conf

Une journée à La Haye sur les formats ouverts et l'interopérabilité

"Open Standards and Libre Software in Government" : tel est le titre d'une conférence qui va traiter des logiciels libres au niveau des gouvernements en Europe, avec un volet à propos des formats ouverts et d'interopérabilité. Elle s'annonce comme importante : en effet,

  • elle est coordonnée par la présidence néerlandaise de l'Union Européenne, soutenue par le ministère néerlandais de l'intérieur et le programme gouvernemental néerlandais OSOSS, avec aussi le ministère néerlandais des affaires économiques ;
  • elle va réunir des intervenants de haut rang de nombreux pays : des députés, des représentants officiels de différentes structures européennes, nationales, régionales ou ministérielles (avec pour la France, Christian Hardy, du Ministère de l'économie, des finances et de l'industrie) ;
  • elle est articulée en trois sessions, dont une à propos d'interopérabilité et des formats ouverts (notamment pour les services en ligne entre administrations, entre administrations et citoyens), présidée par le responsable du programme européen IDA (Interchange of Data between Administrations, qui demande des formats ouverts).

Et pour compléter :

  • Date : jeudi 18 novembre 2004
  • Lieu : La Haye, Pays-Bas
  • Participation ouverte et gratuite (mais inscription préalable obligatoire)
  • Deux sponsors, IBM et Novell.

Sources et liens :

Piégé : le format précédent n'existe pas !

La palme de la caractéristique sournoise ?

Comment présenter une information ? On peut opter pour différentes tournures. En voici trois versions à propos du logiciel InDesign d'Adobe, qui en est lui aussi à sa version trois.

  1. La v3 ne connait pas la v2 ! InDesign 3 ne sait pas enregistrer au format d'InDesign 2, soit la version précédente !
  2. Utiliser InDesign 3 c'est créer des fichiers uniquement au format d'InDesign 3 ; impossible donc pour un utilisateur de la version 2 de lire votre travail.
  3. Pas de compatibilité arrière, la version 3, InDesign CS, oblige les interlocuteurs avec qui on travaille sur un document à passer eux aussi à la version 3.

Qu'un logiciel ne permette pas d'enregistrer dans une version de son format fermé de quatre ou cinq versions précédentes, c'est ce qui arrive. C'est même un des dangers des formats fermés.

Mais ne proposer rien que le format de la version actuelle et même pas le format de la version précédente... c'est presque un précédent !

Réaction en chaîne obligée, ver dans le fruit, mise à jour significative : choisissez la formulation 1, 2 ou 3 précédente qui vous convient. Celles-ci sont hélas toutes compatibles.

Sources et liens :

Conférence sur l'EAD, format ouvert des archives

Une rencontre européenne pour un format ouvert

Les "Journées européennes sur les DTD EAD et EAC" avaient été annoncées ici le 5 août dernier, avec une présentation de l'EAD. Elles concernent donc les formats ouverts EAD (Encoded Archival Description) et EAC (Encoded Archival Context), qui sont du vrai XML.

Le monde des archives a recours à de nombreux formats et normes. Le programme de ces journées montre qu'en ce qui concerne l'EAD et l'EAC, il s'agit d'une utilisation :

  • importante (de nombreux exemples de mise en place) ;
  • internationale (France, Allemagne, Italie, Suisse, Royaume Unis, Etats Unis, Pologne, Portugal, Suède,...) ;
  • officielle (les Archives nationales).

On imagine mal les Etats être dépendants de formats fermés et sans pérennité pour leurs archives nationales. Les formats ouverts répondent bien à ces exigences.

Sources et liens :

Et de cent !

Un petit cap franchi

La barre des 100 billets publiés sur Formats-Ouverts.org a été franchie. (C'est assez mathématique, avec un par jour en trois mois d'existence !). Pour consulter la liste des plus de 100 titres, la rubrique Table des billets est à votre disposition. Sans oublier aussi la possibilité de Rechercher un terme ou une expression.

Signalons aussi que ces 100 billets se répartissent en 16 catégories, dont la dernière née de septembre, Premiers pas, vise à aider à faire ses premiers pas de non-connaisseur dans l'univers des formats (parfois une jungle où on peut se retrouver "Prisonnier d'une capsule...").

Enfin, la fréquentation continue de progresser. Via notamment le fil RSS du site, repris maintenant aussi par le site Linuxfr.org sur la page http://linuxfr.org/rdf/ (l'EPFL, Framasoft, Léa-Linux le proposent aussi). Merci à vous, bonne lecture et bonne utilisation. Et vivent les formats ouverts !

Table des billets d'octobre 2004

Les 32 billets publiés en octobre

1 dans Tables des billets, 1 dans Vie du site, 6 dans Manifestations, 1 dans Logiciel, 7 dans Général, 2 dans Interopérabilité, 5 dans Ressources, 2 dans Internet, 4 dans Archivage, 1 dans Loi, 1 dans Premiers pas, 1 dans Non-électronique