La version 5.1 d'Unicode est parue

Unicode permet de coder les caractères. En français, il n'y a pas que 26 lettres minuscules, 26 majuscules et 10 chiffres arabes. Car ce serait oublier les lettres accentuées minuscule et majuscule, les symboles (comme l'euro) et autres signes de ponctuation ou pas (@ , ! ; ? : =). Et il n'y a pas que les caractères en français, mais aussi, assez proches de nous, l'espagnol (avec la tilde), l'allemand (avec le double s), ou encore ceux des langues d'Europe centrale et les plus lointains Chinois, Coréen ou Japonais.

Pour écrire (et afficher) toutes les lettres et symboles des langues écrites, il faut un codage des caractères : c'est ce que propose Unicode, un format ouvert proposé par le Consortium Unicode [1] (qui tient aussi des conférences internationales). La version 5.1 a été publiée 4 avril 2008 [2].

Le format des caractères est un des premiers formats rencontrés et il est très « visible » lorsque certaines lettres sont affichées avec des symboles totalement différents de ce que cela devrait être...

Pour cette version 5.1, on peut relever entre autres :

  • des langues d'Asie, d'Inde, d'Afrique mieux prises en compte ;
  • de nouveaux symboles pour les mathématiques (29), pour les dominos et pour le mahjong ;
  • ou encore les symboles du disque de Phaistos ;

Comme le définit le consortium Unicode lui-même, on a « un nombre unique pour chaque caractère, sans tenir compte de la plateforme, du logiciel, de la langue » : c'est finalement de l'interopérabilité.

Sources et liens :
Et sur Formats-Ouverts.org :