La traduction et le format texte : un exemple
Le livre Emacs Précis et concis a été édité en France par les éditions O'Reilly France, disparues en 2008 (le vendredi 9 mai). J'ai eu l'honneur d'être le traducteur du livre qui était paru en anglais chez O'Reilly sous le titre original GNU Emacs Pocket Reference [1].
Comment traduire ? Plus exactement, quels outils employer et surtout quels formats utiliser ? La réponse était simple et pragmatique : le format texte, un format ouvert.
Le fichier au format texte brut contenait tout le texte (oui, lapalissade !) à traduire mais ne comportait aucun formatage lié à l'aspect graphique (gras, italique, taille de caractères, polices,...) lui-même lié à la structure du livre et la nature du texte (titres, sous-titres, citations, commandes,...).
Il était possible de rajouter des indications texte, des commentaires, des sortes de balise pour indiquer par exemple les niveaux hiérarchiques (par exemple <chapitre> pour en indiquer le début) ou d'autres informations (<ici> pour savoir où on en est, <dico> pour penser à vérifier l'orthographe,...). Ces balises étaient supprimables dans la version finale. Les caractères du texte de départ étaient ceux de l'anglais, donc au format ASCII 128, sans accentuation, alors que le français est au format ASCII 256 (avec les é, ç et autres ù).
De plus, le format texte permet de faire facilement et rapidement des recherches et remplacements, y compris massivement sur plusieurs dizaines de pages. Le format texte se révèle très puissant.
(Pour ce qui est de l'outil, le format texte était parfait dans... un éditeur de texte. Plus concrètement, Emacs précis et concis fut traduit pour commencer avec Vim pour un peu moins de la première moitié, puis avec Emacs pour la majorité restante).
Sources et liens :
- [1] Page, GNU Emacs Pocket Reference, en anglais, http://oreilly.com/catalog/9781565924963/
5 réactions
1 De PB - 29/05/2009, 22:39
Un livre sur Emacs traduit en utilisant Vim, c'est beau
2 De Thierry Stoehr - 30/05/2009, 00:30
Il n'y a pas d'incompatibilité, et il y a de l'ouverture Et comme je l'ai indiqué, le plus gros a tout de même été traduit avec Emacs (un peu plus de 60% du contenu). Mais rien n'interdisait le duo d'outils... ce qui comptait était le fichier texte en français (et ceci était un petit scoop).
3 De LordFarquaad - 31/05/2009, 17:04
ASCII 256, un format inventé pour l'occasion ?
4 De Thierry Stoehr - 03/06/2009, 13:52
Le format de codage des caractères était de l'ASCII 8 bit, soit 256 caractères (fr.wikipedia.org/wiki/ASC...
5 De LordFarquaad - 05/06/2009, 02:52
Mmmh, je me permets de citer la page en question :
« L'ASCII définit 128 caractères numérotés de 0 à 127 et codés en binaire de 0000000 à 1111111. Sept bits suffisent donc pour représenter un caractère codé en ASCII. Toutefois, les ordinateurs travaillant presque tous sur huit bits (un octet) depuis les années 1970, chaque caractère d'un texte en ASCII est stocké dans un octet dont le 8e bit est 0. »
Le reste de l'article explique également qu'utiliser le nom « ASCII » pour d'autres normes (qui l'étendent) est un abus de langage et prête à confusion