Voici le premier PdF, Palmarès des Formats (recensés par Google)

L'article expliquant le 15 juillet qu'il est impossible d'établir un classement des formats les plus utilisés, ouverts ou pas, n'était pas exact, mea culpa : en effet, grâce à l'astuce détaillée en commentaires par Sébastien Billard, des statistiques sont disponibles.

Le principe est d'utiliser le moteur de recherche Google avec ses options avancées : il s'agit d'indiquer le type de format de fichier souhaité et un mot que l'on ne souhaite pas dans les fichiers. En utilisant un « mot » inexistant (long et avec uniquement des consonnes par exemple), on obtient un résultat.

La première mesure (BETA comme dirait Google) a été faite dans la nuit du 1er au 2 août 2005, entre 23h15 et 23h45 heure de Paris. Voici donc le premier article de la nouvelle catégorie Palmarès (des fichiers recensés par Google) :

  • Tous formats : environ 3 580 000 000, dont envriron 3 380 000 000 en anglais et environ 86 000 000 en français.
  • PDF : environ 72 200 000, soit 2,02% ; dont environ 64 400 000 en anglais et environ 4 720 000 en français.
  • flash : environ 16 000 000 soit 0,45%.
  • doc : environ 10 700 000, soit 0,30% ; dont environ 9 290 000 en anglais et environ 702 000 en français.
  • txt : environ 7 290 000, soit 0,20%.
  • ppt : environ 3 700 000, soit 0,10% ; dont environ 3 250 000 en anglais et environ 141 000 en français.
  • PS : environ 3 500 000, soit 0,10% ; dont environ 3 070 000 en anglais et environ 215 000 en français.
  • xls : environ 2 450 000, soit 0,07% ; dont environ 1 770 000 en anglais et environ 163 000 en français.
  • rtf : environ 1 370 000, soit 0,04% ; dont environ 856 000 en anglais et environ 205 000 en français.

Au même moment, la page d'accueil de Google en anglais indiquait : « Searching 8,058,044,651 web pages ».

Les 8 formats précis ci-dessus ne représentent donc que 3,28% de tous les formats. Et même le PDF avec plus de 72 millions ne représente qu'un peu plus de 2%... En tout cas dans le cadre de cette mesure.

Le nom de PdF est bien sûr un clin d'œil au nom du format d'Adobe... mais avec une minuscule entre les deux majuscules (classements, hit-parade, baromètre, charts, top des formats ne sonnaient pas aussi bien ; même chose quant à formamètre, formatomètre ou formatimètre construits comme pluviomètre, altimètre ou chronomètre).

Sources et liens :