Palmarès des Formats (PdF) recensés par Google sur Internet

Après une tentative en juillet et le premier PdF début août, voici donc une nouvelle photographie en ce début septembre des formats présents sur Internet et recensés par le moteur de recherche Google en recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), mais cette fois avec plus de formats (ouverts ou pas) et sans distinction de langue :

  • Tous formats : environ 3 570 000 000
  • HTML : environ 816 000 000, soit 22,85%
  • HTM : environ 283 000 000, soit 7,92%
  • PDF : environ 71 200 000, soit 1,99%
  • Flash (swf) : environ 16 300 000 soit 0,45%
  • doc : environ 10 300 000, soit 0,28%
  • txt : environ 7 240 000, soit 0,20%
  • ppt : environ 3 350 000, soit 0,09%
  • PS : environ 2 780 000, soit 0,07%
  • xls : environ 2 410 000, soit 0,06%
  • rtf : environ 1 290 000, soit 0,03%
  • php : environ 90 700 000, soit 2,54%
  • asp : environ 142 000 000, soit 3,97%
  • tex (TeX et LaTeX) : environ 696 000, soit 0,02%
  • Tous les nombres ci-dessous représentent moins de 0,01% (sauf le format deb)
  • sxw (traitement de texte d'OpenOffice.org) : environ 59 900
  • jpg : environ 170 000
  • jpeg : environ 2 020
  • png : environ 10 200
  • gif : environ 176 000
  • exe : environ 14 500
  • deb : environ 1 240 000 soit 0,03%
  • rpm : environ 30 200
  • Mesure effectuée le dimanche 4 septembre, entre 22h30 et 23h00, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul (htm est-il inclus dans les html ? php inclut-il php3 ?).

Juste une remarque : il ressort par rapport à août, que certains nombres de cette mesure baissent... dont celui par exemple de Tous formats, qui perd 10 millions. Cela peut paraître énorme, comme lire 10 millions de documents recensés au format .doc, mais cela ne représente que 0,28% de l'ensemble des fichiers recensés par cette mesure !

Il y a bien pour les données chiffrées, d'un côté le format absolu (10 millions !), et de l'autre le format relatif (soit moins de 0,3% de l'ensemble...) : suivant celui qui est utilisé, cela est plus ou moins percutant...

Sources et liens :