Palmarès des Formats (PdF) recensés par Google sur Internet

Après une tentative (en juillet), puis le premier PdF (début août) suivi du deuxième PdF (début septembre), voici donc une nouvelle photographie en ce début octobre des formats présents sur Internet et recensés par le moteur de recherche Google en recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des formats ouverts ou pas, et sans distinction de langue :

  • Tous formats : environ 9 650 000 000
  • HTML : environ 2 210 000 000, soit 22,90%
  • HTM : environ 735 000 000, soit 7,61%
  • PDF : environ 188 000 000, soit 1,95%
  • Flash (swf) : environ 42 700 000 soit 0,44%
  • doc : environ 27 900 000, soit 0,29%
  • xml : environ 24 400 000, soit 0,25% (nouveau ce mois)
  • txt : environ 19 300 000, soit 0,20%
  • ppt : environ 9 320 000, soit 0,10%
  • PS : environ 7 870 000, soit 0,08%
  • xls : environ 6 550 000, soit 0,07%
  • rtf : environ 3 530 000, soit 0,04%
  • php : environ 244 000 000, soit 2,53%
  • asp : environ 372 000 000, soit 3,85%
  • rss : environ 2 430 000, soit 0,02 % (nouveau ce mois)
  • tex (TeX et LaTeX) : environ 2 040 000, soit 0,02%
  • rdf : environ 1 900 000, soit 0,02% (nouveau ce mois)
  • Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb et exe)
  • sxw (traitement de texte d'OpenOffice.org) : environ 165 000
  • jpg : environ 172 000
  • jpeg : environ 3 070
  • png : environ 112 000
  • gif : environ 185 000
  • exe : environ 2 600 000, soit 0,03%
  • deb : environ 2 980 000, soit 0,03%
  • rpm : environ 30 200
  • Mesure effectuée le mercredi 5 octobre 2005, entre 19h15 et 19h45, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul (htm est-il inclus dans html ?).

Remarque : il ressort par rapport à août et à septembre, que les résultats de cette mesure augmentent fortement en valeur absolue (on passe ainsi de 3,57 milliards de pages tous formats à plus de 9,65 ; ou 71 à 188 millions de PDF). Cependant, en valeur relative, c'est-à-dire en proportion (%), il est intéressant de noter que les formats restent avec le même classement et presque le même pourcentage (à l'exception du .exe).

Encore une fois, il y a le format brut (ou absolu), comme 42 millions de pages Flash, et le format relatif, soit moins de 0,5% (0,44) ! Suivant le format retenu, l'information a plus ou moins de force...

Sources et liens :