Pour les formats ouverts ! - Palmarès2024-03-05T22:30:18+01:00urn:md5:2d891e3025da3d404903bd804eb249fdDotclearVoici le cinquième PdFurn:md5:e995c4c211afc3b850f90f9780dab8922005-12-07T19:50:05+00:002005-12-08T11:50:43+00:00Thierry StœhrPalmarès <h5>Palmarès des Formats (PdF) recensés par Google sur Internet</h5>
<p>Après <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2005/07/15/462-un-classement-des-formats">la tentative</a> de juillet, il y eut le premier PdF en <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2005/08/02/481-voici-le-premier-pdf">août</a>, puis en <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2005/09/04/522-voici-le-deuxieme-pdf">septembre</a>, en <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2005/10/05/559-voici-le-troisieme-pdf">octobre</a> et en <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2005/11/04/601-voici-le-quatrieme-pdf">novembre</a>. Voici donc en ce début décembre une nouvelle photographie <em>des formats présents sur Internet et recensés par le moteur de recherche Google</em> en utilisant la recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">formats ouverts</a> ou pas, et sans distinction de langue :</p>
<ul>
<li>Tous formats : environ 9 670 000 000</li>
</ul>
<ul>
<li>HTML : environ 2 190 000 000, soit 22,64%</li>
</ul>
<ul>
<li>HTM : environ 748 000 000, soit 7,73%</li>
<li>SHTML : environ 233 000 000, soit 2,41%</li>
<li>PDF : environ 195 000 000, soit 2,01%</li>
</ul>
<ul>
<li>Flash (swf) : environ 44 900 000 soit 0,46%</li>
<li>doc : environ 28 300 000, soit 0,29%</li>
<li>xml : environ 24 700 000, soit 0,25%</li>
<li>txt : environ 18 400 000, soit 0,19%</li>
</ul>
<ul>
<li>ppt : environ 9 340 000, soit 0,09%</li>
<li>PS : environ 6 960 000, soit 0,07%</li>
<li>xls : environ 6 700 000, soit 0,07%</li>
<li>rtf : environ 3 490 000, soit 0,03%</li>
<li>XHTML : environ 2 380 000, soit 0,02%</li>
</ul>
<ul>
<li>php : environ 248 000 000, soit 2,56%</li>
<li>asp : environ 376 000 000, soit 3,88%</li>
</ul>
<ul>
<li>rss : environ 1 810 000, soit 0,02 %</li>
<li>tex (TeX et LaTeX) : environ 1 920 000, soit 0,02%</li>
<li>rdf : environ 1 850 000, soit 0,02%</li>
</ul>
<ul>
<li>jpg : environ 5 500 000, soit 0,08%</li>
<li>jpeg : environ 469 000, soit 0,005%</li>
<li>png : environ 1 330 000, soit 0,01%</li>
<li>gif : environ 3 580 000, soit 0,04%</li>
</ul>
<ul>
<li>Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb et cfm)</li>
</ul>
<ul>
<li>SVG : environ 314 000</li>
<li>sxw (traitement de texte d'OpenOffice.org avant la version 2.0) : environ 156 000</li>
</ul>
<ul>
<li>exe : environ 838</li>
<li>deb : environ 2 840 000, soit 0,03%</li>
<li>rpm : environ 16 700</li>
</ul>
<ul>
<li>cfm : environ 157 000 000, soit 1,62%</li>
<li>zip : environ 132 000</li>
<li>rar : environ 21 600</li>
</ul>
<ul>
<li>odt : environ 10 200</li>
<li>ods : environ 262</li>
<li>odp : environ 779</li>
</ul>
<ul>
<li>Mesure effectuée le mercredi 7 décembre 2005, entre 19h00 et 19h20, heure de Paris. Ces chiffres ne sont que des <strong>indications</strong>, il n'y a rien d'officiel ni d'absolu. Il y a toujours des questions sans réponse à propos des méthodes de calcul de Google (comme htm est-il inclus dans html ?).</li>
</ul>
<p>Remarques :</p>
<ul>
<li>le <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">format ouvert</a> <strong>SVG</strong>, à l'honneur <a href="/post/2005/12/07/638-voici-le-cinquieme-pdf/post/2005/12/05/637-voici-un-peu-de-svg">avec Firefox 1.5</a> ne fait pas encore de bond spectaculaire, mais sera à suivre (comme l'OpenDocument Format).</li>
</ul>
<ul>
<li>par rapport à novembre, les résultats de <em>cette</em> mesure ne changent guère, avec de légères augmentations ou diminutions ; une anomalie flagrante : les fichiers .exe passent de 2 590 000 à 838.</li>
</ul>
<p>On a toujours <strong>le format brut</strong> (ou absolu), avec par exemple des millions de fichiers, mais qui correspondent en <strong>format relatif</strong>, (en pourcentage) à bien moins... (2 380 000 fichiers XHTML, soit 0,02% !). Suivant le format utilisé, l'information aura plus ou moins d'impact...</p>
<h5>Sources et liens :</h5>
<ul>
<li>La page Google recherche avancée, <a href="http://www.google.fr/advanced_search?hl=fr">http://www.google.fr/advanced_search?hl=fr</a></li>
<li>La page d'accueil de Google en anglais, <a href="http://www.google.com">http://www.google.com</a></li>
</ul>Voici le quatrième PdFurn:md5:90d8f91659f4580ad1f8f3336c9f52142005-11-04T21:20:43+00:002005-11-08T11:56:58+00:00Thierry StœhrPalmarès <h5>Palmarès des Formats (PdF) recensés par Google sur Internet</h5>
<p>En juillet, il y eut <a href="/post/2005/11/04/601-voici-le-quatrieme-pdf/post/2005/07/15/462-un-classement-des-formats">une tentative</a>, puis successivement les PdF début <a href="/post/2005/11/04/601-voici-le-quatrieme-pdf/post/2005/08/02/481-voici-le-premier-pdf">août</a>, <a href="/post/2005/11/04/601-voici-le-quatrieme-pdf/post/2005/09/04/522-voici-le-deuxieme-pdf">septembre</a> et <a href="/post/2005/11/04/601-voici-le-quatrieme-pdf/post/2005/10/05/559-voici-le-troisieme-pdf">octobre</a>. Voici donc en ce début novembre une nouvelle photographie <em>des formats présents sur Internet et recensés par le moteur de recherche Google</em> en utilisant la recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des <a href="/post/2005/11/04/601-voici-le-quatrieme-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">formats ouverts</a> ou pas, et sans distinction de langue :</p>
<ul>
<li>Tous formats : environ 9 680 000 000</li>
</ul>
<ul>
<li>HTML : environ 2 180 000 000, soit 22,52%</li>
</ul>
<ul>
<li>HTM : environ 758 000 000, soit 7,83%</li>
<li>SHTML : environ 241 000 000, soit 2,48% (<em>nouveau</em>)</li>
<li>PDF : environ 198 000 000, soit 2,04%</li>
</ul>
<ul>
<li>Flash (swf) : environ 44 800 000 soit 0,46%</li>
<li>doc : environ 29 000 000, soit 0,29%</li>
<li>xml : environ 24 800 000, soit 0,25%</li>
<li>txt : environ 18 600 000, soit 0,19%</li>
</ul>
<ul>
<li>ppt : environ 9 350 000, soit 0,09%</li>
<li>PS : environ 7 110 000, soit 0,07%</li>
<li>xls : environ 6 630 000, soit 0,07%</li>
<li>rtf : environ 3 610 000, soit 0,03%</li>
<li>XHTML : environ 2 290 000, soit 0,02% (<em>nouveau</em>)</li>
</ul>
<ul>
<li>php : environ 257 000 000, soit 2,65%</li>
<li>asp : environ 394 000 000, soit 4,07%</li>
</ul>
<ul>
<li>rss : environ 1 800 000, soit 0,02 %</li>
<li>tex (TeX et LaTeX) : environ 1 920 000, soit 0,02%</li>
<li>rdf : environ 2 010 000, soit 0,02%</li>
</ul>
<ul>
<li>jpg : environ 5 420 000, soit 0,05%</li>
<li>jpeg : environ 510 000, soit 0,005%</li>
<li>png : environ 1 310 000, soit 0,01%</li>
<li>gif : environ 3 470 000, soit 0,03%</li>
</ul>
<ul>
<li>Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb, exe et cfm)</li>
</ul>
<ul>
<li>SVG : environ 275 000 (<em>nouveau</em>)</li>
<li>sxw (traitement de texte d'OpenOffice.org avant la version 2.0) : environ 166 000</li>
</ul>
<ul>
<li>exe : environ 2 590 000, soit 0,03%</li>
<li>deb : environ 3 120 000, soit 0,03%</li>
<li>rpm : environ 30 400</li>
</ul>
<ul>
<li>cfm : environ 156 000 000, soit 1,61% (<em>nouveau</em>)</li>
<li>zip : environ 134 000 (<em>nouveau</em>)</li>
<li>rar : environ 21 800 (<em>nouveau</em>)</li>
</ul>
<ul>
<li>odt : environ 921 (<em>nouveau</em>)</li>
<li>ods : environ 289 (<em>nouveau</em>)</li>
<li>odp : environ 542 (<em>nouveau</em>)</li>
</ul>
<ul>
<li>Mesure effectuée le vendredi 4 novembre 2005, entre 19h30 et 19h55, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul de Google (htm est-il inclus dans html ?).</li>
</ul>
<p>Remarques :</p>
<ul>
<li>de nouveaux formats ont été pris en compte, dont <a href="/post/2005/11/04/601-voici-le-quatrieme-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">le format ouvert</a> OpenDocument Text (odt), Spreadsheet (ods, tableur) et Presentation (odp) ;</li>
<li>par rapport à octobre, les résultats de <em>cette</em> mesure ne changent guère ;</li>
<li>enfin, <em>mea culpa</em> pour les images : le mode d'estimation des 3 premières mesures n'était pas adapté, car basé sur une recherche de texte qui ne figure pas dans un fichier image ; ce mois-ci, Google Image a été utilisé avec comme mot recherché la seule première lettre du nom du format (ainsi p pour png) qui figure dans le nom du fichier ; les 10,71 millions en jpg, jpeg, png et gif représentent 0,09%.</li>
</ul>
<p>On a toujours <strong>le format brut</strong> (ou absolu), avec par exemple des millions de fichiers, qui correspondent en <strong>format relatif</strong>, (en pourcentage) à bien moins... (18,6 millions de fichiers txt, soit 0,19%). L'information aura plus ou moins de force suivant le format retenu...</p>
<h5>Sources et liens :</h5>
<ul>
<li>La page Google recherche avancée, <a href="http://www.google.fr/advanced_search?hl=fr">http://www.google.fr/advanced_search?hl=fr</a></li>
<li>La page d'accueil de Google en anglais, <a href="http://www.google.com">http://www.google.com</a></li>
</ul>Voici le troisième PdFurn:md5:d09e7463050fc16959865ac5684050972005-10-05T20:25:26+00:002005-10-05T20:24:28+00:00Thierry StœhrPalmarès <h5>Palmarès des Formats (PdF) recensés par Google sur Internet</h5>
<p>Après <a href="/post/2005/10/05/559-voici-le-troisieme-pdf/post/2005/07/15/462-un-classement-des-formats">une tentative</a> (en juillet), puis <a href="/post/2005/10/05/559-voici-le-troisieme-pdf/post/2005/08/02/481-voici-le-premier-pdf">le premier PdF</a> (début août) suivi <a href="/post/2005/10/05/559-voici-le-troisieme-pdf/post/2005/09/04/522-voici-le-deuxieme-pdf">du deuxième PdF</a> (début septembre), voici donc une nouvelle photographie en ce début octobre <em>des formats présents sur Internet et recensés par le moteur de recherche Google</em> en recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), avec des <a href="/post/2005/10/05/559-voici-le-troisieme-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">formats ouverts</a> ou pas, et sans distinction de langue :</p>
<ul>
<li>Tous formats : environ 9 650 000 000</li>
</ul>
<ul>
<li>HTML : environ 2 210 000 000, soit 22,90%</li>
<li>HTM : environ 735 000 000, soit 7,61%</li>
</ul>
<ul>
<li>PDF : environ 188 000 000, soit 1,95%</li>
<li>Flash (swf) : environ 42 700 000 soit 0,44%</li>
<li>doc : environ 27 900 000, soit 0,29%</li>
<li>xml : environ 24 400 000, soit 0,25% <em>(nouveau ce mois)</em></li>
<li>txt : environ 19 300 000, soit 0,20%</li>
<li>ppt : environ 9 320 000, soit 0,10%</li>
<li>PS : environ 7 870 000, soit 0,08%</li>
<li>xls : environ 6 550 000, soit 0,07%</li>
<li>rtf : environ 3 530 000, soit 0,04%</li>
</ul>
<ul>
<li>php : environ 244 000 000, soit 2,53%</li>
<li>asp : environ 372 000 000, soit 3,85%</li>
</ul>
<ul>
<li>rss : environ 2 430 000, soit 0,02 % <em>(nouveau ce mois)</em></li>
<li>tex (TeX et LaTeX) : environ 2 040 000, soit 0,02%</li>
<li>rdf : environ 1 900 000, soit 0,02% <em>(nouveau ce mois)</em></li>
</ul>
<ul>
<li>Tous les résultats ci-dessous représentent moins de 0,01% (sauf les formats deb et exe)</li>
</ul>
<ul>
<li>sxw (traitement de texte d'OpenOffice.org) : environ 165 000</li>
</ul>
<ul>
<li>jpg : environ 172 000</li>
<li>jpeg : environ 3 070</li>
<li>png : environ 112 000</li>
<li>gif : environ 185 000</li>
</ul>
<ul>
<li>exe : environ 2 600 000, soit 0,03%</li>
<li>deb : environ 2 980 000, soit 0,03%</li>
<li>rpm : environ 30 200</li>
</ul>
<ul>
<li>Mesure effectuée le mercredi 5 octobre 2005, entre 19h15 et 19h45, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul (htm est-il inclus dans html ?).</li>
</ul>
<p>Remarque : il ressort par rapport à août et à septembre, que les résultats de <em>cette</em> mesure augmentent fortement <strong>en valeur absolue</strong> (on passe ainsi de 3,57 milliards de pages tous formats à plus de 9,65 ; ou 71 à 188 millions de PDF). Cependant, en <strong>valeur relative</strong>, c'est-à-dire en proportion (%), il est intéressant de noter que les formats restent avec le même classement et presque le même pourcentage (à l'exception du .exe).</p>
<p>Encore une fois, il y a <strong>le format brut</strong> (ou absolu), comme 42 millions de pages Flash, et <strong>le format relatif</strong>, soit moins de 0,5% (0,44) ! Suivant le format retenu, l'information a plus ou moins de force...</p>
<h5>Sources et liens :</h5>
<ul>
<li>La page Google recherche avancée, <a href="http://www.google.fr/advanced_search?hl=fr">http://www.google.fr/advanced_search?hl=fr</a></li>
<li>La page d'accueil de Google en anglais, <a href="http://www.google.com">http://www.google.com</a></li>
</ul>Voici le deuxième PdFurn:md5:112877310e1798f65380922900f909762005-09-04T23:50:59+00:002005-09-05T00:06:16+00:00Thierry StœhrPalmarès <h5>Palmarès des Formats (PdF) recensés par Google sur Internet</h5>
<p>Après <a href="/post/2005/09/04/522-voici-le-deuxieme-pdf/post/2005/07/15/462-un-classement-des-formats">une tentative</a> en juillet et <a href="/post/2005/09/04/522-voici-le-deuxieme-pdf/post/2005/08/02/481-voici-le-premier-pdf">le premier PdF</a> début août, voici donc une nouvelle photographie en ce début septembre <em>des formats présents sur Internet et recensés par le moteur de recherche Google</em> en recherche avancée (la méthode reste la même : demander une page sans un mot inexistant et dans un format particulier), mais cette fois avec plus de formats (<a href="/post/2005/09/04/522-voici-le-deuxieme-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">ouverts</a> ou pas) et sans distinction de langue :</p>
<ul>
<li>Tous formats : environ 3 570 000 000</li>
</ul>
<ul>
<li>HTML : environ 816 000 000, soit 22,85%</li>
<li>HTM : environ 283 000 000, soit 7,92%</li>
</ul>
<ul>
<li>PDF : environ 71 200 000, soit 1,99%</li>
<li>Flash (swf) : environ 16 300 000 soit 0,45%</li>
<li>doc : environ 10 300 000, soit 0,28%</li>
<li>txt : environ 7 240 000, soit 0,20%</li>
<li>ppt : environ 3 350 000, soit 0,09%</li>
<li>PS : environ 2 780 000, soit 0,07%</li>
<li>xls : environ 2 410 000, soit 0,06%</li>
<li>rtf : environ 1 290 000, soit 0,03%</li>
</ul>
<ul>
<li>php : environ 90 700 000, soit 2,54%</li>
<li>asp : environ 142 000 000, soit 3,97%</li>
</ul>
<ul>
<li>tex (TeX et LaTeX) : environ 696 000, soit 0,02%</li>
</ul>
<ul>
<li>Tous les nombres ci-dessous représentent moins de 0,01% (sauf le format deb)</li>
</ul>
<ul>
<li>sxw (traitement de texte d'OpenOffice.org) : environ 59 900</li>
</ul>
<ul>
<li>jpg : environ 170 000</li>
<li>jpeg : environ 2 020</li>
<li>png : environ 10 200</li>
<li>gif : environ 176 000</li>
</ul>
<ul>
<li>exe : environ 14 500</li>
<li>deb : environ 1 240 000 soit 0,03%</li>
<li>rpm : environ 30 200</li>
</ul>
<ul>
<li>Mesure effectuée le dimanche 4 septembre, entre 22h30 et 23h00, heure de Paris. Ces chiffres ne sont que des indications, il n'y a rien d'officiel ni d'absolu. Il y a aussi des questions sans réponse à propos des méthodes de calcul (htm est-il inclus dans les html ? php inclut-il php3 ?).</li>
</ul>
<p>Juste une remarque : il ressort par rapport à août, que certains nombres de <em>cette</em> mesure baissent... dont celui par exemple de <em>Tous formats</em>, qui perd 10 millions. Cela peut paraître énorme, comme lire 10 millions de documents recensés au format .doc, mais cela ne représente que <em>0,28%</em> de l'ensemble des fichiers recensés par cette mesure !</p>
<p>Il y a bien pour les données chiffrées, d'un côté <strong>le format absolu</strong> (10 millions !), et de l'autre <strong>le format relatif</strong> (soit moins de 0,3% de l'ensemble...) : suivant celui qui est utilisé, cela est plus ou moins percutant...</p>
<h5>Sources et liens :</h5>
<ul>
<li>La page Google recherche avancée, <a href="http://www.google.fr/advanced_search?hl=fr">http://www.google.fr/advanced_search?hl=fr</a></li>
<li>La page d'accueil de Google en anglais, <a href="http://www.google.com">http://www.google.com</a></li>
</ul>Voici le premier PdFurn:md5:7972487f8f245e0676211afc3be4d23a2005-08-02T22:00:08+00:002005-08-03T23:58:03+00:00Thierry StœhrPalmarès <h5>Voici le premier PdF, Palmarès des Formats (recensés par Google)</h5>
<p>L'article expliquant le 15 juillet qu'<a href="/post/2005/08/02/481-voici-le-premier-pdf/post/2005/07/15/462-un-classement-des-formats">il est impossible d'établir un classement des formats</a> les plus utilisés, <a href="/post/2005/08/02/481-voici-le-premier-pdf/post/2004/07/01/12-un-article-de-loi-definit-ce-que-sont-les-formats-ouverts">ouverts</a> ou pas, <strong>n'était pas exact</strong>, <em>mea culpa</em> : en effet, grâce à l'astuce détaillée <a href="/post/2005/08/02/481-voici-le-premier-pdf/post/2005/07/15/462-un-classement-des-formats#co">en commentaires</a> par Sébastien Billard, des statistiques sont disponibles.</p>
<p><strong>Le principe</strong> est d'utiliser le moteur de recherche Google avec ses options avancées : il s'agit d'indiquer le type de format de fichier souhaité et un mot que l'on ne souhaite pas dans les fichiers. En utilisant un « mot » inexistant (long et avec uniquement des consonnes par exemple), on obtient un résultat.</p>
<p><strong>La première mesure</strong> (BETA comme dirait Google) a été faite dans la nuit du 1er au 2 août 2005, entre 23h15 et 23h45 heure de Paris. Voici donc le premier article de la nouvelle catégorie <a href="/post/2005/08/02/481-voici-le-premier-pdf/category/Palmares">Palmarès</a> (des fichiers recensés par Google) :</p>
<ul>
<li>Tous formats : environ 3 580 000 000, dont envriron 3 380 000 000 en anglais et environ 86 000 000 en français.</li>
<li>PDF : environ 72 200 000, soit 2,02% ; dont environ 64 400 000 en anglais et environ 4 720 000 en français.</li>
<li>flash : environ 16 000 000 soit 0,45%.</li>
<li>doc : environ 10 700 000, soit 0,30% ; dont environ 9 290 000 en anglais et environ 702 000 en français.</li>
<li>txt : environ 7 290 000, soit 0,20%.</li>
<li>ppt : environ 3 700 000, soit 0,10% ; dont environ 3 250 000 en anglais et environ 141 000 en français.</li>
<li>PS : environ 3 500 000, soit 0,10% ; dont environ 3 070 000 en anglais et environ 215 000 en français.</li>
<li>xls : environ 2 450 000, soit 0,07% ; dont environ 1 770 000 en anglais et environ 163 000 en français.</li>
<li>rtf : environ 1 370 000, soit 0,04% ; dont environ 856 000 en anglais et environ 205 000 en français.</li>
</ul>
<p>Au même moment, la page d'accueil de Google en anglais indiquait : « <em>Searching 8,058,044,651 web pages</em> ».</p>
<p>Les 8 formats précis ci-dessus ne représentent donc que 3,28% de tous les formats. Et même le PDF avec plus de 72 millions ne représente qu'un peu plus de 2%... En tout cas dans le cadre de <em>cette</em> mesure.</p>
<p><strong>Le nom de PdF</strong> est bien sûr un clin d'œil au nom du format d'Adobe... mais avec une minuscule entre les deux majuscules (classements, hit-parade, baromètre, charts, top des formats ne sonnaient pas aussi bien ; même chose quant à <em>formamètre</em>, <em>formatomètre</em> ou <em>formatimètre</em> construits comme pluviomètre, altimètre ou chronomètre).</p>
<h5>Sources et liens :</h5>
<ul>
<li>La page Google recherche avancée, <a href="http://www.google.fr/advanced_search?hl=fr">http://www.google.fr/advanced_search?hl=fr</a></li>
<li>La page d'accueil de Google en anglais, <a href="http://www.google.com">http://www.google.com</a></li>
</ul>