Comment les formats ouverts sont utilisés sur le site Web noriaweb.free.fr

Après les coulisses du site tceurope.free.fr utilisant les formats ouverts, voici les coulisses du site Noriaweb.free.fr, le second site indiqué pour lire plus facilement le traité de constitution. Avec les informations données par son auteur, jcm.

Noriaweb est basé sur PHP (avec un script écrit spécialement) et MySQL. Le texte du traité a une structure particulière : titres, sous-titres, correctement hiérarchisés et articles numérotés à la suite (et non une numérotation reprenant à 1 pour chaque chapitre, par exemple).

L'idée était de réaliser des fonctions de recherche très rapides, au moyen d'un script aussi léger que possible. D'où l'idée d'exploiter au maximum la structure du texte afin de limiter les opérations que devrait effectuer le script.

Cela a conduit à structurer la base de données d'une certaine manière, et à rédiger un script PHP. Le texte a été « découpé » en ses différents niveaux hiérarchiques. Chaque niveau, accompagné si nécessaire de marqueurs, a été placé dans un conteneur spécifique de la base de données.

Dans un second temps ces marqueurs ont été remplacés (par exemple ceux qui permettent d'afficher une portion de texte sous forme de liste ordonnée) par les codes XHTML de mise en page : en effet pourquoi utiliser un temps, certes faible, pour remplacer ces marqueurs par des expressions indispensables à la mise en page : autant utiliser ces expressions comme marqueurs (quand cela s'avère nécessaire) et les mentionner directement en base de donnée, ce qui ne nécessite plus aucune intervention du script au niveau du code de mise en page.

Les recherches sont effectuées par des expressions régulières (regexp) et non par les fonctions de recherche "plain text" (recherche en texte intégral) disponibles sur certaines versions de MySQL seulement. Pour la programmation, le logiciel Arachnophilia a été utilisé.

Moyennant quelques adaptations, le script serait utilisable pour n'importe quel texte structuré, comme le code des impôts par exemple. Ce dernier semblerait fait pour avoir le minimum de chances d'y trouver quelque-chose.

Sources et liens :

[Rappel : En cas de vote favorable sur les brevets logiciels au Parlement européen, des fonctionnalités triviales (comme utiliser une base de données pour un site Web, ou la barre de progression) qui sont déjà brevetées ailleurs, seront valables en Europe si elles ont été acceptées par l'OEB. Avec le risque d'en voir d'autres brevetées. Cela pourra signifier des droits à payer pour les utiliser. Ce qui ne sera pas possible pour ce site, ni pour beaucoup d'autres, y compris ceux de sociétés.]