Le Web invisible




J'imagine déjà vos remarques amusées et interloquées. Quoi ? Il a donc définitivement basculé dans la folie d'un Internet cyberfantomatique et prétendu existant. Comme si le foisonnement actuel de sites et de serveurs ne suffisait pas ... Et le moteur de recherche de ce monde-là s'appelle Ghost au lieu de Google ?

Mais non ! Inutile de venir débrancher mon câble de connexion ou d'appeler un service médical à domicile pour une piqûre calmante et salvatrice, car il ne s'agit en aucune façon d'une élucubration mentale sortie de cet univers de science-fiction que j'affectionne. Le Web invisible est tout simplement la partie non référencée des réseaux interconnectés. Ce sont les nombreux moteurs de recherche qui répertorient les pages que vous visitez pour alimenter les index de référencement . La croissance du Net étant permanente une partie des informations n'est pas scannée en temps réel par les spiders scrutateurs. Des rapports attestent qu’environ 70 % seulement du Web dit public apparaissent grâce à Google, Yahoo, Altavista et autres "search engines".

Un autre paramètre explicatif relève des méthodologies d'indexation basées sur des spécificités propres. Une recherche classique n'est pas fondée si les contenus sont des documents dynamiques (a contrario des pages html dites usuelles) ou sous forme d'animations en Flash. De plus, d'autres raisons occultent la présence de certains sites comme le niveau de l'arborescence (limité à une centaine de Koctets) du contenu indexé, certains formats ajoutés, mais non reconnus tels que le Lotus, DBase ou Paradox ou l'utilisation de cadres (frames) dans une page.
Enfin, la principale limitation réside souvent dans la volonté délibérée de ne pas apparaître à la surface du Web pour les nombreux réseaux dits privés. Un simple fichier Robot.txt ou une URL contenant volontairement un point d'interrogation annihilera toute possibilité de connaître les informations placées derrière ce subterfuge technique. De même un accès à un site avec un login et password bloquera la connaissance de data ainsi protégé. Mais me direz-vous pourquoi empêcher la diffusion d'informations alors que certaines sociétés n'ont de cesse de vouloir communiquer sur leur raison d'être ? Tout simplement pour préserver la confidentialité de bases de données concernant certaines activités militaires, industrielles ou de laboratoires de recherche interconnectés avec d'autres unités . Si ces deux exemples sont signifiants, il existe un nombre impressionnant de structures connectées privées à commencer par certaines banques d'images satellitaires qui n'ont aucun besoin d'une quelconque publicité.

Enthousiasmé par cette brève explication, vous souhaiteriez, en un dernier snobisme élitaire, faire parti de ce monde binaire occulte, où se décident, vous semble-il, les grandes orientations de notre époque ? Rien n'est plus simple pour une fois : élaborez donc de nombreuses pages html statiques avec le concours de fichiers ASCII et n’intégrez pas de description de contenu ni de liens vers d'autres sites. Ainsi protégé par ces leurres de syntaxe informatique, vous pourrez divulguer, grâce à l'adresse web rédigée sur de discrètes cartes de visite, votre découverte sur la prolifération des paramécies à poil court qui ne manquera d'intéresser les décideurs, super informés, rencontrés dans le wagon de première classe de votre TGV habituel.

Jeu. - Juillet 15, 2004          



©