SELFHTML/Aides à la navigation Divers compléments techniques |
Quand un navigateur Web ou un robot de recherche ou l'agent d'un serveur proxy réclame des données à un serveur Web, il envoie toujours une chaîne de caractères avec laquelle il se présente nommément auprès du serveur Web. Un schéma uniforme ou standardisé a été standardisé pour le faire dans la spécification sur HTTP 1,1. Après l'annonce de la présentation d'un "User-Agents" - agent utilisateur- (c'est le terme générique pour les programmes nommés au début qui peuvent réclamer des données) est envoyée au moins une indication ou un commentaire sur le produit. La distinction entre les différentes versions ou types de produits nécessaire pour la pratique n'est pas définie. C'est regrettable. Dans la pratique, une certaine règle s'est dégagée: le nom du produit et la version du produit sont représentés dans cet ordre, séparés par une barre oblique. Tous les navigateurs ne s'en tiennent pas, il est vrai à ce schéma. Quelques types de navigateurs se font passer pour d'autres, et d'autres encore permettent aussi à l'utilisateur de choisir dans les options du programme une identification quelconque. Quand l'utilisateur entre alors son nom ou une ineptie quelconque, le navigateur s'en servira pour s'annoncer au serveur.
Toutefois l'identification client est sauvegardée à certain endroits et peut servir, dans certaines situations, des fins utiles:
HTTP_USER_AGENT
, pour trouver par quel logiciel client il a été appelé. Ici aussi l'information peut être utilisée pour en faire dépendre l'exécution de certaines instructions.Netscape se donne depuis son origine le nom de Mozilla. Cela ne suffit pas du tout à l'identifier clairement, car l'Explorer Internet se donne également par exemple le nom de Mozilla. Les exemples qui suivent montrent quelques identifications typiques qui ne le sont toutefois que pour Netscape.
|
Le schéma fondamental pour le nom de produit et la version est donc tenu - L'identification commence toujours par Mozilla/[mention de version]
. Ce qui de permet pas de distinguer de nombreux autres navigateurs! La mention de version peut aussi contenir des mentions supplémentaires comme 5.0b1
(ce qui figure d'ailleurs pour la version 6.0, étant donné que la version 5.0 a été sautée et b1
figure pour "version Bêta 1". D'autres additifs comme 3.01Gold
peuvent aussi figurer (Gold
figurait à l'époque pour la première variante du navigateur Netscape qui permettait en même temps l'édition Wysiwyg, donc un précurseur du Composer Netscape).
Derrière la mention de version peut suivre entre crochets une abréviation de langue, qui donne la langue des éléments de contrôle du navigateur. Cette abréviation de langue est certes standard pour les versions plus récentes mais il peut arriver qu'elle manque.
D'autres informations suivent enfin entre parenthèses. S'il y en a plusieurs, elles sont séparées les unes des autres par des points-virgules. D'abord est nommée la plate-forme utilisée. Ici des abréviations comme Win95
, Win98
ou WinNT
dont possibles pour les versions Windows correspondantes. Pour tous les systèmes basés sur Unix, c'est la plupart du temps X11
qui est mentionné à cet endroit, ce qui figure pour X-Windows, et pour les ordinateurs Mac, c'est Macintosh
.
En deuxième position dans les parenthèses suit une majuscule qui désigne le niveau de sécurité du navigateur (longueur de clés). Un U
figure pour "conforme US", un I
pour "international". En ce qui concerne le N
dans le dernier des exemples ci-dessus, il n'était pas possible de retrouver ce pour quoi il figurait.
Derrière le signe de sécurité, suivent ensuite encore des informations descriptives sur le type de processeur utilisé et/ou d'autres mentions sur le système d'exploitation.
Toutes ces composantes peuvent être séparées par des espaces mais ce n'est pas indispensable.
l'Explorer Internet s'annonce dans l'identification de son navigateur d'une façon sensiblement moins prétentieuse qu'à l'ordinaire. Il se cache toujours derrière le même nom de code que le navigateur Netscape, mentionne dans un premier temps un numéro de version qui se réfère à Netscape et sort ensuite, introduites par le mot clé compatible
, les informations proprement dites qui le concernent. Les exemples suivant montrent quelques identifications typiques de l'Explorer Internet.
|
Le schéma fondamental pour le nom de produit et la version suit celui de Netscape et il est donc respecté - L'identification commence toujours par Mozilla/[mention de version]
. La mention de version placée derrière correspond à la version du navigateur Netscape, à laquelle l'Explorer Internet qui s'identifie, se donne comme étant pleinement compatible. Ce qui est naturellement toujours à apprécier avec une certaine modération, car un Explorer Internet n'a par exemple à aucun moment interprété l'élément layer
en HTML donc l'affirmation de la compatibilité avec Netscape 4.0 n'est pas forcément vérifiée. Partant de là, la mention de version derrière Mozilla/
pour l'Explorer Internet n'est pas vraiment significative.
L'Explorer Internet ne dévoile son identité proprement-dite que dans les parenthèses. Celles-ci contiennent en principe plusieurs mentions séparées par des points-virgules. La première partie est toujours le mot clé compatible
. Il est suivi par les quatre majuscules MSIE
, qui posent la référence proprement-dite à l'Explorer Internet. Derrière vient la mention exacte de la version.
Toutes les autres mentions peuvent varier et avoir un ordre différent. Pour les désignations du système d'exploitation, on remarque que Windows
est mentionné in extenso, alors que les versions Macintosh de l'Explorer Internet sont sorties couramment avec Mac
plus tiret de soulignement plus désignation plus précise. Quand il s'agit de la fourniture du navigateur par un service en ligne comme AOL ou MSN, c'est précisé dans une mention additionnelle telle que AOL 4.0
.
Toutes ces composantes peuvent être séparées par des espaces mais ce n'est pas indispensable en particulier pour les versions plus anciennes.
Les exemples suivants montrent quelques identifications typique de quelques types d'autres navigateurs.
|
Les exemples montrent combien la façon dont les différents types de navigateurs s'identifient est hétérogène, ce qui ne facilite pas vraiment l'évaluation. En règle générale pour l'analyse avec un script par exemple, seule la recherche de mots-clés propres à chacun d'entre eux comme Opera
, Mosaic
, amaya
, Lynx
ou ICab
peut aider dans un premier temps. Dans une deuxième étape, vous pouvez alors essayer en recherchant des expressions partielles telles que Win
, Mac
, Amiga
etc... de déduire le système d'exploitation.
Il n'y a pas de recette miracle pour différencier les "visiteurs humains de pages Web" des programmes logiciels qui lors de l'appel des pages Web les traitent par lots et indexent par exemple les données pour leur moteurs de recherche ou transmettent les fichiers à un ordinateur proxy. Les exemples suivants montrent quelques identifications typiques de ces programmes.
|
Pour les moteurs de recherche, il existe au moins quelques points de repère après lesquels il est possible d'effectuer des recherches dans une chaîne de caractères servant à l'identification. Ces robots s'identifient souvent avec des mots clés tels que Robot
, Spider
ou bien Crawler
. Nombre d'entre eux comprennent aussi dans le nom, le nom du service de recherche correspondant. Dans les exemples ci-dessus, sont reconnaissables par exemple Google
, Fireball
, Lycos
, Eule
, Northernlight
et Aladin
. En général on peut reconnaître souvent les robots et aussi les agents de serveurs proxy en ce qu'ils mentionnent lors de l'identification un nom de domaine, une URI ou une adresse électronique.
robots.txt - contrôler les robots | |
Abréviations de langue | |
SELFHTML/Aides à la navigation Divers compléments techniques |
© 2001 Stefan Münz / © 2003 Traduction Serge François, 13405@free.fr
selfhtml@fr.selfhtml.org