SELFHTML

Contrôler les projets Web

Page d'information: vue d'ensemble

vers le bas Généralités
vers le bas Fichiers Log du serveur Web
vers le bas Statistiques
vers le bas Exploiter les statistiques
vers le bas Terminologie comme requête de fichier, pages vues et visites
vers le bas Évaluer l'avis des utilisateurs

 vers le bas 

Généralités

Quand vous aurez Autre page d'information publié un projet sur le Web, vous serez aussi certainement intéressé de connaître la fréquence des accès qui y ont été faits. Pour pouvoir estimer sans erreur l'accueil qui lui est réservé et ce que vous pouvez améliorer, le nombre d'accès pur et simple ne suffit pas. Pour obtenir des résultats éloquents sur les appels de vos pages WWW les statistiques sont nécessaires qui vous décodent les accès d'après des critères déterminés. Ainsi il y a des statistiques qui dressent la liste des fichiers appelés le plus souvent, à quel moment de la journée il y a le plus de visiteurs, ou quels sont les navigateurs WWW utilisés le plus souvent.

Chez les meilleurs fournisseurs d'accès l'accès aux fichiers Log (fichiers de protocole) qui concernent votre emplacement est compris dans le service. La plupart des fournisseurs d'accès proposent aussi des services CGI à l'aide desquels vous recevez les nombres de visites préparés en statistiques d'après les différents critères.

Si votre page d'accueil se trouve chez un fournisseur d'accès écrasant les prix comme Compuserve, T-Online etc. vous ne pouviez jusqu'alors disposer de tels services. Pour obtenir dans de tels cas des statistiques d'accès exactes, vous pouvez avoir recours à un Autre page d'information service CGI public. Là vous recevez pour une redevance annuelle modeste des statistiques préparées proprement pour votre page d'accueil, et cela quelque soit votre adresse. L'inconvénient de cette solution est qu'il faut accéder au service CGI prestataire à chaque accès à votre page d'accueil.

 vers le hautvers le bas 

Fichiers Log du serveur Web

La base de toutes les statistiques sont les fichiers Log. Chaque ordinateur serveur sur Internet a de tels fichiers dans lesquels est tenu l'inventaire de tous les accès. Pour cela il y a un modèle général indiquant à quoi doivent ressembler les enregistrements qui y sont faits. D'après ce modèle, voila à quoi doit ressembler l'enregistrement:

Exemple:

ad25-175.compuserve.com - - [02/Oct/2001:23:03:49 -0500] "GET /selfhtml/index.htm HTTP/1.1" 200 1788

Explication:

Chaque ligne du fichier Log documente un accès à un fichier. Au début celui qui a appelé est mentionné. Chez la plupart des fournisseurs d'accès, les utilisateurs reçoivent lorsqu'ils se connectent à Internet un numéro de session dynamique, sous lequel il apparaît ensuite dans les fichiers Log du serveur. L'exemple montre ce genre de ligne. Les fichiers Log de projets bien visités contiennent des milliers de ce genre de ligne et peuvent rapidement devenir volumineux. La plupart du temps, des processus serveurs lancés régulièrement automatiquement, ce qu'on appelle des commandes cron assurent l'archivage régulier des fichiers Log en les vidant. Les fichiers Log s'appellent le plupart du temps access.log. L'emplacement où ces fichiers sont sauvegardés dépend de la configuration du serveur. Demandez à votre fournisseur d'accès, dans la mesure où il ne vous l'a pas mentionné!

Au début de chaque ligne figure qui a accédé. Chez la plupart des fournisseurs d'accès, les utilisateurs reçoivent lorsqu'ils se connectent à Internet une adresse IP et nominale dynamique numéro de session dynamique, sous lequel il apparaît ensuite dans les fichiers Log du serveur. Dans l'exemple d'enregistrement ci-dessus on peut reconnaître que l'utilisateur s'est connecté à Internet par CompuServe. La mention ad25-175 est une adresse attribuée de façon dynamique.

À la place des deux tirets dans l'exemple ci-dessus peuvent se trouver encore des données selon les cas. À la place du premier tiret, peut se trouver le nom sous lequel l'utilisateur a ouvert sa session (conformément aux spécifications rfc931). à la place du deuxième tiret, peut se trouver un nom d'utilisateur que l'utilisateur s'est donné lui-même.

Ce que montre ensuite l'enregistrement, c'est quand l'accès a eu lieu. Dans l'exemple c'était le 2 octobre 2001 à 23.heures 03 (et 49 secondes) et cela moins 5 heures calculé par rapport à GMT (Greenwich Meridian Time) vu par rapport à l'heure système de l'ordinateur serveur.

Ensuite suit un protocole court de la commande d'entête HTTP avec laquelle le navigateur WWW de l'utilisateur a appelé le fichier. GET est pour le faire la méthode habituelle. Le fichier auquel l'accès a eu lieu est mentionné ensuite. Dans l'exemple il s'agit du fichier /selfhtml/index.htm. C'est le nom de chemin relatif qui est affiché. Enfin la commande HTTP affiche encore la version du protocole HTTP utilisée. C'était à l'époque de l'évaluation la version 1.1.

Derrière un numéro de code suit, qui donne une information si la demande a été couronnée de succès et sinon quelle était l'erreur. Les numéros suivants sont importants ici:
200 = la demande a été couronnée de succès.
4xx, 5xx = Des erreurs sont survenues. Dans l'exemple, le fichier demandé n'existait pas. Lisez à ce sujet aussi le récapitulatif des Autre page d'information annonces d'état HTTP

Le dernier chiffre de la ligne mentionne combien d'octets de ce fichier ont été transmis au navigateur WWW demandeur. Si vous comparez le nombre d'octets avec la taille effective du fichier, vous pouvez constater si le fichier a été transmis en totalité ou si la transmission a été interrompue prématurément. Ainsi il arrive par exemple que des graphiques ne soient pas transmis en totalité, parce que l'utilisateur clique avant sur un lien à une autre page.

Outre les fichiers Log d'accès pur, la plupart des ordinateurs serveurs suivent aussi des fichiers Log d'erreurs. Ces fichiers Log s'appellent error.log. Les fichiers sont construits de façon analoque au fichir Log d'accès. L'exemple qui suit montre une ligne typique d'un fichier Log d'erreurs du serveur Web Apache:

Exemple:

[Tue Oct 02 23:04:34 2001] [error] [client ad25-175.compuserve.com] File does not exist: /selfhtml/tc.htm

Explication:

Au début figure La date et l'heure au format. Dans l'exemple, il s'agit de mardi (Tue = Tuesday = mardi), le 2 octobre 2001, 23 heures 04 minutes et 34 secondes. Ce qui est placé derrière est nommé l'erreur (error) et ensuite vient le client qui l'a provoquée (par exemple le navigateur d'un visiteur de page). Le message d'erreur figure en texte clair en anglais. Dans l'exemple, l'utilisateur a essayé d'accéder à un fichier qui n'existe pas. La faute peut en revenir à un lien d'une page étrangère qui mène à cette adresse qui n'existe pas ou n'existe plus.

 vers le hautvers le bas 

Statistiques

Les fichiers Log sont normalement très grands et à peu près aussi palpitants qu'un annuaire téléphonique. Pour obtenir une vue d'ensemble qui en dit long sur les accès à vos pages, votre fournisseur d'accès doit vous proposer des statistiques. Pour cela il vous propose en règle générale pour l'Chapitre: vue d'ensemble hébergement virtuel avec domaine en propre (Virtual Hosting) un service qui peut être appelé par le navigateur Web et auquel vous n'avez accès qu'en mentionnant un nom d'utilisateur et un mot de passe. Pour l'Chapitre: vue d'ensemble Hébergement serveur avec domaine en propre ou pour l' Chapitre: vue d'ensemble Hébergement matériel serveur avec domaine en propre il se peut que vous deviez vous occuper vous même de l'installation d'un logiciel approprié de statistiques.

Les statistiques se composent d'un côté d'un logiciel qui entretient sa propre base de données à partir des fichiers Log et d'un ou plusieurs scripts CGI que vous pouvez appeler pour pouvoir visionner les statistiques dans le navigateur sous forme HTML. Il existe des statistiques orientées pur texte, et qui présentent les données dans des listes ou des tableaux, mais aussi des statistiques graphiques avec lesquelles les données sont présentées sous forme de graphiques en colonnes ou en camemberts.

Les statistiques vous représentent les accès triés d'après certains critères. Les critères suivants sont typiques:

Les statistiques restent il est vrai toujours relativement précises. La précision absolue n'est pas possible parce que finalement les statistiques se basent seulement sur les fichiers Log du serveur Web et qu'il y a beaucoup d'autres facteurs qui influencent l'appel de pages Web. Ainsi par exemple, la mémoire cache d'un navigateur Web. Selon les réglages qu'y a fait l'utilisateur, la page Web, bien qu'elle soit appelée par l'utilisateur, n'est pas "ramenée" du serveur mais du cache du navigateur, sans que le navigateur ne demande même au serveur si entre temps une version de la page Web plus récente que celle de son cache existe. Le serveur Web n'y remarque en conséquence rien du tout. Il en va de même avec les nombreux serveurs mandataires (proxy) sur le réseau. Beaucoup d'utilisateurs ont réglé volontairement ou sur demande de leur fournisseur d'accès un serveur Proxy dans leur navigateur. Les serveurs mandataires sont pour l'accès Internet de l'utilisateur, particulièrement facile à atteindre et sans détours, et la transmission de données de là au navigateur de l'utilisateur est sensiblement plus rapide que si elles étaient transmises du serveur d'origine. Quand votre projet Web est disponible sur un tel serveur proxy (et oui, votre projet Web est automatiquement complètement "chapardé" par de tels serveurs proxy pour être mis à disposition - ce qui est tout à fait normal sur Internet), l'effet est le même que pour le cache du navigateur: le serveur Web de votre projet n'y remarque rien du tout. D'autre part, beaucoup d'enregistrements sont créés dans les fichiers Log du serveur Web qui ne proviennent même pas de visiteurs humains. Les robots de recherche des moteurs de recherche qui indexent vos pages ou des agents logiciels de serveurs proxy qui transmettent vos pages au serveur proxy - tous créent du "trafic", donc du passage sur vos pages, sans qu'un humain n'y puisse mais.

 vers le hautvers le bas 

Exploiter les statistiques

La liste de vérification suivante doit vous aider à interpréter les statistiques et à en tirer les conclusions:

 vers le hautvers le bas 

Terminologie comme requête de fichier, pages vues et visites

Les statistiques, c'est bien connu, sont élastiques. Cela dépend toujours de ce qui est compté. C'est pourquoi il est important qu'existent des conventions sur ce que signifient les termes typiques. Car quand un accès est-il un accès? Dès que le serveur Web reçoit la requête GET du client ou bien après qu'il a transmis la page Web requise au client appelant, donc au navigateur de l'utilisateur? Avec ou sans les fichiers qui y sont référencés tels les graphiques, les sons etc...?

Chaque ligne dans le fichier Access-Log du serveur Web crée ce qu'on appelle une requête de fichier (hit). Quand donc par exemple, une page Web comprend par exemple une page HTML et 10 graphiques qui y sont référencés, alors cette page Web crée, quand un utilisateur l'appelle, 11 requêtes de fichier. Peu importe ici que les fichiers aient été transmis complètement ou non. Même les fichiers non trouvés (erreurs 404) sont comptés comme requêtes de page. Les requêtes de fichier donnent donc des chiffres élevés et impressionnants qui se relativisent très vite quand on prend conscience que beaucoup de pages Web typiques contiennent une multitude de petits graphiques référencés. Par ailleurs, les requêtes de fichier ne permettent pas de savoir si le visiteur a vu la page. Ne vous laissez pas impressionner par les gens qui crânent avec leurs requêtes de fichiers. Pour juger du succès effectif d'une page Web, les requêtes de fichier ne sont pas appropriées. Les requêtes de ficher ne sont intéressantes que pour des comparaisons relatives, par exemple pour établir comment la fréquentation totale des pages Web se développe au fil des mois.

Les pages vues (Pageviews) - appelées depuis peu aussi Page-Impressions, ou aussi pages HTML ou bien demandes de pages - sont par contre des "contacts visuels d'un utilisateur avec des fichiers au contenu significatif". Les accès d'utilisateurs qui ont désactivé l'affichage de graphiques dans leur navigateur, de même que les accès de robots de recherche et autres agents logiciels ne sont pas comptés quand ils sont reconnus. Lors de l'utilisation de Chapitre: vue d'ensemble cadres n'est comptabilisé au premier appel que le fichier qui contient les définitions de cadres. Ensuite, on part du principe que seule une des fenêtres cadres héberge le contenu, tandis que les autres servent à la navigation, à la publicité ou autres choses similaires. L'unité de mesure ainsi définie est l'ordre de grandeur du groupement d'information pour l'impact des médias publicitaires (IAB - voir Page en langue française http://www.iabfrance.com/home/home.asp). Les pages vues ou Page-Impressions sont pour cette raison la base quand par exemple vous proposez à titre onéreux la pose de bannières publicitaires sur vos pages. Cette unité de mesure n'est cependant pas non plus tout à fait sans problème. Tout d'abord les types de fichiers déclarés comme significatifs peuvent varier. Ce peut être, suivant les réglages, des fichiers HTML statiques, des fichiers PHP ou ASP, des fichiers texte, des fichiers XML ou aussi des scripts CGI. Un fichier HTML peut être significatif mais peut aussi ne pas l'être (par exemple parce qu'il ne contient que des liens à des sous-pages, ne représente qu'un ré-acheminement ou ne contient qu'une intro Flash incorporée). Les fichiers HTML avec Includes (SSI, PHP, ASP) peuvent regrouper les contenus de plusieurs sources sur une page. D'autres formules nécessitent pour l'affichage du même contenu plusieurs fichiers HTML ou scripts.

Les visites (Visits)- également appelées Sessions - ne comptabilisent pas les pages appelées mais les adresses IP des visiteurs. Un utilisateur qui navigue courageusement pendant une heure sur votre offre de pages Web, qui sans interruption clique à gauche et à droite avec la même connexion à Internet génère ensuite exactement une visite. Il en va de même pour l'utilisateur qui appelle le page d'accueil pour disparaître aussitôt. Par convention de la branche publicitaire allemande, une visite est considérée comme terminée quand pendant 30 minutes aucun nouvel accès n'a lieu. Quand donc l'utilisateur, pendant que vos pages sont affichées sur son navigateur part faire une longue pause déjeuner ou bien s'endort et qu'après deux heures seulement clique sur un lien de votre offre, alors ce clic comptera comme une nouvelle visite.

 vers le hautvers le bas 

Évaluer l'avis des utilisateurs

Les statistiques ne vous diront pas comment vos pages Web sont perçues par les visiteurs, mais vous l'apprendrez par exemple aussi par des courriels que vous recevez des utilisateurs ou par les inscriptions dans le livre de visites que vous proposez sur vos pages Web. Il est conseillé de rassembler tous les avis reçus sous une forme quelconque et d'intégrer à l'offre les propositions d'amélioration, les corrections etc....

Peu d'écho des utilisateurs malgré de bons chiffres d'accès n'impliquent pas nécessairement une notion négative. Une offre bien structurée et correspondant aux attentes des utilisateurs est utilisée avec reconnaissance sans que les utilisateurs pensent pour autant à vous écrire des courriels enthousiastes. Vous recevez plutôt un écho explicite quand votre offre sort de son cadre pour quelque raison que ce soit: La raison peut en être que les utilisateurs sont déçus parce que l'offre ne correspond pas à ce qu'ils espéraient, ou que les utilisateurs sont dépassés parce que l'offre dépasse de loin leurs attentes et leur ouvre des perspectives tout à fait nouvelles.

Une raison possible d'un écho accru des utilisateurs peut concerner les particularités techniques de vos pages. Si par exemple votre navigation ne fonctionne qu'avec JavaScript activé et uniquement avec le dernier Explorer Internet de Microsoft, alors vous recevrez et c'est normal, quelques réactions irritées d'utilisateurs, chez lesquels ces conditions ne sont pas remplies. Il en va de même pour les pages qui imposent certaines résolutions d'écran, qui énervent l'utilisateur par des "propriétés" telle que la neutralisation de la touche droite de la souris ou autres choses du même genre. À l'inverse il peut arriver aussi que des utilisateurs se manifestent parce que votre mise en page est exceptionnellement bonne, ou parce que certaines propriétés techniques qu'ils n'avaient vu nulle part ailleurs ont éveillé leur intérêt. Des avis négatifs sur la technique de vos pages sont à prendre en tout cas au sérieux, tout au moins quand ils vous parviennent incessamment de plusieurs côtés à la fois.

Quand vous transmettez de pures informations, vous recevrez également des questions spécialisées d'utilisateurs. Comment vous vous en tirez, c'est votre problème. En tous cas, vous pouvez considérer ce genre d'avis comme un indice indiquant que votre offre est utilisée, que les informations sont lues, et que les utilisateurs vous tiennent pour compétent dans le domaine.

Au plus tard quand vous recevez un écho régulier des mêmes utilisateurs, vous avez des "fans". Si vous n'aviez jusque là qu'une pure offre informative sur vos pages, vous devez réfléchir si l'offre ne pourrait pas être beaucoup plus attrayante en offrant des possibilités de communication comme un forum Web ou un espace de clavardage. Avec un peu d'engagement personnel, vous pouvez arriver à ce que par votre projet Web naisse une véritable communauté en ligne - ce qui est le rêve de nombreux fournisseurs Web.

 vers le haut
page suivante Autre page d'information Changer de fournisseur d'accès avec les projets Web
page précé?dente Autre page d'information Faire connaître des projets Web
 

© 2001 Stefan Münz / © 2003 Traduction Adresse électronique Serge François, 13405@free.fr
Adresse électronique selfhtml@fr.selfhtml.org