Valid XHTML 1.0!                  

 

  Projet de programmation
  en Licence Informatique
  année 2008/2009
 
      Analyse syntaxique du contenu d'une ou de plusieurs pages Web

 

Présentation du projet

Le but du projet est de permettre à un utilisateur quelconque de savoir ce que contient le code-source de la page en termes d'éléments, d'attributs, de structure... sans avoir à consulter le code-source. La page de départ sera un formulaire pour récupérer une adresse, une liste d'adresse ou un fichier contenant une liste d'adresses. On pourra aussi prévoir d'analyser les n premières réponses de Google pour une recherche donnée. L'analyse de la page ou des pages proposées fournira ensuite des comptages

-     pour la partie head (mots-clés, fichiers de style, fichiers de scripts)
-     pour la partie body (nombre de paragraphes, de tableaux, de styles, de liens...)

Ce projet consiste donc à réaliser l'étude statistique des composants syntaxiques de la page. Cela permettra de voir quelles grammaires sont vraiment utilisées, si les éléments div ont bien supplanté les tableaux, si les styles sont bien présents...

On pourra au passage "s'amuser" à tester si les pages correspondants aux adresses sont valides, si les styles CSS le sont aussi, si les liens présents sont encore existants, etc.

En particulier, on analysera les URL suivantes :

Afin de ne pas se "noyer" dans les éléments à analyser, les étudiants doivent contacter l'enseignant responsable dès le tout début du stage afin de mettre en place un cahier prévisionnel du déroulement du stage.

 

 

retour gH    Retour à la page principale de   (gH)