Valid XHTML 1.0!                  

 

  Projet de programmation
  en Licence professionnelle
  année 2005/2006, série 2 :
 
    Statistiques élémentaires et graphiques
    sur fichier DBASE en PHP

 

Présentation du projet


 

Résumé :
 
Ce qui gène les non-statisticien(ne)s lorsqu'ils ou elles ont à réaliser une étude statistique, ce sont les calculs mathématiques et les manipulations informatiques. Le but du projet est de réaliser automatiquement en PHP tous les calculs statistiques de base (tris à plat, tris croisés...), moyenne, écart-type... d'un fichier de données fourni au format DBASE (intégrité et typage oblige) avec son descriptif et de doubler ces calculs de graphiques de façon à pouvoir se focaliser sur l'analyse des résultats.

Détail du projet:

Une table (ou "base") de données DBASE est un fichier d'extension .DBF tabulé en colonnes typées et décrit par le format libre nommé aujourd"hui XBASE. PHP sait bien sur lire ces fichiers (voir la documentation locale).

Le but de ce projet est de réaliser en PHP des statistiques élémentaires et les graphiques associés sur des données stockées dans un fichier DBASE via un panneau de saisie pour des données qualitatives (QL) ou quantitatives (QT) qu'on traitera comme des variables. L'interface de base devra ressembler aux panneaux de classification et d'identification en ligne déja disponibles sur les pages (gH) pour la mise à disposition de jeux d'essais :

classification dont le texte est ici
identification dont le texte est ici
Cette interface fournira 6 jeux d'essais à savoir : Vins, Elf, Iris, Pbio, Antal et Olympic.

L'utilisateur pourra soit choisir un jeu de ces jeux d'essai soit faire télécharger par le serveur Web deux fichiers :

- le fichier DBF des données
- le fichier DDV de description des données

Le script PHP vérifiera ensuite la cohérence des données et du descriptif : il devra s'agir d'un tableau rectangulaire (toutes les variables doivent avoir le même nombre de valeurs) sans ligne vide. Si ce n'est pas le cas, le script devra signaler l'endroit où il y a l'erreur. Pour les QL, on signalera aussi les dépassements de modalité.

S'il n'y a pas d'erreur dans ces deux fichiers, la machine effectuera tous les calculs et proposera une table des matières en début de page pour aller rapidement à chaque résultat. Les calculs statistiques classiques pour les QT seront présentés triés. Pour tris à plat des variables QL, on effectuera un affichage à raison d'une variable par ligne, les lignes étant triées par mode décroissant, chaque ligne fournissant les modalités par fréquence décroissante. On fera systématiquement tous les tris croisés. Les calculs QT seront doublés de tracés de droites, les tris à plat et croisés d'histogrammes.

Les graphiques seront tous réalisés à l'aide de jpgraph comme ma fonction phistopct

Fichiers de données pour jeux d'essais


 
*.dbf

Les noms cités (vins, elf, iris...) font référence à des fichiers de données réels présentés ici. Le lien fournit une archive des fichiers DBF correspondant.

*.ddv
Le lien fournit une archive des fichiers DDV associés aux fichiers DBF précédents. Tous les fichiers ne sont pas décrits, la syntaxe n'est peut-être pas homogène et cohérente. On décrira dans la documentation du projet une syntaxe cohérente de ces fichiers et on les modifiera en conséquence.

Exemples de résultats et sorties

- tri à plat, tri croisé et chi2

- étude complète en .XLS

- étude complète en .RTF

- exemple de critiques pour des études incomplètes

 

retour gH    Retour à la page principale de   (gH)