Présentation du projet
Résumé :
Ce qui gène les non-statisticien(ne)s lorsqu'ils ou elles ont à réaliser une étude statistique, ce sont les calculs mathématiques et les manipulations informatiques. Le but du projet est de réaliser automatiquement en PHP tous les calculs statistiques de base (tris à plat, tris croisés...), moyenne, écart-type... d'un fichier de données fourni au format DBASE (intégrité et typage oblige) avec son descriptif et de doubler ces calculs de graphiques de façon à pouvoir se focaliser sur l'analyse des résultats.Détail du projet:
Une table (ou "base") de données DBASE est un fichier d'extension .DBF tabulé en colonnes typées et décrit par le format libre nommé aujourd"hui XBASE. PHP sait bien sur lire ces fichiers (voir la documentation locale).
Le but de ce projet est de réaliser en PHP des statistiques élémentaires et les graphiques associés sur des données stockées dans un fichier DBASE via un panneau de saisie pour des données qualitatives (QL) ou quantitatives (QT) qu'on traitera comme des variables. L'interface de base devra ressembler aux panneaux de classification et d'identification en ligne déja disponibles sur les pages (gH) pour la mise à disposition de jeux d'essais :
Cette interface fournira 6 jeux d'essais à savoir : Vins, Elf, Iris, Pbio, Antal et Olympic.
classification dont le texte est ici identification dont le texte est ici L'utilisateur pourra soit choisir un jeu de ces jeux d'essai soit faire télécharger par le serveur Web deux fichiers :
- le fichier DBF des données - le fichier DDV de description des données Le script PHP vérifiera ensuite la cohérence des données et du descriptif : il devra s'agir d'un tableau rectangulaire (toutes les variables doivent avoir le même nombre de valeurs) sans ligne vide. Si ce n'est pas le cas, le script devra signaler l'endroit où il y a l'erreur. Pour les QL, on signalera aussi les dépassements de modalité.
S'il n'y a pas d'erreur dans ces deux fichiers, la machine effectuera tous les calculs et proposera une table des matières en début de page pour aller rapidement à chaque résultat. Les calculs statistiques classiques pour les QT seront présentés triés. Pour tris à plat des variables QL, on effectuera un affichage à raison d'une variable par ligne, les lignes étant triées par mode décroissant, chaque ligne fournissant les modalités par fréquence décroissante. On fera systématiquement tous les tris croisés. Les calculs QT seront doublés de tracés de droites, les tris à plat et croisés d'histogrammes.
Les graphiques seront tous réalisés à l'aide de jpgraph comme ma fonction phistopct
Fichiers de données pour jeux d'essais
*.dbf *.ddvLes noms cités (vins, elf, iris...) font référence à des fichiers de données réels présentés ici. Le lien fournit une archive des fichiers DBF correspondant.
Le lien fournit une archive des fichiers DDV associés aux fichiers DBF précédents. Tous les fichiers ne sont pas décrits, la syntaxe n'est peut-être pas homogène et cohérente. On décrira dans la documentation du projet une syntaxe cohérente de ces fichiers et on les modifiera en conséquence.Exemples de résultats et sorties
Retour à la page principale de (gH)