Commentaires sur les descriptifs
des analyses statistiques en MSE
pour l'année 2005
(gH) gilles.hunault@univ-angers.fr
Les notes et commentaires qui suivent font référence aux fichiers reçus
via la procédure officielle de la page :http://www.info.univ-angers.fr/pub/gh/wstat/chklprojmse.php
avec récupération automatique des mails et décompression automatique des fichier .zip envoyés.
Dossier BYRM 11 / 20 ============= fichier descriptif : - "cinq modalités peuvent ètre constituées dont les dénominations et les bornes sont indiquées ci-après :" ceci est insuffisant : vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). fichier excel : - "la population des départements présente une variation normale" le terme "normale" est ambigu à cause de la loi normale. vous voulez sans doute dire pas trop fluctuant ? - en principe vous devez commencer les commentaires sur les QT après le tableau trié par ordre décroissant de coefficient de variation et surtout vous devez commenter les variables suivant cet ordre décroissant. - "les coefficients de variation supérieure" : orthographe ! - pourquoi mettre une zone de commentaire vide après la matrice des corrélations ? - commentaire sur la corrélation qtdm/qdmeda : il faut d'abord parler de la liaison. ensuite peut-être vous pouvez dire "Peu de départements n’ont plus recours à la mise en décharge." à condition de relier cette phrase à l'équation. idem pour "Les principales destinations de traitement des déchets en France sont l’incinération avec récupération d’énergie et la mise en décharge autorisée. Toute fois encore de nombreux départements font de l’incénération sans récupération d’énergie." ; quel rapport avec R2 = 0.4264 ? départemnts : orthographe ! pour "La valorisation biologique (fabrication de compost) des déchets ne se pratique pas dans la majorité des départemnts" c'est incompréhensible. j'aurais plutot dit plus y'a de qtdm plus y'a de qdcomp comme le montre le graphique, ce qui s'interpéterait comme l'inverse de votre phrase ???? - encore une zone de commentaire vide pour la corrélation nbhab/qdtri onglet tri à plat : pour "Cliren, nous avons une répartition dans l’incinération des déchets avec récupération d’énergie sur toutes les classes en décroissance de «nul à très élevé»" il doit manquer une partie d'explication car on a toujours une répartition, quoiqu'il arrive... vous devez rédiger les commentaires sur les QL par ordre décroissant de mode en suivant le tableau récapitulatif des QL ! les tris à plat pour "Valorisation biologique (compost)" et "Mise en décharge autorisée (> 3000 tonnes/an)" sont très différents. ce serait à commenter... il n'y a aucune rédaction sur le choix des tris croisés, sur la méthode du calcul du pourcentage (par rapport au total, à la ligne, la colonne) ni sur les conclusions qu'on en tire. il n'y a pas de conclusion mais seulement un onglet "conclusion" vide et d'ailleurs mal placé (en dernier ou avant-dernier juste avant "auteurs" serait mieux). - onglet aide : que fait-il encore là, celui-là ? - à quoi sert l'onglet "Etabl classes" ? si vous vous en servez, il faut le dire et indiquer comment on l'utilise.
Dossier CF 13 / 20 ============= fichier descriptif : - " On a défini des classes...afin de clarifier les résultats" : c'est surtout qu'on ne sait pas comment traiter l'IMC qui n'est ni une QT ni une QL. - "Les effectifs ont également été réduits à 99 personnes" : pourquoi ? - "cespatients" : il manque un espace ! - déjà signalé : LDL et HDL sont-elles des QT ? prouvez-le ! - pour les classes, CLAGE, CLIMC, CLALC et CLCHOL vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). fichier word : - "cette petite partie d'étude porte sur un effectif de 91 personnes, elle rentre donc dans la loi des grands nombres." : c'est maladroit car la loi des grands nombres est un théorème mathématique qui dit que pour n>50... ici vous n'utilisez pas ce théorème. dites plutot que c'est un effectif suffisant pour... - remettre le descriptif dans le fichier aurait permis d'avoir un tout cohérent. - bonne rédaction de l'analyse des QT en mode univarié - "Il y a donc covariance entre" non ! c'est corrélation. voir mes formules de cours. - "TABAC montre que"... dites plutot le tri à plat de la variable tabac... - "..une très faible majorité des personnes interrogées sont non fumeurs ; Il y a quasi-équirépartition." --> je ne suis pas d'accord car fumeurs et ex-fumeurs sont séparés... à revoir à mon avis. - variable sexe : "ce n'est pas une variable intéressante pour les tris croisés car on obtiendra à peu près toujours une majorité d'hommes." pas si sur que cela après tout le mode n'est que de 74 % ; idem pour CLCHOL. - "Petite majorité de gens obèses" vous faites de la politique ? 46 % < 50 % ! - "Le taux de fumeurs se situe en-dessous (29 %) et est inférieur à la moyenne nationale en 1990 qui était de 35 % environ." je serais curieux de savoir comment est calculée cette moyenne : on y inclut les enfants de moins de 5 ans ? de moins de 15 ans ? - bonne analyse des tris à plat - travail de qualité, surtout continuez avec les tris croisés et une conclusion générale. ne perdez pas de vue le titre "apnée du sommeil...."
Dossier DSGM : 02 / 20 ============= fichier descriptif : - Qu'est-ce qu'une infraction économique et financière ? - Quelle différence entre crime et délit ? La phrase "Les crimes sont jugés par la cour d'assises alors que les délits sont jugés par la loi" me parait louche : la cour d'assises, ce n'est pas la loi ? - De quel autres délits peut-il s'agir ? - Il serait intéressant de rajouter une variable SUPerficie du département et une variable POPulation du département. fichier word ou excel : aucune analyse fournie.
Dossier EG : 05 / 20 ============= fichier descriptif : - "dans le bouquin" registre de langue populaire, mettez le terme livre ou ouvrage. - "Les 10 espèces restant n'ayant pas les données requises pour notre étude." mal dit : expliciter ce qui ne va pas. - "VOIN : le volume d'eau minimal en litre nécessaire à la reproduction de l'espèce en aquarium." comment a-t-il été déterminé ? - "NORA : le nombre de rayures sur le corps des individus." quel intérêt ? (je ne suis pas ichtyologue !). - un "bon comportement" aux autres est d'être indifférent ? hum !! - "des poissons plus grand" : orthographe ! "il est intéressent" : idem. - "La séparation en 3 classes par la méthode de la moyenne (borne à moyenne - écartype, moyenne et moyenne plus écartype) n'étant pas satisfaisante." je veux bien, expliquez moi pourquoi. idem pour VOIN. - "Le volume d'eau peut.. être séparer" : orthographe ! fichier excel: - il n'y a que les données ?
Dossier HL : 02 / 20 ============= fichier descriptif : - le texte "les données sont correctes par rapport aux contraintes" est mal placé et n'a pas à être mis dans le descriptif. - "Le sexe de la personne (femme ou homme) intervient aussi." ce n'est pas correct rédigé ainsi. dites "la variable sexe est codée..." - "il en résulte une CIMC qui signifie Catégorie d'IMC" vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). - "HTA est bien évidemment l'Hypertension artérielle" cela ne dit pas comment est stockée la variable, quels sont ses unités ou ses codes. on ne peut donc savoir si c'est une QT ou une QL. - "on peut que l'alcool" : il manque des mots ? - CHOL, HDL et LDL sont-elles des QT ? - "Diffétrents codes sont utilisés :" quelle orthographe ! - "ON PEUT LES RAPPELER :" Non ! rappeler signifie qu'on les aurait déjà vus avant. quelqu'un qui lirait votre descriptif pour la première fois ne comprendrait rien à votre étude... fichier word ou excel : aucune analyse fournie.
Dossier LMCAN 09 / 20 ============= fichier descriptif : - aucun descriptif (fichier .dsc) fourni. fichier excel : - onglet titre : il n'y a pas de nom d'auteur ; si on fait fichier/propriétés, l'auteur est... gilles hunault ! - onglet données : il est mal placé ; après l'onglet descriptif, ce serait mieux. - onglet descriptif : pourquoi marquer "Ce dossier traite...Lefort Marie-Caroline ?" - "des informations supplémentaires", "d'autres données ont été recueillies" et "ensuite des données ont été recueillies" : cette rédaction est trop vague : quelles données (colonnes ? lignes ?) ont été retenues ? et pourquoi ? - vous dites qu'il y avait au départ 172 pays et que vous avez rajouté des données et qu'on arrive à 60 pays, c'est curieux. - parmi ces variables qualitatives certaines étaient exprimées en pourcentage : donc ce n'étaient pas des QL, alors. Votre rédaction est incorrecte. - si vous faite des classes à partir de taux, de pourcentages, vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). - LE PRODUIT NATIONAL BRUTE : pas de E, ce n'est pas une brute ! - onglet : tris à plat et tris croisés ; "la modalité" n'est pas un bon nom de colonne pour le "Tableau récapitulatif des tris à plat" : la plus forte modalité est en fait nommée "le mode". - pourquoi fournir 15 graphiques séparés ? c'est beaucoup et en plus ils sont mal placés : pour enfin savoir de quoi il s'agit il faut lire les commentaires après ces 15 graphiques. - onglet statistiques, corrélations, etc. : il y a beaucoup trop de décimales. des rho avec deux chiffres après la virgule seraient bien plus lisibles. - onglet COMMENTAIRE DES QT : bonne rédaction, mais attention à l'orthographe : " il atteind" est incorrect. vous ne pouvez pas "expliquer" la grandeur dur CDV en citant les extremes car cela ne prouve rien. vos textes sont très mal écrits : utilisez une zone de texte ou un commentaire. "Etant donné que tout est relatif au CDV , nous allons donc uniquement commenter cette valeur." cela veut dire quoi puisque vous commentez tout... là encore "Ceci est confirmé" est faux : prenez 1 millions de personnes avec la valeur 10, mettez une personne à 100 000 et une à -100 000 vous aurez un min et un max très éloigné mais pas de fort cdv. "font parti" : orthographe ! sur les corrélations : pourriez-vous essayer de rédiger quelquechose par rapport aux équations ? - onglet auteur = gh : que fait-il encore là, celui-là ? - onglet aide : que fait-il encore là, celui-là ? - commentaires sur les QL : vous devez commenter dans l'ordre décroissant de mode, c'est l'ordre fourni par le tableau récapitulatif des tris à plat. il n'y a aucune rédaction sur le choix des tris croisés, sur la méthode du calcul du pourcentage (par rapport au total, à la ligne, la colonne) ni sur les conclusions qu'on en tire. - il n'y a pas de conclusion globale sur l'ensemble de l'étude.
Dossier LMPA : 03 / 20 ============= fichier descriptif : - "VOIN : le volume d'eau minimal en litre nécessaire à la reproduction de l'espèce en aquarium." comment a-t-il été déterminé ? - "NORA : le nombre de rayures sur le corps des individus." quel intérêt ? (je ne suis pas ichtyologue !). - un "bon comportement" aux autres est d'être indifférent ? hum !! - "ORGE: Origine géographique (variable QL):" à la bibliothèque on trouve 1 : Amérique, 2 : Afrique, 3 : Asie. Vous devriez faire des classes pourTAMO, VOIN et NORA. Vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). fichier word ou excel : aucune analyse fournie.
Dossier MA : 12 / 20 ============= fichier descriptif : - vous ne semblez pas connaitre le nom commun de "Abramis bjrkna" ; après recherche sur le site du NCBI il s'agit sans doute de "Abramis bjoerkna" qui comme chacun sait est "la brème bordelière". regardez par exemple : http://www.jcpoiret.com/bapw/poissons/breme.htm - comme je ne suis pas ichtyologue expliquez pourquoi le sexe n'a pas pu être déterminé. - vous utilisez des classe pour les indices et taux sans indiquer comment les classes sont déterminées. Vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). - faites ressortir clairement les variables que vous avez trouvées sur le site et celles que vous avez constituées ensuite. fichier excel : - votre classeur comporte des liaisons avec un autre classeur sur votre ordinateur à vous (fichier "Tris à plat.xls") ???? Menu Edition / liaisons. cela s'affiche dès qu'on ouvre le fichier. - onglet titre : mettez votre nom ! - onglet "Analyse des QT" : bon travail avec comparaison par groupe. - l'onglet "Feuill2" est mal nommé. - je ne vois aucun commentaire sur les corrélations qui sont pourtant flagrantes ? - tris à plat : il vous manque un le tableau récapitulatif des QL trié par mode décroissant. vous devez ensuite rédiger les commentaires sur les QL dans l'ordre des modes décroissant en suivant ce tableau récapitulatif. - il n'y a aucune rédaction sur le choix des tris croisés, sur la méthode du calcul du pourcentage (par rapport au total, à la ligne, la colonne) ni sur les conclusions qu'on en tire. - bon travail pour l'instant, continuez !
Dossier MCAH : 01 / 20 ============= fichier descriptif : - l'espérance de vie est-elle une QT ? - "Pour les 5 variables qualitatives, des classes ont été créées", où, comment et avec quels codes ? ceci est insuffisant : vous devez indiquer comment vous choisissez le nombre de classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.). fichier word ou excel : aucune analyse fournie.
Dossier PM : 03 / 20 ============= fichier descriptif : C'est sans doute évident, mais qui sont Secondi, Bretagnolle, Compagnon et Faivre ? des enseignants, des chercheurs, des journalistes ? Les données ont été trouvées sur le net, envoyées par les auteurs ? Qu'est-ce que la zone d’hybridation ? Mettez vos noms de variables en français. "Après analyses génétiques, le sexe de chaque passereau est déterminé". Il faut plusieurs analyses génétiques (d'où les S) ou une seule ? Pour moi qui suis novice : le sexe de ces oiseaux est donc si difficile à déterminer (expliquez-moi...). Que voulez-vous faire avec la date ? ce n'est sans doute pas une QT. Pour que ce soit une QL il faut indiquer comment elle est codée. Pourquoi une variable Bill, une variable Bill + Head mais pas de variable Head ? C'est sans doute ornithologiquement cohérent mais j'aimerais qu'on me l'explique. C'est quoi le tarse pour un oiseau ? fichier word ou excel : aucune analyse fournie.