Commentaires sur les descriptifs
  des analyses statistiques en MSE
  pour l'année 2005
 

     (gH) gilles.hunault@univ-angers.fr  

 

Les notes et commentaires qui suivent font référence aux fichiers reçus
via la procédure officielle de la page :

     http://www.info.univ-angers.fr/pub/gh/wstat/chklprojmse.php

avec récupération automatique des mails et décompression automatique des fichier .zip envoyés.

 


Dossier BYRM 11 / 20
=============



fichier descriptif :

 - "cinq modalités peuvent ètre constituées dont les dénominations et les bornes
    sont indiquées ci-après :" ceci est insuffisant : vous devez indiquer
    comment vous choisissez le nombre de classes et les bornes (cf. le cours avec
    m-sigma, les quartiles etc.).

fichier excel :

 - "la population des départements présente une variation normale" le
   terme "normale" est ambigu à cause de la loi normale. vous voulez
   sans doute dire pas trop fluctuant ?

 - en principe vous devez commencer les commentaires sur les QT après
   le tableau trié par ordre décroissant de coefficient de variation
   et surtout vous devez commenter les variables suivant cet ordre
   décroissant.

 - "les coefficients de variation supérieure" : orthographe !

 - pourquoi mettre une zone de commentaire vide après la matrice des
   corrélations ?

 - commentaire sur la corrélation qtdm/qdmeda : il faut d'abord parler de
   la liaison. ensuite peut-être vous pouvez dire "Peu de départements n’ont plus
   recours à la mise en décharge." à condition de relier cette phrase à l'équation.

   idem pour "Les principales destinations de traitement des déchets en France
   sont l’incinération avec récupération d’énergie et la mise en décharge
   autorisée. Toute fois encore de nombreux départements font de l’incénération
   sans récupération d’énergie." ; quel rapport avec R2 = 0.4264 ?

départemnts : orthographe !

   pour "La valorisation biologique (fabrication de compost) des déchets ne se
   pratique pas dans la majorité des départemnts" c'est incompréhensible. j'aurais
   plutot dit plus y'a de qtdm plus y'a de qdcomp comme le montre le graphique, ce
   qui s'interpéterait comme l'inverse de votre phrase ????

 - encore une zone de commentaire vide pour la corrélation nbhab/qdtri

onglet tri à plat : pour "Cliren, nous avons une répartition dans l’incinération des
déchets avec récupération d’énergie sur toutes les classes en décroissance de 
«nul à très élevé»" il doit manquer une partie d'explication car on a toujours une
répartition, quoiqu'il arrive...


vous devez rédiger les commentaires sur les QL par ordre décroissant de mode
en suivant le tableau récapitulatif des QL !

les tris à plat pour "Valorisation biologique (compost)" et "Mise en décharge
autorisée (> 3000 tonnes/an)" sont très différents. ce serait à commenter...

  il n'y a aucune rédaction sur le choix des tris croisés, sur la méthode du calcul
  du pourcentage (par rapport au total, à la ligne, la colonne) ni sur les
  conclusions qu'on en tire.

il n'y a pas de conclusion mais seulement un onglet "conclusion" vide et d'ailleurs
mal placé (en dernier ou avant-dernier juste avant "auteurs" serait mieux).

- onglet aide : que fait-il encore là, celui-là ?

- à quoi sert l'onglet "Etabl classes" ? si vous vous en servez, il faut le
  dire et indiquer comment on l'utilise.

 


Dossier CF 13 / 20
=============



fichier descriptif :

 - " On a défini des classes...afin de clarifier les résultats" : c'est surtout
   qu'on ne sait pas comment traiter l'IMC qui n'est ni une QT ni une QL.

- "Les effectifs ont également été réduits à 99 personnes" : pourquoi ?

- "cespatients" : il manque un espace !

- déjà signalé : LDL et  HDL sont-elles des QT ? prouvez-le !

- pour les classes, CLAGE, CLIMC, CLALC et CLCHOL vous devez indiquer
  comment vous choisissez le nombre de classes et les bornes (cf. le cours avec
  m-sigma, les quartiles etc.).

fichier word :

- "cette petite partie d'étude porte sur un effectif de 91 personnes,
  elle rentre donc dans la loi des grands nombres." : c'est maladroit car la
  loi des grands nombres est un théorème mathématique qui dit que pour n>50...
  ici vous n'utilisez pas ce théorème. dites plutot que c'est un effectif
  suffisant pour...

- remettre le descriptif dans le fichier aurait permis d'avoir un tout cohérent.

- bonne rédaction de l'analyse des QT en mode univarié

- "Il y a donc covariance entre" non ! c'est corrélation. voir mes formules de cours.

- "TABAC montre que"... dites plutot le tri à plat de la variable tabac...

- "..une  très faible majorité des personnes interrogées sont non fumeurs ;
  Il y a quasi-équirépartition." --> je ne suis pas d'accord car fumeurs et
  ex-fumeurs sont séparés... à revoir à mon avis.

- variable sexe : "ce n'est pas une variable intéressante pour les tris croisés
  car on obtiendra à peu près toujours une majorité d'hommes." pas si sur que
  cela après tout le mode n'est que de 74 % ; idem pour CLCHOL.

- "Petite majorité de gens obèses" vous faites de la politique ? 46 % < 50 % !

- "Le taux de fumeurs se situe en-dessous (29 %) et est inférieur à la moyenne
  nationale en 1990 qui était de 35 % environ." je serais curieux de savoir comment
  est calculée cette moyenne : on y inclut les enfants de moins de 5 ans ?
  de moins de 15 ans ?

- bonne analyse des tris à plat

- travail de qualité, surtout continuez avec les tris croisés
  et une conclusion générale. ne perdez pas de vue le titre "apnée
  du sommeil...."

 


Dossier DSGM : 02 / 20
=============



fichier descriptif :

- Qu'est-ce qu'une infraction économique et financière ?

- Quelle différence entre crime et délit ? La phrase
  "Les crimes sont jugés par la cour d'assises alors que les délits
  sont jugés par la loi" me parait louche : la cour d'assises, ce n'est pas la loi ?

- De quel autres délits peut-il s'agir ?

- Il serait intéressant de rajouter une variable SUPerficie du département
  et une variable POPulation du département.

fichier word ou excel : aucune analyse fournie.

 


Dossier EG : 05 / 20
=============



fichier descriptif :

- "dans le bouquin" registre de langue populaire, mettez le terme
  livre ou ouvrage.

- "Les 10 espèces restant n'ayant pas les données requises pour notre étude."
  mal dit : expliciter ce qui ne va pas.

- "VOIN : le volume d'eau minimal en litre nécessaire à la reproduction
  de l'espèce en aquarium." comment a-t-il été déterminé ?

- "NORA : le nombre de rayures sur le corps des individus." quel intérêt ? (je
  ne suis pas ichtyologue !).

- un "bon comportement" aux autres est d'être indifférent ? hum !!

- "des poissons plus grand" : orthographe !
  "il est intéressent" : idem.

- "La séparation en 3 classes par la méthode de la moyenne (borne à
  moyenne - écartype, moyenne et moyenne plus écartype)
  n'étant pas satisfaisante." je veux bien, expliquez moi pourquoi.
  idem pour VOIN.

- "Le volume d'eau peut.. être séparer" : orthographe !

fichier excel:

- il n'y a que les données ?

 


Dossier HL :  02 / 20
=============



fichier descriptif :

- le texte "les données sont correctes par rapport aux contraintes"
  est mal placé et n'a pas à être mis dans le descriptif.

- "Le sexe de la personne (femme ou homme) intervient aussi." ce n'est
  pas correct rédigé ainsi. dites "la variable sexe est codée..."

- "il en résulte une  CIMC qui signifie Catégorie d'IMC" vous devez indiquer
  comment vous choisissez le nombre de classes et les bornes (cf. le cours avec
  m-sigma, les quartiles etc.).

- "HTA est bien évidemment l'Hypertension artérielle" cela ne dit pas
  comment est stockée la variable, quels sont ses unités ou ses codes.
  on ne peut donc savoir si c'est une QT ou une QL.

- "on peut que l'alcool" : il manque des mots ?

- CHOL, HDL et LDL sont-elles des QT ?

- "Diffétrents codes sont utilisés :"  quelle orthographe !

- "ON PEUT LES RAPPELER :" Non ! rappeler signifie qu'on les aurait
  déjà vus avant. quelqu'un qui lirait votre descriptif pour la première
  fois ne comprendrait rien à votre étude...

fichier word ou excel : aucune analyse fournie.

 


Dossier LMCAN  09 / 20
=============



fichier descriptif :

- aucun descriptif (fichier .dsc) fourni.

fichier excel :

- onglet titre : il n'y a pas de nom d'auteur ; si on fait fichier/propriétés,
  l'auteur est... gilles hunault !

- onglet données : il est mal placé ; après l'onglet descriptif, ce
  serait mieux.

- onglet descriptif : pourquoi marquer "Ce dossier traite...Lefort Marie-Caroline ?"

- "des informations supplémentaires", "d'autres données ont été recueillies" et
  "ensuite des données ont été recueillies" : cette rédaction est trop
  vague : quelles données (colonnes ? lignes ?) ont été retenues ? et pourquoi ?

- vous dites qu'il y avait au départ 172 pays et que vous avez rajouté des données
  et qu'on arrive à 60 pays, c'est curieux.

- parmi ces variables qualitatives certaines étaient exprimées en pourcentage :
  donc ce n'étaient pas des QL, alors. Votre rédaction est incorrecte.

- si vous faite des classes à partir de taux, de pourcentages, vous devez indiquer
  comment vous choisissez le nombre de classes et les bornes (cf. le cours avec
  m-sigma, les quartiles etc.).

- LE PRODUIT NATIONAL BRUTE : pas de E, ce n'est pas une brute !

- onglet : tris à plat et tris croisés ; "la modalité" n'est pas un
  bon nom de colonne pour le "Tableau récapitulatif des tris à plat" :
  la plus forte modalité est en fait nommée "le mode".

- pourquoi fournir 15 graphiques séparés ? c'est beaucoup et en plus ils
  sont mal placés : pour enfin savoir de quoi il s'agit il faut lire
  les commentaires après ces 15 graphiques.

- onglet statistiques, corrélations, etc. : il y a beaucoup trop de décimales.
  des rho avec deux chiffres après la virgule seraient bien plus lisibles.

- onglet COMMENTAIRE DES QT :

  bonne rédaction, mais attention à l'orthographe : " il atteind" est incorrect.

  vous ne pouvez pas "expliquer" la grandeur dur CDV en citant les extremes car
  cela ne prouve rien.

  vos textes sont très mal écrits : utilisez une zone de texte ou un commentaire.

  "Etant donné que tout est relatif au CDV , nous allons donc uniquement commenter cette valeur."
  cela veut dire quoi puisque vous commentez tout...
  là encore "Ceci est confirmé" est faux : prenez 1 millions de personnes avec la valeur 10,
  mettez une personne à 100 000 et une à -100 000 vous aurez un min et un max très éloigné
  mais pas de fort cdv.

  "font parti" : orthographe !

  sur les corrélations : pourriez-vous essayer de rédiger quelquechose par rapport
  aux équations  ?

- onglet auteur = gh : que fait-il encore là, celui-là ?

- onglet aide : que fait-il encore là, celui-là ?

- commentaires sur les QL :

  vous devez commenter dans l'ordre décroissant de mode, c'est l'ordre fourni
  par le tableau récapitulatif des tris à plat.

  il n'y a aucune rédaction sur le choix des tris croisés, sur la méthode du calcul
  du pourcentage (par rapport au total, à la ligne, la colonne) ni sur les
  conclusions qu'on en tire.

- il n'y a pas de conclusion globale sur l'ensemble de l'étude.

 


Dossier LMPA : 03 / 20
=============



fichier descriptif :

- "VOIN : le volume d'eau minimal en litre nécessaire à la reproduction
  de l'espèce en aquarium." comment a-t-il été déterminé ?

- "NORA : le nombre de rayures sur le corps des individus." quel intérêt ? (je
  ne suis pas ichtyologue !).

- un "bon comportement" aux autres est d'être indifférent ? hum !!

- "ORGE: Origine géographique (variable QL):" à la bibliothèque on
  trouve
          1 : Amérique,
          2 : Afrique,
          3 : Asie.

Vous devriez faire des classes pourTAMO, VOIN et
NORA. Vous devez indiquer comment vous choisissez le nombre de
classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.).

fichier word ou excel : aucune analyse fournie.

 


Dossier MA : 12 / 20
=============



fichier descriptif :

- vous ne semblez pas connaitre le nom commun de "Abramis bjrkna" ;
  après recherche sur le site du NCBI il s'agit sans doute de
  "Abramis bjoerkna" qui comme chacun sait est "la brème bordelière".

  regardez par exemple :

  http://www.jcpoiret.com/bapw/poissons/breme.htm

- comme je ne suis pas ichtyologue expliquez pourquoi le sexe
  n'a pas pu être déterminé.

- vous utilisez des classe pour les indices et taux sans indiquer comment les
  classes sont déterminées. Vous devez indiquer comment vous choisissez le nombre de
  classes et les bornes (cf. le cours avec m-sigma, les quartiles etc.).

- faites ressortir clairement les variables que vous avez trouvées sur le
  site et celles que vous avez constituées ensuite.


fichier excel :

- votre classeur comporte des liaisons avec un autre classeur sur votre
  ordinateur à vous (fichier "Tris à plat.xls") ???? Menu Edition / liaisons.
  cela s'affiche dès qu'on ouvre le fichier.

- onglet titre : mettez votre nom !

- onglet "Analyse des QT" : bon travail avec comparaison par groupe.

- l'onglet "Feuill2" est mal nommé.

- je ne vois aucun commentaire sur les corrélations qui sont pourtant flagrantes ?

- tris à plat : il vous manque un le tableau récapitulatif des QL trié par mode
  décroissant. vous devez ensuite rédiger les commentaires sur les QL dans l'ordre
  des modes décroissant en suivant ce tableau récapitulatif.


- il n'y a aucune rédaction sur le choix des tris croisés, sur la méthode du calcul
  du pourcentage (par rapport au total, à la ligne, la colonne) ni sur les
  conclusions qu'on en tire.

- bon travail pour l'instant, continuez !

 


Dossier MCAH : 01 / 20
=============



fichier descriptif :

- l'espérance de vie est-elle une QT ?

- "Pour les 5 variables qualitatives, des classes ont été créées", où, comment
  et avec quels codes ? ceci est insuffisant : vous devez indiquer
  comment vous choisissez le nombre de classes et les bornes (cf. le cours avec
  m-sigma, les quartiles etc.).

fichier word ou excel : aucune analyse fournie.

 


Dossier PM : 03 / 20
=============



fichier descriptif :

C'est sans doute évident, mais qui sont
Secondi, Bretagnolle, Compagnon et Faivre ?
des enseignants, des chercheurs, des journalistes ?

Les données ont été trouvées sur le net, envoyées par
les auteurs ?

Qu'est-ce que la zone d’hybridation ?

Mettez vos noms de variables en français.

"Après analyses génétiques, le sexe de chaque passereau est déterminé".
Il faut plusieurs analyses génétiques (d'où les S) ou une seule ?
Pour moi qui suis novice : le sexe de ces oiseaux est donc si difficile
à déterminer (expliquez-moi...).

Que voulez-vous faire avec la date ? ce n'est sans doute pas une QT.
Pour que ce soit une QL il faut indiquer comment elle est codée.

Pourquoi une variable Bill, une variable Bill + Head
mais pas de variable Head ? C'est sans doute ornithologiquement
cohérent mais j'aimerais qu'on me l'explique.

C'est quoi le tarse pour un oiseau ?

fichier word ou excel : aucune analyse fournie.