Commentaires (série 2) sur les descriptifs fournis
  pour les analyses statistiques en Licence Mass
  année 2004/2005
 

     (gH) gilles.hunault@univ-angers.fr  

 

 


 Dossier AJ
 ============


C'est mieux pour le découpage en classes, sauf pour le nombre de classes.
Pourquoi 3 classes pour CPIET et 7 classes pour CACC ?

 

 


 Dossier BG
 ==========


 Attention à l'orthographe :
    "les champs ne possédantS"
    "les pays dont les données concernantS"

 Pourquoi parler de pays (individus) et de champs au lieu d'utiliser la terminologie
 simple ligne/colonne ?

 A la lecture du descriptif, il n'est pas facile de savoir quelles colonnes sont
 extraites du site et lesquelles vous avez créé.

 Vous parlez de QL obtenue, mais comment ? Avec des quartiles, avec des formules
 m+t.s ? Vous devez le détailler.

 Les QT ont des forcément des unités, mais vous ne les indiquez pas. TAREA, par exemple,
 et peut-être en km carrés ou en miles carrés ou en hectares...

 Qu'est-ce que le GDP ?

 Je trouve très dommage d'avoir enlevé les définitions et autres commentaires : on n'y
 comprend plus rien.

 

 


 Dossier CCZ
 ===========


 "Le tableau des données est en réalité une succession de plusieurs tableaux semblables
 mis à la suite les uns des autres, " : ça va.

 "...  mais nous en étudierons plus tard la représentation." : inutile.

 "Tout d'abord intéresserons-nous"... c'est de l'oral !
 idem pour "nous verrons...".

 Dites simplement : "les colonnes correspondent au nombre d'enfants et les lignes
 à diverses catégories de famille par région." Comme cela, ce sera peut-être
 compréhensible.

 Vous devez détailler comment on obtient chacun des tableaux (à partir de quelle
 page, selon quelle manipulation, ou choix d'URL, de champ dans les listes...).

 Vous devez faire pour chaque QT un découpage en classes, cela vous donnera les
 QL qu'il vous manque.

 

 


 Dossier DL
 ==========


 Pour appeler le descriptif "descriptif.txt" au lieu de dl.dsc comme demandé ?

 "sélectionnés selon plusieurs critères spécifiques" : spécifiques aux journal ou à vous ?

 "On peut noter aussi" : qui le note ?

 "Cette colonne sert à identifier chaque camping grâce aux 4 premières lettres
  de chaque camping et suivi d'un chiffre si ces 4 lettres représentent plusieurs
  campings différents." : ce n'est pas   du français : soit c'est 4 lettres suiviES
  soit il y a plusieurs cas : selon que le camping est  ou n'est pas...

  En français, il doit y avoir un espace entre le point
  et la première lettre de la phrase suivante. Pour un symbole deux-points,
  il faut un espace avant.

  Et TOUJOURS :

  Un camping s'appelle VIDE ?

 

 


 Dossier KM
 ==========


 Sauf erreur de ma part, il s'agit d'un nouveau dossier ? Le précédent dossier KM.ZIP
 traitait de...  données marines !

 Un volet roulant, c'est comme un store qui se déplie en roulant ?

 Qui a classé le confort du mobil home ? Si c'est le constructeur, ce sera
 sujet à caution. Si c'est vous, aussi. S'il s'agit d'un sondage, d'une
 organisation indépendante ou si vous ne le savez pas, il faut le dire aussi.

 Je ne vois pas comment vous avez obtenu les données : par exemple le premier
 site indiqué (http://www.irm-sa.fr/) n'affiche que deux images et aucun
 chiffre. Dans "l'espace particulier" (image de droite), je trouve les
 longueurs mais pas les largeurs. Idem pour l'image de gauche.

 

 


 Dossier MAL
 ===========


 Vous n'avez rien renvoyé ?

 

 


 Dossier MS
 ==========


  C'est mieux, mais pour la présentation, il y a encore des petites choses
  à changer. DE plus, vous n'avez pas corrigé certaines erreurs flagrantes.

  En français, il doit y avoir un espace entre le point
  et la première lettre de la phrase suivante. Pour un symbole deux-points,
  il faut un espace avant.

  "sont comptés toutes les versions"
  -> "sont comptées toutes les versions", n'est-ce pas ?

  "le texte du projet imposait... de voir ce qu'il en ressortait en fonction des marques" :
  NON ! le texte imposait 50 comme taille. C'est vous qui choisissez de travailler
  en fonction des marques.

  "afin d'avoir une répartition correcte de mon étude" : dites plutot "afin
  d'avoir une grande diversité". la correction de la répartition serait
  difficile à prouver.

  "coupé,berline" : rappelez la différence.

  Pourquoi ne pas dire que CYLINDREE et PUISSFISCALE sont des QT ?
  Idem pour CHEVAUXDIN.

  CONSO : c'est pour 100 km ?

  Attention aux découpages en classes : les techniques classiques (scientifiques,
  objectives) utilisent soit les m+t.s soit les quartiles. Vous ne pouvez pas
  dire subjectivement "ces bornes me semblent adéquates" car c'est un sentiment
  non reproductibles par d'autres. Et si vous compariez aux quartiles, aux
  valeurs  m+t.s ? cela permettrait peut-être de prouver quelquechose.
  Imaginez que je dise (et je suis le prof, d'où argument d'autorité) : "ces
  bornes NE ME SEMBLENT pas adéquates". Comment allez-vous vous en sortir ?

  "J'en ai fait deux classes car la valeur du financement va du simple
   à plus du triple." mais où est le financement dans tout cela ? S'il
   s'agit du remboursement par mois, c'est hors sujet (ou hors fichier
   des données).

   Le terme "élite sociale" est inutile. Et sans doute faux : il s'agit
   de gens "riches", le social n'a rien à y voir.

  Et TOUJOURS :

 "Ces données proviennent du site du quotidien automobile dont
  l'adresse web est http://automobile.nouvelobs.com/guide/ où
  l'on choisit directement sur cette page la marque du véhicule désiré
  et son modèle." ; rajoutez : "j'ai donc saisi par copier/coller les
  diverse informations". Comme cela s'il y a des données surprenantes,
  on saura d'où cela vient...

  "3 / Carb ... la variable 1 est indicatrice des voitures" ; c'est
  incorrect : il s'agit de la valeur 1 pour la variable 3 (CARB)."

  "Conso moy route ... C'est une variable QT." : pourquoi parler maintenant
  de QT ? Vous ne le dites pas pour les autres variables.

  orthographe :
     "Les voitures...sont répertoriés"

  Vous devriez indiquer plus clairement qu'à partir de la variable 10,
  il s'agit de vos variables calculées à partir des variables d'origine
  selon vos choix de nombre de classes et de bornes.

  "Un temps inférieur à dix secondes correspond aux voitures assez
  "puissantes aux démarrages" (démarrage au singulier, sans doute) ;
  d'où vient cette information sans doute vraie ? Ces termes ne sont
  pas "pronés" mais employés seulement. Proner a plutot le sens
  de vanter, glorifier, mettre en exergue...

  Mais pourquoi parler de prix à virgules ? Il n'y en a plus dans votre
  fichier. Par contre il serait bon de signaler que vous avez arrondi.