Commentaires (série 2) sur les descriptifs fournis
pour les analyses statistiques en Licence Mass
année 2004/2005
(gH) gilles.hunault@univ-angers.fr
Dossier AJ ============ C'est mieux pour le découpage en classes, sauf pour le nombre de classes. Pourquoi 3 classes pour CPIET et 7 classes pour CACC ?
Dossier BG ========== Attention à l'orthographe : "les champs ne possédantS" "les pays dont les données concernantS" Pourquoi parler de pays (individus) et de champs au lieu d'utiliser la terminologie simple ligne/colonne ? A la lecture du descriptif, il n'est pas facile de savoir quelles colonnes sont extraites du site et lesquelles vous avez créé. Vous parlez de QL obtenue, mais comment ? Avec des quartiles, avec des formules m+t.s ? Vous devez le détailler. Les QT ont des forcément des unités, mais vous ne les indiquez pas. TAREA, par exemple, et peut-être en km carrés ou en miles carrés ou en hectares... Qu'est-ce que le GDP ? Je trouve très dommage d'avoir enlevé les définitions et autres commentaires : on n'y comprend plus rien.
Dossier CCZ =========== "Le tableau des données est en réalité une succession de plusieurs tableaux semblables mis à la suite les uns des autres, " : ça va. "... mais nous en étudierons plus tard la représentation." : inutile. "Tout d'abord intéresserons-nous"... c'est de l'oral ! idem pour "nous verrons...". Dites simplement : "les colonnes correspondent au nombre d'enfants et les lignes à diverses catégories de famille par région." Comme cela, ce sera peut-être compréhensible. Vous devez détailler comment on obtient chacun des tableaux (à partir de quelle page, selon quelle manipulation, ou choix d'URL, de champ dans les listes...). Vous devez faire pour chaque QT un découpage en classes, cela vous donnera les QL qu'il vous manque.
Dossier DL ========== Pour appeler le descriptif "descriptif.txt" au lieu de dl.dsc comme demandé ? "sélectionnés selon plusieurs critères spécifiques" : spécifiques aux journal ou à vous ? "On peut noter aussi" : qui le note ? "Cette colonne sert à identifier chaque camping grâce aux 4 premières lettres de chaque camping et suivi d'un chiffre si ces 4 lettres représentent plusieurs campings différents." : ce n'est pas du français : soit c'est 4 lettres suiviES soit il y a plusieurs cas : selon que le camping est ou n'est pas... En français, il doit y avoir un espace entre le point et la première lettre de la phrase suivante. Pour un symbole deux-points, il faut un espace avant. Et TOUJOURS : Un camping s'appelle VIDE ?
Dossier KM ========== Sauf erreur de ma part, il s'agit d'un nouveau dossier ? Le précédent dossier KM.ZIP traitait de... données marines ! Un volet roulant, c'est comme un store qui se déplie en roulant ? Qui a classé le confort du mobil home ? Si c'est le constructeur, ce sera sujet à caution. Si c'est vous, aussi. S'il s'agit d'un sondage, d'une organisation indépendante ou si vous ne le savez pas, il faut le dire aussi. Je ne vois pas comment vous avez obtenu les données : par exemple le premier site indiqué (http://www.irm-sa.fr/) n'affiche que deux images et aucun chiffre. Dans "l'espace particulier" (image de droite), je trouve les longueurs mais pas les largeurs. Idem pour l'image de gauche.
Dossier MAL =========== Vous n'avez rien renvoyé ?
Dossier MS ========== C'est mieux, mais pour la présentation, il y a encore des petites choses à changer. DE plus, vous n'avez pas corrigé certaines erreurs flagrantes. En français, il doit y avoir un espace entre le point et la première lettre de la phrase suivante. Pour un symbole deux-points, il faut un espace avant. "sont comptés toutes les versions" -> "sont comptées toutes les versions", n'est-ce pas ? "le texte du projet imposait... de voir ce qu'il en ressortait en fonction des marques" : NON ! le texte imposait 50 comme taille. C'est vous qui choisissez de travailler en fonction des marques. "afin d'avoir une répartition correcte de mon étude" : dites plutot "afin d'avoir une grande diversité". la correction de la répartition serait difficile à prouver. "coupé,berline" : rappelez la différence. Pourquoi ne pas dire que CYLINDREE et PUISSFISCALE sont des QT ? Idem pour CHEVAUXDIN. CONSO : c'est pour 100 km ? Attention aux découpages en classes : les techniques classiques (scientifiques, objectives) utilisent soit les m+t.s soit les quartiles. Vous ne pouvez pas dire subjectivement "ces bornes me semblent adéquates" car c'est un sentiment non reproductibles par d'autres. Et si vous compariez aux quartiles, aux valeurs m+t.s ? cela permettrait peut-être de prouver quelquechose. Imaginez que je dise (et je suis le prof, d'où argument d'autorité) : "ces bornes NE ME SEMBLENT pas adéquates". Comment allez-vous vous en sortir ? "J'en ai fait deux classes car la valeur du financement va du simple à plus du triple." mais où est le financement dans tout cela ? S'il s'agit du remboursement par mois, c'est hors sujet (ou hors fichier des données). Le terme "élite sociale" est inutile. Et sans doute faux : il s'agit de gens "riches", le social n'a rien à y voir. Et TOUJOURS : "Ces données proviennent du site du quotidien automobile dont l'adresse web est http://automobile.nouvelobs.com/guide/ où l'on choisit directement sur cette page la marque du véhicule désiré et son modèle." ; rajoutez : "j'ai donc saisi par copier/coller les diverse informations". Comme cela s'il y a des données surprenantes, on saura d'où cela vient... "3 / Carb ... la variable 1 est indicatrice des voitures" ; c'est incorrect : il s'agit de la valeur 1 pour la variable 3 (CARB)." "Conso moy route ... C'est une variable QT." : pourquoi parler maintenant de QT ? Vous ne le dites pas pour les autres variables. orthographe : "Les voitures...sont répertoriés" Vous devriez indiquer plus clairement qu'à partir de la variable 10, il s'agit de vos variables calculées à partir des variables d'origine selon vos choix de nombre de classes et de bornes. "Un temps inférieur à dix secondes correspond aux voitures assez "puissantes aux démarrages" (démarrage au singulier, sans doute) ; d'où vient cette information sans doute vraie ? Ces termes ne sont pas "pronés" mais employés seulement. Proner a plutot le sens de vanter, glorifier, mettre en exergue... Mais pourquoi parler de prix à virgules ? Il n'y en a plus dans votre fichier. Par contre il serait bon de signaler que vous avez arrondi.