M. Antoine GAUTHIER & M. Sedki HAOUAS
Sujet du TER
rapport et manuel programmeur
Découpage en classe et "Formes fortes"
Jeux de données disponibles:
pg.txt
ageelf.txt
lng.txt
Dernier essai
Effacer la zone de saisie
Zone de saisie des données:
Le fichier 'temp.txt' a été sélectionné.
Id Données mai 1 8479 2 8276 3 7356 4 7318 5 5857 6 5604 7 5079 8 4892 9 4889 10 4782 11 4735 12 4582 13 4524 14 4455 15 4438 16 4282 17 3905 18 3812 19 3784 20 3744 21 3686 22 3437 23 3357 24 3222 25 3204 26 3169 27 3140 28 3075 29 3060 30 2831 31 2788 32 2703 33 2687 34 2656 35 2481 36 2425 37 2365 38 2352 39 2280 40 2243 41 2206 42 2169 43 2089 44 2078 45 1982 46 1897 47 1842 48 1834 49 1788 50 1747 51 1742 52 1738 53 1675 54 1611 55 1547 56 1535 57 1460 58 1442 59 1441 60 1407 61 1347 62 1324 63 1318 64 1286 65 1286 66 1273 67 1267 68 1245 69 1182 70 1105 71 1105 72 1083 73 1064 74 1050 75 1033 76 998 77 988 78 957 79 950 80 942 81 887 82 833 83 817 84 767 85 757 86 753 87 748 88 742 89 728 90 725 91 722 92 690 93 674 94 671 95 630 96 602 97 598 98 551 99 547 100 545 101 543 102 531 103 516 104 500 105 488 106 478 107 476 108 454 109 449 110 448 111 424 112 400 113 394 114 378 115 369 116 361 117 320 118 314 119 309 120 308 121 293 122 289 123 269 124 267 125 263 126 262 127 252 128 251 129 238 130 223 131 223 132 202 133 201 134 188 135 188 136 185 137 178 138 174 139 161 140 160 141 154 142 153 143 149 144 124 145 118 146 115 147 102 148 100 149 90 150 85 151 84 152 84 153 75 154 72 155 71 156 65 157 65 158 61 159 58 160 57 161 56 162 53 163 50 164 46 165 46 166 45 167 44 168 41 169 39 170 38 171 36 172 34 173 33 174 31 175 29 176 29 177 23 178 23 179 22 180 20 181 16 182 14 183 13 184 12 185 12 186 11 187 10 188 10 189 10 190 9 191 9 192 9 193 9 194 8 195 8 196 8 197 7 198 7 199 6 200 6 201 6 202 5 203 5 204 4 205 4 206 4 207 4 208 3 209 3 210 3 211 3 212 2 213 2 214 2 215 2 216 2 217 2 218 2 219 2 220 1 221 1 222 1 223 1 224 1 225 1 226 1 227 1 228 1 229 1 230 1 231 1 232 1
Methode de saisie manuelle des données:
La premiere ligne est reservée aux en-têtes de colonne.
Chaque colonne doit être espacée d'au moins un espace.
Seulement deux colonnes seront prises en compte:
-premiere colonne: devra contenir les identités des lignes,
-seconde colonne: devra contenir les valeurs à classer.
Chacune de ces lignes sera un couple.
ex: NOM DONNEES
Var1 val1
Var2 val2
... ...
VarN valN
avec val1,...,valN des valeurs
Sélection des méthodes:
Quantile
2
3
4
5
6
7
8
9
- Chaque classe dispose théoriquement d'un effectif égal approximativement au nombre d'unité divisé par le nombre de classes.
Equiprobabilité
2
3
4
5
6
7
8
9
- Chaque classe dispose d'un effectif égal au nombre d'unités divisé par le nombre de classes.
(On ne sépare pas des unités de même valeur)
Equivalence
2
3
4
5
6
7
8
9
- Chaque classe dispose d'une étendue égal (Etendue = (maximum - minimum)/nombre de classes).
Progression Arithmétique
2
3
4
5
6
7
8
9
- Cette méthode permet d'étaler la répartition dans les petites valeurs.
Elle s'appliquera par conséquent très bien aux données dont la distribution est fortement dissymétrique vers les faibles valeurs.
Progression Géométrique
2
3
4
5
6
7
8
9
- idem : mais accentue plus efficacement la répartition dans les petites valeurs
Standard
2
3
4
5
6
7
8
9
- Chaque classe est calculée en fraction d'écart type par rapport à la moyenne.
Moyennes Emboîtées
2
4
8
- Cette méthode est un compromis entre la méthode des quantile et la méthode standard.
Elle consiste à appliquer un découpage successif par la moyenne de chaque groupe ainsi formé.
Grandes Différences Relatives
%
- On s'interesse au rapport qui existe entre 2 valeurs consécutives.
Analyse complète :
Formes fortes
L'analyse peut prendre du temps en particulier pour le GDR et en fonction du nombre de variables!