M. Antoine GAUTHIER & M. Sedki HAOUAS
Sujet du TER
rapport et manuel programmeur
Découpage en classe et "Formes fortes"
Jeux de données disponibles:
pg.txt
ageelf.txt
lng.txt
Dernier essai
Effacer la zone de saisie
Zone de saisie des données:
Le fichier 'lng.txt' a été sélectionné.
PDBID LNG 1A0M:A_4 16 1A2Z:A_2 220 1A8D:A_4 452 1A9N:A_2 176 1ABR:A_1 251 1ABR:B_1 267 1ABT:A_4 74 1ACW:A_4 29 1AGQ:A_1 135 1AHO:A_4 64 1AIP:C_2 196 1ANS:A_4 27 1APH:A_1 21 1APH:B_1 30 1AQ5:A_2 47 1AQZ:A_4 149 1ATX:A_4 46 1AXH:A_4 37 1BM3:H_1 227 1BM3:L_1 214 1BMR:A_4 67 1CIC:A_1 214 1CIC:B_1 217 1CIC:C_1 214 1CIC:D_1 218 1CQH:A_2 105 1CQH:B_2 13 1DL0:A_4 37 1EHS:A_4 48 1EJF:A_2 125 1F0S:A_1 254 1F0S:B_1 134 1F53:A_4 84 1FFJ:A_4 60 1FMH:A_2 31 1FMH:B_2 31 1G6M:A_4 62 1G8E:A_2 116 1HUC:A_1 47 1HUC:B_1 239 1HUL:A_2 108 1I7O:A_2 429 1JE0:A_2 236 1JE9:A_4 61 1JUN:A_2 43 1JVO:A_1 128 1JYO:E_2 105 1M5A:A_1 21 1N8M:A_4 38 1NBT:A_4 66 1NOR:A_4 61 1PRT:A_4 234 1PRT:B_4 196 1PRT:C_4 196 1PRT:D_4 110 1PRT:F_4 98 1QFN:A_2 85 1QFN:B_2 25 1QGE:D_2 222 1QGE:E_2 97 1QOU:A_2 181 1QUZ:A_4 34 1SEM:A_2 58 1SIS:A_4 35 1UR5:A_2 309 1UT2:A_2 149 1UW9:A_2 475 1VKT:A_2 21 1VKT:B_2 30 2A93:A_2 32 2A93:B_2 32 2BI6:H_1 41 2BI6:L_1 11 2SH1:A_4 48 2SN3:A_4 65 2UTG:A_2 70 3KBP:B_2 432 3SEB:A_4 238 5EBX:A_4 62
Methode de saisie manuelle des données:
La premiere ligne est reservée aux en-têtes de colonne.
Chaque colonne doit être espacée d'au moins un espace.
Seulement deux colonnes seront prises en compte:
-premiere colonne: devra contenir les identités des lignes,
-seconde colonne: devra contenir les valeurs à classer.
Chacune de ces lignes sera un couple.
ex: NOM DONNEES
Var1 val1
Var2 val2
... ...
VarN valN
avec val1,...,valN des valeurs
Sélection des méthodes:
Quantile
2
3
4
5
6
7
8
9
- Chaque classe dispose théoriquement d'un effectif égal approximativement au nombre d'unité divisé par le nombre de classes.
Equiprobabilité
2
3
4
5
6
7
8
9
- Chaque classe dispose d'un effectif égal au nombre d'unités divisé par le nombre de classes.
(On ne sépare pas des unités de même valeur)
Equivalence
2
3
4
5
6
7
8
9
- Chaque classe dispose d'une étendue égal (Etendue = (maximum - minimum)/nombre de classes).
Progression Arithmétique
2
3
4
5
6
7
8
9
- Cette méthode permet d'étaler la répartition dans les petites valeurs.
Elle s'appliquera par conséquent très bien aux données dont la distribution est fortement dissymétrique vers les faibles valeurs.
Progression Géométrique
2
3
4
5
6
7
8
9
- idem : mais accentue plus efficacement la répartition dans les petites valeurs
Standard
2
3
4
5
6
7
8
9
- Chaque classe est calculée en fraction d'écart type par rapport à la moyenne.
Moyennes Emboîtées
2
4
8
- Cette méthode est un compromis entre la méthode des quantile et la méthode standard.
Elle consiste à appliquer un découpage successif par la moyenne de chaque groupe ainsi formé.
Grandes Différences Relatives
%
- On s'interesse au rapport qui existe entre 2 valeurs consécutives.
Analyse complète :
Formes fortes
L'analyse peut prendre du temps en particulier pour le GDR et en fonction du nombre de variables!