M. Antoine GAUTHIER & M. Sedki HAOUAS
Sujet du TER
rapport et manuel programmeur
Découpage en classe et "Formes fortes"
Jeux de données disponibles:
pg.txt
ageelf.txt
lng.txt
Dernier essai
Effacer la zone de saisie
Zone de saisie des données:
Le fichier 'temp.txt' a été sélectionné.
IDEN AGE M001 62 M002 60 M003 31 M004 27 M005 22 M006 70 M007 19 M008 53 M009 62 M010 63 M011 65 M012 11 M013 78 M014 20 M015 48 M016 50 M017 49 M018 44 M019 21 M020 23 M021 28 M022 47 M023 64 M024 26 M025 14 M026 43 M027 61 M028 15 M029 29 M030 24 M031 41 M032 37 M033 73 M034 12 M035 40 M036 42 M037 15 M038 16 M039 46 M040 61 M041 19 M042 20 M043 73 M044 39 M045 59 M046 22 M047 52 M048 76 M049 17 M050 44 M051 28 M052 25 M053 28 M054 26 M055 50 M056 28 M057 52 M058 31 M059 29 M060 28 M061 30 M062 28 M063 30 M064 26 M065 29 M066 32 M067 26 M068 27 M069 27 M070 28 M071 35 M072 35 M073 33 M074 18 M075 21 M076 17 M077 19 M078 18 M079 18 M080 24 M081 25 M082 19 M083 25 M084 25 M085 73 M086 60 M087 49 M088 47 M089 22 M090 15 M091 50 M092 36 M093 13 M094 12 M095 31 M096 17 M097 39 M098 62 M100 48
Methode de saisie manuelle des données:
La premiere ligne est reservée aux en-têtes de colonne.
Chaque colonne doit être espacée d'au moins un espace.
Seulement deux colonnes seront prises en compte:
-premiere colonne: devra contenir les identités des lignes,
-seconde colonne: devra contenir les valeurs à classer.
Chacune de ces lignes sera un couple.
ex: NOM DONNEES
Var1 val1
Var2 val2
... ...
VarN valN
avec val1,...,valN des valeurs
Sélection des méthodes:
Quantile
2
3
4
5
6
7
8
9
- Chaque classe dispose théoriquement d'un effectif égal approximativement au nombre d'unité divisé par le nombre de classes.
Equiprobabilité
2
3
4
5
6
7
8
9
- Chaque classe dispose d'un effectif égal au nombre d'unités divisé par le nombre de classes.
(On ne sépare pas des unités de même valeur)
Equivalence
2
3
4
5
6
7
8
9
- Chaque classe dispose d'une étendue égal (Etendue = (maximum - minimum)/nombre de classes).
Progression Arithmétique
2
3
4
5
6
7
8
9
- Cette méthode permet d'étaler la répartition dans les petites valeurs.
Elle s'appliquera par conséquent très bien aux données dont la distribution est fortement dissymétrique vers les faibles valeurs.
Progression Géométrique
2
3
4
5
6
7
8
9
- idem : mais accentue plus efficacement la répartition dans les petites valeurs
Standard
2
3
4
5
6
7
8
9
- Chaque classe est calculée en fraction d'écart type par rapport à la moyenne.
Moyennes Emboîtées
2
4
8
- Cette méthode est un compromis entre la méthode des quantile et la méthode standard.
Elle consiste à appliquer un découpage successif par la moyenne de chaque groupe ainsi formé.
Grandes Différences Relatives
%
- On s'interesse au rapport qui existe entre 2 valeurs consécutives.
Analyse complète :
Formes fortes
L'analyse peut prendre du temps en particulier pour le GDR et en fonction du nombre de variables!