le dossier TITANIC, un fichier de données réelles
gilles.hunault@univ-angers.fr
Descriptif succint :
Il s'agit de données (sans doute contestables) concernant les passagers et membres d'équipage du célèbre bateau "le Titanic" qui a fait naufrage le 15 avril 1912.
Source : http://www.amstat.org/publications/jse/datasets/titanic.txt
VARIABLE DESCRIPTIONS: Column Name Values 1 Iden Anonymous descriptor 2 Class 0 = crew, 1 = first, 2 = second, 3 = third 3 Age 0 = child, 1 = adult 4 Sex 0 = female, 1 = male 5 Survived 0 = no, 1 = yes SPECIAL NOTES: There is not complete agreement among primary sources as to the exact numbers on board, rescued, or lost.Données (2201x5) : titanic.zip
Codages : (à discuter)
La colonne 1 est l'identificateur des personnes. La colonne 2 correspond à la classe de cabine, selon les codes 0 = équipage, 1 = première classe, 2 = seconde classe, 3 = troisième classe. La colonne 3 est la catégorie d'age : 0 = enfant, 1 = adulte. La colonne 4 est le sexe de la personne 0 = femme, 1 = homme. La colonne 5 indique si la personne a survécu : 0 = non, 1 = oui.
Lecture avec le logiciel R
Si le logiciel R est installé, vous pouvez, si vous avez accès à Internet, utiliser le code suivant pour lire ces données :
source("http://forge.info.univ-angers.fr/~gh/statgh.r",encoding="latin1") titanic <- lit.dar("http://www.info.univ-angers.fr/~gh/Datasets/titanic.dar")