############################################### # # Etude du dossier titanic # ############################################### # # voir http://www.info.univ-angers.fr/pub/gh/Datasets/titanic.htm # pour la description et la récupération des données # affichage d'un titre cat("\n Analyse du dossier TITANIC \n\n") cat(" -- ; ",date(),"\n") # chargement des fonctions gh source("statgh.r") # lecture du fichier Dbase tit <- read.dbf("titanic.dbf") # définition de colonnes séparées clas <- tit$dbf[2] cage <- tit$dbf[3] sexe <- tit$dbf[4] surv <- tit$dbf[5] # définition de sous-colonnes femmes <- sexe[ sexe==0 ] hommes <- sexe[ sexe==1 ] jeunes <- cage[ cage==0 ] adultes <- cage[ cage==1 ] equipage <- clas[ clas==0 ] morts <- surv[ surv==0 ] survivants <- surv[ surv==1 ] # liste des indice pour QL titaQL <- 2:5 # noms des modalités titaNomMod <- vector(length=length(titaQL)) titaNomMod[1] <- paste(paste(c("équipage","1ère classe","2ème catégorie","3ème catégorie"),"!"),collapse="") titaNomMod[2] <- paste(paste(c("jeune","aulte"),"!"),collapse="") titaNomMod[3] <- paste(paste(c("femmes","hommes"),"!"),collapse="") titaNomMod[4] <- paste(paste(c("morts","survivants"),"!"),collapse="") # préparation de la matrice des modalités pour tris à plat titaModQL <- matrix(nrow=length(titaQL),ncol=2) titaModQL[1,1] <- c("Classe de cabine") titaModQL[2,1] <- c("Classe d'age") titaModQL[3,1] <- c("Sexe des personnes") titaModQL[4,1] <- c("Etat après le naufrage") titaModQL[1,2] <- paste(paste(c("équipage","1ère classe","2ème catégorie","3ème catégorie"),"!"),collapse="") titaModQL[2,2] <- paste(paste(c("jeune","aulte"),"!"),collapse="") titaModQL[3,2] <- paste(paste(c("femmes","hommes"),"!"),collapse="") titaModQL[4,2] <- paste(paste(c("morts","survivants"),"!"),collapse="") # préparation de la matrice des modalités pour récapitulatif titaModQLc <- titaModQL titaModQLc[1,1] <- c("CCABINE") titaModQLc[2,1] <- c("CAGE") titaModQLc[3,1] <- c("SEXE") titaModQLc[4,1] <- c("ETAT") # analyse récapitulative des QL recapQL(tit$dbf,titaModQLc,titaQL) # détail de l'analyse des QL allQL(tit$dbf,titaModQL,titaQL) # tris à plat anaTCR(tit$dbf,titaModQL,titaQL) # tris croisés # quelques comptages pour les comparaisons # de pourcentages nbhom <- sum( sexe==1 ) nbfam <- sum( sexe==0 ) nbhomsurv <- sum( (sexe==1) & (surv==1) ) nbfamsurv <- sum( (sexe==0) & (surv==1) ) # comparaison de pourcentages compPourc(nbhomsurv,nbhom,nbfamsurv,nbfam)