(gH) -_- statgh.xmp ; TimeStamp (unix) : 04 Février 2010 vers 17:48 # il doit y avoir un espace en début de ligne ! aide() lit() fqt() fql() ic() fapprox() chi2() cr(age) z() versiongh() showColors() showColors(colors()[1:16]) couleursNmds() # 16 couleurs library(lubridate) ; temps <- now() ; exprimeDuree(temps, now() ) fcomp() datagh() datagh("elf") datagh("vins") datagh("logement") datagh("ronfle") chaineEnListe("tout va bien") # renvoie c("tout","va","bien") au2f4 <- aurocQlPred(f4Su,scoreF4,ci=FALSE) data(iris) ; hprint(iris) # affiche les données dans Firefox ! go("cs") ; lit.dac("iris") compare2QT("age vs sexe","homme",ah,"femme",af,"ans") cb(names(monDF)) cb(names(laMatrice)) extrait(iris) ; extrait(iris,titre="les iris de Fisher") ; extrait(iris,nbcol=4) ; data(iris) ; decritQLf("Espece",iris$Species) bioc() # charge bioclite() cb(names(unVecteur)) # car print(t(unVecteur))) ne fait pas ce qu'on pense... compareScoresBinaires(valBin1=ma[,"fcs"],valBin2=fcsPred,titre="Modele FCS",moda=c("0","1"),graphique=TRUE) compareScoresBinaires(valBin1=ma[,"fcs"],valBin2=fcsPred,titre="Modele RLB4FCS : AUROC 0,930 ; discordance 0,149 ",moda=c("0","1"),graphique=TRUE) compareScoresMetavir(valMeta=metaF,predMeta=ypred,titre=t3) corCircle(titre="Malah396",data=maQT,seuil=0.1,grFile="corcirc_396.png") compareScoresMetavir(valMeta=metaF,predMeta=metaF+0.05,titre="Prédiction parfaite",pointilles="",points=TRUE,barres=FALSE) compareScoresMetavir(valMeta=metaF,predMeta=metaF+0.05,titre="Prédiction parfaite",pointilles="",points=FALSE,barres=TRUE) compare2QT("age vs sexe","homme",ah,"femme",af,"ans",TRUE) compare2QT("age vs sexe","homme",ah,"femme",af,"ans",TRUE,"AGEvsSEXE.png") compare2QTappariees("poids","avant",pav,"après",pop,"kg",TRUE) ajouteTotaux(table(sexe,etud)) tbc <- triCroiseBC(ql1=malah549AvecPred$predStd,ql2=malah549$META_F,nomsMods=mm) copies("-.",15) # ce n'est pas rep("-.",15) tdn("Variable AGE dossier ELF",age,"ans") tdn("Variable AGE dossier ELF",age,"ans",TRUE,"E:/ageTDN.png") decritQTparFacteur("AGE dans ELF",age,"ans","SEXE",sexe,"hom fam",TRUE) decritQTparFacteurTexte("AGE dans ELF",age,"ans","SEXE",sexe,"hom fam",TRUE) allQL(pbioDATA,pbioQL,pbioCOLQL) allQLtriap(pbioDATA,pbioQL,pbioCOLQL) allQLrecap(pbioDATA,pbioQL,pbioCOLQL) allQLtricr(pbioDATA,pbioQL,pbioCOLQL) allQT(lesQT,c("AGE","POIDS","TAILLE","ALCOOL"),c("ans","kg","cm","verres")) allQT2(lesQT,c("AGE","POIDS","TAILLE","ALCOOL"),c("ans","kg","cm","verres")) triAplat("Sexe de la personne",sexeElf, c("homme","femme") ) triAplatAvecOrdre("Sexe de la personne",sexeElf, c("homme","femme") ) triAplatNonum("Métiers ",varM) chi2Adeq( c(20,20,20,140), c(24,11,20,145) ) chi2Adeq( 150*rep(1/6,6), c(22,21,22,27,22,36), contr=TRUE ) aurocs_delong(donneesCHU) aurocs_delong(donneesCHU,"resCompAurocs.csv",TRUE,TRUE) chi2Indep(SEXE,ETUD,c("Homme","Femme"), c("NR","Primaire","Bepc","Bac","Supérieur")) chi2Indep( table(SEXE,ETUD) ) verifSol( raphy100, 4, c(15,-20) ) decritRLB("coloration",coloQlQt[,c(1,12)]) decritQTparFacteurTexte(titreGen,vaqt,unite,"Groupes",vaql,moda,graph,fichier_image) df2csv(elf,"elf.csv") df2dac(binary,"demo") data(cars) ; dfSansCor(cars) ; # voir aussi clusterCor() data(cars) ; dimdf(cars) ; # renvoie "50x2" data(cars) ; dims(cars) ; # comme dimdf() ? dfSansNA( dfAvecDonneesManquantes ) datagh("elf") ; dql("sexe") datagh("elf") ; dqt("age") mm <- analyseMedianes(art3,02:86,"group",lesGroupes,toler,print=FALSE,caract=TRUE,cag) parPrint() # tous les paramètres graphiques par ordre alphabétique optionsPrint() # toutes les options par ordre alphabétique optionsPrint(TRUE) # toutes les options par type d'option cat("le mot Bonjour comporte ",strlen("Bonjour")," caractères\n") chi2IndepTable(smo,row.names(smo),colnames(smo)) chi2IndepTableFacteur(sexeFacteur,etudFacteur) enColonnes( 1:250, nbCol=6,largeur=5, nbDec=0 ) grps1 <- clusterCor(data=art4r,ret=TRUE) ; mvar <- bestGroupRep(art4cl,grps1,"group") exploreCorrelations("METAVIR et RLB mode =", scoresFMegal, couleursMetavir() ) pctBcLda(art4cl,"PI","group") vecteurEnChaine( c(1,15,35) ) # renvoie "1 15 35" lesColonnes( myData ) lesColonnes( df=myData,ordered=FALSE ) dsc <- lesColonnes( df=myData,ordered=FALSE,envar=TRUE ) src("monCodeR.r") sorsrc("monCodeRAvecAccents.r") sinksrc("monCodeR.r") # charge et exécute le script et produit automatiquement monCodeR.sor sinksrc("demo.r") # charge et exécute le script et produit automatiquement demo.sor sensSpec(qlbin,yPredites) sensSpec(qlb=bql,qt=bqt,details=FALSE) rownames(monDataFrame) rlobin(ma[,2],df_fcs5[,-1]) mot("le petit chat",2) # renvoie "petit" car c'est le deuxième mot mots("le petit chat") # renvoie 3 car il y a 3 mots nbmots("le petit chat") # renvoie 3 car il y a 3 mots rlo_ord(dataFrameAvecQlOrdonnéeEnpremier) regressionLogistiqueOrdinale(dataFrameAvecQlOrdonnéeEnpremier) regressionLogistiqueOrdinale2(dataFrameAvecQlOrdonnéeEnpremier,"CUM") regressionLogistiqueOrdinale2(dataFrameAvecQlOrdonnéeEnpremier,"ADJ") regressionLogistiqueOrdinale2(dataFrameAvecQlOrdonnéeEnpremier,"CR") regressionLogistiqueBinaire(sexe,age,FALSE,FALSE) regressionLogistiqueBinaire(sexe,cbind(age,poids),TRUE,FALSE) sdr(1:10,0,10) rsd(1:10,0,10) sdmax(50,0,1) matpUnif <- matPen(taille=5,opt="unif") matpPond <- matPen(taille=5,opt="pond") discordance(f4org,f4pred,matPen(2),modaf4) matId(3) matId(5) mm <- modalitesMetavir() mdc(vinsData) matCor(vinsData) mdc(vinsData,meilCor=TRUE) minMatCor( cor(vinsData) ) maxMatCor( cor(vinsData) ) ouinon() # renvoie "oui" "non" rev( ouinon() ) # renvoie "non" "oui" aurocs(elfdata,"SEXE",c("AGE","ETUD")) nonoui() ) # renvoie "non" "oui" nombase("essai.txt") # renvoie "essai" nombase("/home/user/essai.txt") # renvoie "/home/user/essai" nombase("C:/home/user/essai.txt") # renvoie "C:/home/user/essai" ddata("datasets") lls("gdata") ar <- analyseRegression("Appartements",surf,prix) resOz <- analyseRegression(titre="Ozone",xi=ozone$T12,yi=ozone$maxO3,interactif=FALSE,basegr="OZ_") somCols(elfdata) # à ne pas confondre avec colSums(elfdata) head(lea) ; bloc(lea) ; hhead(lea) ; head(lea,n=10) ; bloc(lea,debcol=5,fincol=10) ; hhead(lea,c=3) ; dtQT("nombre d'élèves intégrés en 1997",integr,"personne(s)") ; decritQT("nombre d'élèves intégrés en 1997",integr,"personne(s)") ; decritQT("nombre d'élèves intégrés en 1997",integr,"personne(s)",graphique=TRUE,fichier_image="elv.ps") ; allQT(ecoles,c("INT","NPP","NEC","EFT","BUD","DAS","NPM","NOI","MSE")) ; allQT2(ecoles,c("INT","NPP","NEC","EFT","BUD","DAS","NPM","NOI","MSE")) ; anaLin("Age Hommes",ageh,"ans","Age femmes",agef,"ans") histProba( dbinom((0:5),5,0.5) ,c(0:5),"binomiale B(5,0.5)") histEffectifs( " Filtrages ") , c( 70 , 60 , 20 , 20 , 8 , 70 ) , 0:5 ) nomDeFichier("programme C++") # renvoie "programme_Cpp" nomDeFichier("a/B") # renvoie "adB" moy(age) milieux(1:3) # renvoie 1.5 2.5 milieu(1:3) # renvoie 2 ruler(30) # affiche une "réglette" en |...+....|....+....|....+....| sur 30 caractères nodup(dataFrame) noconst(dataFrame,"donneesNonConstantes.txt") nodup(dataFrame,noconst=FALSE) nodup(dataFrame,nodupcol=FALSE) hbbpQT("dist",dist) ice(5,3.676955) ice(5,3.676955,0.05) ice(5,3.676955,0.01,TRUE) with( cars, linCor(dist,speed) ) iceQT(age) iceQT(age,0.01) litcol("vins.dar",3) lstMod(c("homme","femme")) # renvoie "homme !femme !" ifiab(age,0,100) icm(50,25.03,1.341641) icm(50,25.03,1.341641,0.01) icm(50,25.03,1.341641,0.01,TRUE) icp(580,0.262) icp(580,0.262,0.05) icp(580,0.262,0.05,TRUE) icmQT(lng) icmQT(AGE_ELF,0.01) lib("gdata") installe("gdata") modelesCLMMetavir traceRLB(objRlb=glm(surv ~ .,data=HEPATO),ql=data[,1],seuil=0.5,titre="SURVIE") mcomed() # volontairement non décrit (pour mes cours) ligneCadreCtrACP() lignePointillesACP(30) approxPoiss(10,300,15) ypreditMetavir <- recadrage(v=ypred,vmin=0,vmax=4,out=1) couleursPred <- recadrage(predMeta,0,4,rounding=TRUE) rchModeleLogistique(dataFrameAvecQlEnpremierdf) rchModeleLogistique(dataFrameAvecQlEnpremierdf,TRUE) pchShow() ; # pour savoir à quoi correspond pch=19, pch=20 pchShow() ; # pour savoir comment on affiche un rond, un triangle... pairsi(leaqt,pch=19,cex=0.5) pairsi(pnd,opt=1,col=cc[leacl]) pairs(lesVar,lower.panel=panel.pointsreg,...) # pas pairs(lesVar,lower.panel=panel.pointsreg(),...) pairs(lesVar,lower.panel=panel.corpvalue,...) # pas pairs(lesVar,lower.panel=panel.corpvalue(),...) pairs(lesVar,lower.panel=panel.cor,...) # pas pairs(lesVar,lower.panel=panel.cor(),...) pairs(lesVar,lower.panel=panel.cor2,...) # pas pairs(lesVar,lower.panel=panel.cor2(),...) hbbpQT htmlsrc("demo1.r") htmlsrc("demo2.r",echo=TRUE) finHtml() cd("C:/Temp") cd("~/tmp") pwd() # voir aussi cd() regh() redata() reduitVarsCor(monDataFrame,0.82) { reduitVarsCor(monDataFrame,0.85,"spearman") { compPourc(" ORDINATEURS par Région",20,102,28,98) compMoyNoData( "AGE FR/US ",97, 5.851, 3.978, 73, 4.877, 5.642 ) skku( ageElf ) skku( c(-1,2) ) plotQT(lng,"Longueur (en acides aminés) des chaines","aa",TRUE) boxplotQT(lng,"Longueur (en acides aminés) des chaines") identif("CCUG1",vec1,mat1) identifgc("xmp1.dac","xmp1.mdp","xmp1.ngr") identifgc("rch3.dac","rch3.mdp","xmp1.ngr") decritQT(" AGE ", ag, "ans ") decritQT(" AGE ", ag, "ans ", TRUE) decritQT(" AGE ", ag, "ans ", TRUE ," d:/elf_age.png") decritQL(" SEXE ",sx, "homme femme") decritQL(" SEXE ",sx, "homme femme",TRUE) ucfirst("poisson") # renvoie Poisson (donc en initiale majuscule) allQT(vins,nomcol,unites) allqtdbf("chu825qt",chaineEnListe("G/l UI/l mmo/l mug/l % mg/dl an")) allQTdf(vinsdata) compPourc(" Prop Hom/Fem ",10,80,30,70) acpFacteur("LEA par genre",leaqt,lea["genre"]) allCalcQT("AGE dans ELF",ag,"ans") xls2dar("elf.xls") strlen("oui") # renvoie 3 violinplotQT("les AGES (elf)",age) vvar(age) triCroiseSansMarges("SEXE",sexe,m_sexe,"ETUDES",etud,m_etud) triCroise("SEXE",sexe,m_sexe,"ETUDES",etud,m_etud) triCroise("SEXE",sexe,m_sexe,"ETUDES",etud,m_etud,TRUE) triCroise("SEXE",sexe,m_sexe,"ETUDES",etud,m_etud,TRUE,"sex_etu.png") triAPlats() traceTcr("SEXE",sexe,m_sexe,"ETUDES",etud,m_etud) traceQL("SEXE",sexe,m_sexe) traceCor("Exportations de vins","Royaume-Uni",UK,"hl",Allemagne de l'Ouest",RFA,"hl") traceLin("Royaume-Uni",UK,"Allemagne de l'Ouest",RFA) tailleEchProp(0.169,4) tailleEchProp(0.169,4,0.10) tailleEchMoy(0.64,0.25) tailleEchMoy(0.64,0.25,0.10) paste("A",surncarg(10,"B"),"C",sep="") # renvoie "A B C" donc avec 10 espaces entre "B" et "C" surncarg(8,"VINS") sinksource("demoQT") loiNormale <- simule(0,1,500) scr(1) scr(2) scr(4) rch_VE("AGE",age,"ans") print10(elfdata) plotQTdet("variable AGE dans le dossier Elf",ag,"ans") plotQTdet("variable AGE dans le dossier Elf",ag,"ans",TRUE) histQL("variable SEXE dossier Elf",sexe,m_sexe) plotQL("variable SEXE dossier Elf",sexe,m_sexe) compMoyData( "AGE Elf vs AGE Titanic","AGE Elf", age_elf, "AGE Titanic",age_titanic ) compMoyData("AGE versus SEXE dossier Elf","Hommes",ah,"Femmes",af) cv(age) ect(age) tmp() histoQT("EXPORTATION de VIN",uk,"hectolitres") histoQT("AUTRE EXPORTATION de VIN",rfa,"hl","RFA.PNG",maxhist=0.45,rug=FALSE) lea <- lit.dar("lea.dar") elf <- lit.dar("http://www.info.univ-angers.fr/~gh/Datasets/elf.dar") elf <- lit.dar("K:/Stat_Ad/elf.dar") # en salle G101 à la Fac ti <- lit.dar.lh("titanic.dar") ; print( str(ti) ) vi <- lit.dar.lh("vins.dar") ; print( str(vi) ) tita <- lit.dar.wd("titanic.dar") ; print( str(tita) ) vins <- lit.dar.wd("vins.dar") ; print( str(vins) ) data <- lit.dat("elf.dat") # un simple read.table avec head=FALSE et row.names=1 antal <- lit.dbf("antal.dbf") ; print( str(antal) ) bete.zola <- lit.texte("bete.txt") allQLnonum(elfdata,c(1,4),c("SEXE","ETUDES")) anaTcr("SEXE",sexe,c("hommes","femmes"),"ETUDES",etud,m_etud) as.sigcode(0.2) as.sigcode(0.02) as.sigcode(0.002) as.sigcode(0.0002) numeroteId(iris) antal <- lit.xls("data.xls") ; print( str(antal) ) library(ROCR) ; vauroc <- auroc(qlbin,yPredites) bendist(vinsdata) vvar(v) # variance empirique, correspond à var(v)*(length(v)-1)/(length(v)) clusterCorTrans( vinsData ) # penser aussi à clusterCor( vinsData ) clusterCor( vinsData ) # penser aussi à clusterCorTrans( vinsData ) col.names( maMatrice ) colMins( vinsData ) colMedians( vinsData ) colMaxs( vinsData ) ect( v ) # écart-type empirique : correspond à sd(v)*sqrt( (length(v)-1)/(length(v))) library(beanplot) ; beanplotQT("ROYAUME UNI",uk) library(beanplot) ; bbpQT("ROYAUME UNI",uk) bestValAssoc(0.3) nchar( ghtrim(" abc ") ) # renvoie 3 car on ne garde que "abc" # on peut aussi utiliser library(gdata) # pour la fonction trim plus officielle duree( bete.zola <- lit.texte("bete.txt") ) duree( fonction1() ) duree( fonction2() ) gr("figure1.png") gr("figure2.png",largeur=800,hauteur=600) ecrit.dar(monDataFrame,"donnees.dar") ecrit.df(monDataFrame,"donnees.dar") # au format .dar ! ecrit.xls(monDataFrame,"donnees.csv") # au format .csv, pas .xls ecrit.csv(monDataFrame,"resultats.csv") ecrit.dac(monDataFrameDac,"export") boxplotQT("ROYAUME UNI",uk) exprimeDuree(tempsAvant, now() ) ; # utilise lubridate catln("hello") allQLm(matriceSEXE_FUMEUR,c("homme femme","oui non")) analyseCoefficientsModeleLogistique(maf4) debutHtml() decritClass(hclust(mdist,method="ward")) decritClass(hclust(mdist,method="single")) anared(donnesBinaires) approximations() approxPoissNorm(2,15,8) approximationPoissonnienne(titre="Haukka",effectifs=haukka,ymax=30) approximationBinomiale(titre="Haukka",effectifs=haukka,ymax=30) asc("abcABC") charToNum("abcABC") # renvoie c(97,98,99,65,66,67) chr( c(65,66,67,10) ) # renvoie "ABC\n" attends() attends("ok pour continuer ?") head(bestCor(ma[,chaineEnListe(ch2)])) cah2co(titre="CAH lignes",coordata=coo,graphique=TRUE,coulCAH=coulClass[leaqt46[,"leacl"]],vcex=0.4,vadj=0) bc <- bestCor(ma) cadreCah2co() plot(dataFibrose,col=couleursMetavir(),main="Fibrose") catn() cats("Niveau 1") # écrit Niveau puis le souligne et saute une ligne cats("Niveau 1a","-") cats("Niveau 2a",".") cdr(uk) cdrn(scoreBINAIRE,0,1) coefficientsRLB(dataNASH) catss("Lecture du data frame") # produit un encadré autour de Lecture avec des + et des == col2fact( dataLarg) corClust(vinsData) # et ce n'est pas clusterCor( vinsData ) corClust(vinsData) # et ce n'est pas clusterCorTrans( vinsData ) couleursMetavir() # couleurs standard pour article cd("~/Tmp") cd("W:/Temp") chaineEnVectNum("12 18 50 35 1 68") # renvoie c(12,18,50,35,1,68) couleurs_metaf() cpt("bete.txt candide.txt","maison temps train") mat[,2] <- reformate( mat[,2] ) # remplit avec le symbole_ à droite decritModeleLogistiqueBinaire(dfMeilleurModele) decritModeleLogistiqueBinaire(dataNashDB,details=TRUE) ; # fourni le seuil 0.7 decritModeleLogistiqueBinaire(dataNashDB,details=TRUE,seuil=0.7,autreData=autreDB,titreAutreData="série 2") print( round(coefficientsRLB(dataMc,0.05),4) ) acp(titre="LEA, 45 variables",matdata=leaqt46[,-1],stat=1,nbfac=-1) acp(titre="LEA, 45 variables",matdata=leadata,stat=1,nbfac=3,out=c("var"),bestctr=25) acp(titre="LEA, 30 variables",matdata=leaqtg6[,-1],stat=0,nbfac=4,out="var",bestctr=-1) acpFacteur(titre="Malah418",dataMatrix=maQT,facteur=metavirQL,listeCouleurs=coulmeta) acpFacteur(titre="Malah418",dataMatrix=maQT,facteur=metavirQL,listeCouleurs=coulmeta,plan=c(1,2)) leacp <- PCA(leaqtg7,graph=FALSE,ind.sup=711:722,quali.sup=1) ; acpl <- acpLoadings(leacp) leaqtMoy <- addClassMeans( leaqt46 ) lesData <- ajusteNomsColonnes(dataMatrix) adt <- analexies( lit.texte("essai.txt") ) ch1 <- lesVariables(ma[,-c(1,3)]) # pour modelesRLB() ch2 <- "fcs dFIB aSTsTOT mEPAISp nPONT pNODUL pRECTIn" # pour modelesRLB() ch3 <- "fcs dFIB mEPAISp nPONT pNODUL pRECTIn" # pour modelesRLB() vdc <- c(ch1,ch2,ch3) # pour modelesRLB() modelesRLB(titre="MALAH-FCS",df=ma, vectChaines=vdc,base="RLBFCS",maxdec=3,tbc=4) noask() # du coup, plus de Tapez pour voir le graphique suivant : cb(names(monDF)) cb(names(laMatrice)) panel.cor() # volontairement non décrit panel.cor2() # volontairement non décrit panel.corpvalue() # volontairement non décrit panel.pointsreg() # volontairement non décrit cb(names(unVecteur)) # car print(t(unVecteur))) ne fait pas ce qu'on pense... modelesCLMMetavir(titre="MALAH-Metavir",facteurMeta=metafQL,df=ma, vectChaines=vdc,base="CLMMETAF",maxdec=3,best=5) modelesFDAMetavir(titre="MALAH-Metavir",df=ma, vectChaines=vdc,base="QDAMETAF",maxdec=3,best=4) modelesLDAMetavir(titre="MALAH-Metavir",df=malda, vectChaines=lesVarsLda,base="LDA_MALAH416_",maxdec=3,best=1) modelesMDAMetavir(titre="MALAH-Metavir",df=ma, vectChaines=ch4,base="meilleur MDA",maxdec=3,best=1,pointsQt=FALSE,pointsMeta=TRUE, barresPred=FALSE) modelesQDAMetavir(titre="MALAH-Metavir",df=ma, vectChaines=ch4,base="meilleur MDA",maxdec=3,best=1,pointsQt=FALSE,pointsMeta=TRUE, barresPred=FALSE) modelesRLIMetavir(titre="MALAH-Metavir",df=ma, vectChaines=ch4,base="Meilleur RLI ",maxdec=3,best=1,pointsQt=TRUE,pointsMeta=FALSE,barresPred=FALSE)