Listing du fichier stim2010_2.php
00001 <?php
00002 # (gH) -_- stim2010_2.php ; TimeStamp (unix) : 28 Mai 2010 vers 18:12
00003 include("std.php") ;
00004 debutPage("Entrées, sorties, XML et statistiques 2/2","","stim2010.css","stim2010.js") ;
00005 debutSection() ;
00006 ###################################################################
00007
00008 h1("Entrées, sorties, XML et statistiques","strict") ;
00009 blockquote() ;
00010 h2(href("../../../","gilles.hunault \"at\" univ-angers.fr","gvert")) ;
00011 finblockquote() ;
00012
00013 h1("Partie 2/2 : ") ;
00014 blockquote() ;
00015 h1("Statistiques : calculs, graphiques et automatisation ","gbleuf") ;
00016 finblockquote() ;
00017
00018 $tableauDesRubriques = array() ;
00019 $idr = 0 ;
00020 $idr++; $tableauDesRubriques[$idr] = "Pourquoi les statistiques ?" ;
00021 $idr++; $tableauDesRubriques[$idr] = "Les statistiques au secours de l'intuition" ;
00022 $idr++; $tableauDesRubriques[$idr] = "Les statistiques contre l'intuition" ;
00023 $idr++; $tableauDesRubriques[$idr] = "Vers une pratique rationnelle automatisée des statistiques" ;
00024 $tdmCRLM = new tdm($tableauDesRubriques) ;
00025 $tdmCRLM->titre() ;
00026 $tdmCRLM->menu("oui","oui") ;
00027
00028 ###################################################################
00029
00030 $tdmCRLM->afficheRubrique("oui") ; # Pourquoi les statistiques ?
00031
00032 ###################################################################
00033
00034 blockquote() ;
00035
00036 p("texte") ;
00037 echo "De nombreux chercheurs commettent l'erreur de croire que d'exécuter des programmes suffit pour décider " ;
00038 echo " si une méthode est meilleure qu'une autre, qu'un temps d'exécution ".b("moyen")." inférieur permet " ;
00039 echo " de conclure, qu'un meilleur ".b("pourcentage")." d'instances résolues sont un argument absolu. " ;
00040 echo " Ce que montrent les statistiques, c'est que la prise de décision est beaucoup plus complexe : 2 est " ;
00041 echo " toujours plus petit que 3, mais 2 n'est pas toujours plus petit que 3 ".b("de façon significative")."." ;
00042 finp() ;
00043
00044 p("texte") ;
00045 echo "De plus, la moyenne n'est pas toujours le meilleur résumé de la tendance centrale : la médiane est parfois " ;
00046 echo " un indicateur plus ".b("adapté")." ; de même la dispersion absolue ou relative ne s'exprime pas " ;
00047 echo " systématiquement via l'écart-type et le coefficient de variation car on utilise également " ;
00048 echo " la distance inter-quartiles et l'écart inter-quartiles relatif." ;
00049 finp() ;
00050
00051 p("texte") ;
00052 echo "Enfin, la comparaison (rigoureuse) de données suppose un modèle théorique de la distribution des différences. " ;
00053 echo " Suivant les données, le modèle est paramétrique ou non paramétrique. Utiliser un test statistique incorrect " ;
00054 echo " aboutit forcément à un résultat inacceptable scientifiquement." ;
00055 finp() ;
00056
00057 p("texte") ;
00058 echo "On trouvera dans la page " ;
00059 echo href("../../pourquoi.htm","pourquoi.htm") ;
00060 echo " d'autres arguments en faveur d'une utilisation systématique des statistiques dans un cadre de recherche." ;
00061 finp() ;
00062
00063 finblockquote() ;
00064
00065 ###################################################################
00066
00067 $tdmCRLM->afficheRubrique("oui") ; # Les statistiques au secours de l'intuition
00068
00069 ###################################################################
00070
00071 blockquote() ;
00072
00073 p("texte") ;
00074 echo "Une première utilisation des statistiques est la ".b("description")." des données. " ;
00075 echo " On pourra comparer le fichier de données brutes ".href("../../../Idas/Ccd/ralsto_phv2.dac","ralphv2.dac") ;
00076 echo " à sa description numérique, visuelle et graphique disponible à l'url " ;
00077 echo href("../../../Idas/Ccd/ralsto_phv2_ccd.htm","ralsto_phv2_ccd.htm","ralphv2.htm") ;
00078 echo " et réfléchir à l'intérêt du ".href("../../../Idas/Ccd/classifgrp.php?fic=ralsto_phv2","dendrogramme associé")."." ;
00079 finp() ;
00080
00081 p("texte") ;
00082 echo "Les statistiques descriptives, avec leur lot d'indicateurs numériques et de représentations graphiques, " ;
00083 echo " forment un ensemble riche et cohérent d'outils pour synthétiser, résumer, schématiser les colonnes de données. " ;
00084 echo " Après avoir compris la notion de ".href("../../variables.htm","variable statistique") ;
00085 echo " et ses trois types principaux (les variables qualitatives, " ;
00086 echo " les variables quantitatives et les variables textuelles), il faut s'entrainer à produire rapidement les " ;
00087 echo " tableaux de caractéristiques et les «matrices» de graphiques afin de passer du temps à l'interprétation des " ;
00088 echo " résultats :" ;
00089 finp() ;
00090
00091 # mettre un tableau genre allQt et les iris de Fisher en R avec couleur
00092 # prévoir lien sur les beanplot et boxplot ?
00093 table(0,30) ;
00094 tr() ;
00095 td() ;
00096 $url = "../../../Bism/bismtd.php?n=3&m=s#res" ;
00097 $tab = "../../../Bism/tab.png" ;
00098 echo href($url,img($tab,"tabres","300")) ;
00099 fintd() ;
00100 td() ;
00101 $img1 = "../../../Datasets/iris.gif" ;
00102 echo href($img1,img($img1,"iris","225")) ;
00103 fintd() ;
00104 td() ;
00105 $img2 = "../../../Bism/lea_acp1.png" ;
00106 echo href($img2,img($img2,"leadb","300")) ;
00107 fintd() ;
00108 fintr() ;
00109 fintable() ;
00110
00111 p("texte") ;
00112 echo "Nos " ;
00113 echo href("../edacrs.php?n=1&m=e","exercices") ;
00114 echo " du cours numéro 1 pour l'ecole doctorale Biologie Santé et leurs " ;
00115 echo href("../edacrs.php?n=1&m=s","solutions").", " ;
00116 echo " bien qu'appliqués à des données biostatistiques, devraient être un rappel suffisant " ;
00117 echo " de ces statistiques descriptives et permettre de réaliser des " ;
00118 echo href("../../reperes.htm","analyses statistiques élémentaires")."." ;
00119 finp() ;
00120
00121 # graphique : anscombe
00122
00123 finblockquote() ;
00124
00125 ###################################################################
00126
00127 $tdmCRLM->afficheRubrique("oui") ; # Les statistiques contre l'intuition
00128
00129 ###################################################################
00130
00131 blockquote() ;
00132 p("texte") ;
00133 echo "Afin de comparer scientifiquement de moyennes, des médianes, des fréquences, voire des " ;
00134 echo " distributions, il faut maitriser la théorie et surtout la pratique des tests statistiques, " ;
00135 echo " ce qui permet d'éviter l'erreur suivante : " ;
00136 echo em("2 est proche de 3 et 3 est proche de 4, donc 2 est proche de 4. ") ;
00137 echo " Si c'était vrai, alors par transitivité, 2 serait proche de l'infini ! " ;
00138 echo " Seul un chercheur naïf peut penser que 15 % est proche de 20 % sans faire référence à " ;
00139 echo " la taille de l'échantillon ou à celle de la population sous-jacente. Ce que permet la " ;
00140 echo " la théorie des tests statistiques, c'est de quantifier de telles différentes et d'utiliser non " ;
00141 echo " seulement les moyennes (respectivement les pourcentages) mais aussi les variances (respectivement " ;
00142 echo " les tailles d'échnatillon. Ce qui explique les conclusions des formules : 5 % de différence pour " ;
00143 echo " une taille de 40, ce n'est pas la même chose que pour une taille de 2000. De même, deux " ;
00144 echo " moyennes proches de 50 et séparées de 2 avec des variances de l'ordre de 3 ne sont pas «proches» " ;
00145 echo " de la même façon que si leur variances valent 30. " ;
00146 finp() ;
00147
00148 p("texte") ;
00149 echo "On trouvera " ;
00150 echo href("../../comppct.php","ici") ;
00151 echo " et " ;
00152 echo href("../../compmoy.php","là") ;
00153 echo " des formulaires pour tester ces affirmations, le détail des formules étant fourni par le document " ;
00154 echo " nommé " ;
00155 echo href("../../formules.pdf","formules.pdf") ;
00156 echo " ; un ensemble de calculs statistiques classiques par page Web est " ;
00157 echo href("../../calcstat.htm","ici")." et, plus généralement, notre page " ;
00158 echo href("../../statgen.htm","statgen")." contient de nombreux liens et documents pour les statistiques." ;
00159 finp() ;
00160
00161 finblockquote() ;
00162
00163 ###################################################################
00164
00165 $tdmCRLM->afficheRubrique("oui") ; # Vers une pratique rationnelle des statistiques
00166
00167 ###################################################################
00168
00169 blockquote() ;
00170 p("texte") ;
00171 echo "Une fois passé le cap de l'apprentissage de base pour les statistiques descriptives et inférentielles, " ;
00172 echo " l'automatisation des calculs, de la gestion des entrées et des sorties ne pose aucun problème pour un " ;
00173 echo " programmeur : le logiciel R par exemple se compose principalement d'un langage de programmation " ;
00174 echo " facile à apprendre et très complet : les objets, définis par des " ;
00175 echo href("http://cran.r-project.org/doc/contrib/Genolini-PetitManuelDeS4.pdf","classes «S4»") ;
00176 echo " et les nombreux " ;
00177 echo href("http://cran.r-project.org/web/packages/",em("packages")) ;
00178 echo " fournissent tout ce dont un chercheur en informatique a besoin (gratuitement)." ;
00179 echo " R s'interface facilement avec un serveur Web. On peut par exemple essayer de copier/coller " ;
00180 echo " le texte suivant dans ".href("http://pbil.univ-lyon1.fr/Rweb/Rweb.general.html","Rweb")." pour s'en rendre compte : " ;
00181 finp() ;
00182
00183 pre_fichier("iris.rent","cadrebleu") ;
00184
00185 p("texte") ;
00186 echo "R peut aussi être appelé par un programme Php, comme dans le cas de notre page " ;
00187 echo href("../../aqt_det.php","aqt_det.php")."." ;
00188 echo " Enfin, la liaison ".b(aname("dynamique","Sweave"))." avec LaTeX est assurée par Sweave. Pourquoi " ;
00189 echo " s'en priver ? Utilisez le formulaire ci-dessous pour une démonstration :" ;
00190 finp() ;
00191
00192 blockquote() ;
00193 form("stim_sweave.php") ;
00194 fieldset("fieldsetGH") ;
00195 legende("Saisie des données pour la démonstration de Sweave","legendeGH") ;
00196 table(0,10) ;
00197
00198 tr() ;
00199 td() ;
00200 echo "Données : " ;
00201 fintd() ; td() ;
00202 listeSelectFromTxt("data","elf iris") ;
00203 fintd() ;
00204 fintr() ;
00205
00206 tr() ;
00207 td() ;
00208 echo "Nombre de lignes (ou * pour toutes) : " ;
00209 fintd() ; td() ;
00210 input_text("nbl","*") ;
00211 fintd() ;
00212 fintr() ;
00213
00214 tr() ;
00215 td() ;
00216 echo "Vos initiales : " ;
00217 fintd() ; td() ;
00218 input_text("initia","?") ;
00219 fintd() ;
00220 fintr() ;
00221
00222 tr() ;
00223 td("C") ;
00224 input_submit("envoyer","envoyer","orange_pastel") ;
00225 fintd() ;
00226 fintr() ;
00227
00228 fintable() ;
00229 finfieldset() ;
00230 finform() ;
00231 finblockquote() ;
00232
00233 p("texte") ;
00234 echo "Dans le cadre de programmes de recherche orientés déduction ou ne nécessitant pas de calculs " ;
00235 echo " statistiques sophistiqués, la production automatique de documents (à défaut d'être ";
00236 echo " dynamique comme avec Sweave) est souvent réalisée à l'aide de scripts, le plus souvent en " ;
00237 echo href("../../../tuteurs/tutperl.htm","perl") ;
00238 echo " ou en " ;
00239 echo href("../../../tuteurs/tutphp.htm","php")."." ;
00240 echo " Voici quatre exemples de script : " ;
00241 finp() ;
00242
00243 blockquote() ;
00244 debutdl() ;
00245 dt(s_span(href("montresource.php?nomfic=titre.pl","titre.pl"),"grouge")) ;
00246 dd("création d'une page de titre (PS) ; exemple de résultat : ".href("../../../tuteurs/titre.pdf","titre.pdf")) ;
00247 dt(s_span(href("montresource.php?nomfic=alldsc.pl","alldsc.pl"),"grouge")) ;
00248 dd("génération de listes triées de fichiers en RTF pour Word ; exemple de résultat : ".href("../../../Farcompr/alldsc.rtf","alldsc.rtf")) ;
00249 dt(s_span(href("montresource.php?nomfic=alldsc.php","lesdsc.php"),"grouge")) ;
00250 dd("génération de listes triées de fichiers en CSV pour Excel ; exemple de résultat : ".href("../../../internet/alldsc.csv","alldsc.csv")) ;
00251 dt(s_span(href("montresource.php?nomfic=emarge.pl","emarge.pl"),"grouge")) ;
00252 dd("liste d'émargement ; exemple de résultat : ".href("lstemarge.pdf")." ; fichier d'entrée : ".href("eda.txt")) ;
00253 findl() ;
00254 finblockquote() ;
00255
00256 finblockquote() ;
00257
00258 ###################################################################
00259
00260 p() ;
00261 echo s_span("Codes-sources ","gvert")." : " ;
00262 echo " de cette ".href("montresource.php?nomfic=stim2010_2.php","page","bleu nou") ;
00263 echo " ; " ;
00264 echo " de " .href("montresource.php?nomfic=aqt_det.php","aqt_det.php","bleu nou") ;
00265 echo " ; " ;
00266 echo " de " .href("montresource.php?nomfic=progstat.php","progstat.php","bleu nou") ;
00267 echo " ; " ;
00268 echo " de " .href("montresource.php?nomfic=statuno.php","statuno.php","bleu nou") ;
00269 echo " ; " ;
00270 echo " du ".href("demosweave.nw.txt","code Sweave","bleu nou") ;
00271 echo "." ;
00272 finp() ;
00273
00274
00275 ###################################################################
00276
00277 $rets = b("Liens")." : " ;
00278 $rets .= href("stim2010.php","retour à l'exposé") ;
00279 $rets .= copies(" ",3)." ; " ;
00280 $rets .= copies(" ",3) ;
00281 $rets .= href("stim2010_1.php","partie 1/2")." " ;
00282 $rets .= "(entrées, sorties, XML et statistiques)." ;
00283
00284 ###################################################################
00285
00286 echo $rets ;
00287
00288 finSection() ;
00289 finPage() ;
00290 ?>
Pour ne pas voir les numéros de ligne, ajoutez &nl=non à la suite du nom du fichier.
Retour à la page principale de (gH)