Listing du fichier proj_m1_2018.php
00001
00002 <?php
00003 # # (gH) -_- proj_m1_2018.php ; TimeStamp (unix) : 07 Février 2019 vers 11:11
00004
00005 include("../../std.php") ;
00006
00007 $an1 = 2018 ;
00008 $an2 = $an1 + 1;
00009 debutPage("Projets en Master 1 Informatique an $an1/$an2","strict") ;
00010 debutSection() ;
00011 pvide() ;
00012
00013 h1("Projet de programmation en Master 1 Informatique") ;
00014 h1("(année $an1/$an2)") ;
00015 pvide() ;
00016 h1("K-mers et génomes bactériens","gvert") ;
00017 pvide() ;
00018
00019 blockquote() ; # section
00020
00021 ########################################################################################################################
00022
00023 h2("Présentation informelle") ;
00024
00025 ########################################################################################################################
00026
00027 blockquote() ;
00028
00029 p("texte") ;
00030 echo " Le centre INRA d'Angers aimerait calculer des indices d'écart et des distances entre de nombreux génomes, " ;
00031 echo " comme par exemple le pourcentages de K-mers partagés 2 à 2. Il existe déjà un programme qui réalise ce genre de calculs : " ;
00032 echo " Simka v1.4 (GATB tools). A titre indicatif, le temps de calcul pour une matrice 1 000 x 1 000 est de 2 heures " ;
00033 echo " sur un serveur Power Edge R510 avec 2 processeurs Intel Xeon Quad-Core E5620 2,26 GHz. " ;
00034 finp() ;
00035
00036 p("texte") ;
00037 echo " La difficulté du projet est qu'il faudrait calculer tous ces écarts et distances " ;
00038 echo " pour les 150 000 génomes bactériens disponibles actuelllement (soit 600 Go) et " ;
00039 echo " qu'il faudrait envisager une mise à jour annuelle ou pluri-annuelle car il semble qu'en 2019 de 20 000 à 80 000 génomes sont rajoutés par an." ;
00040 finp() ;
00041
00042 finblockquote() ;
00043
00044 ########################################################################################################################
00045
00046 h2("Objectif du stage") ;
00047
00048 ########################################################################################################################
00049
00050 blockquote() ;
00051
00052 p("texte") ;
00053 echo " Le ou la stagiaire devra commencer par bien réfléchir au mode et au temps de calcul (par bloc de 2 x 100 x 100 ou ??), au stockage des données " ;
00054 echo " et des résultats, sachant qu'un matrice 150 000 x 150 000 ne tient pas en mémoire et qu'on n'aura pas besoin de toute la matrice à chaque fois " ;
00055 echo " ni de stocker des calculs symétriques. Il faudra donc réaliser une analyse fine détaillée et bien rédigée à faire valider après une série de tests " ;
00056 echo " avant procéder aux « vrais calculs ». " ;
00057 finp() ;
00058
00059 p("texte") ;
00060 echo " Il y a de fortes chances qu'une fois les distances calculées, on n'ait besoin que des génomes les plus proches, soit en pourcentage de K-mers partagés, soit via un nombre " ;
00061 echo " donné de génomes, d'un génome donné. Il faudra donc écrire en plus des scripts de calcul et du script de mise à jour un script d'extraction. " ;
00062 finp() ;
00063
00064 p("texte") ;
00065 echo " Ce stage est rémunéré." ;
00066 finp() ;
00067
00068 finblockquote() ;
00069
00070 ########################################################################################################################
00071
00072 h2("Contacts") ;
00073
00074 ########################################################################################################################
00075
00076 blockquote() ;
00077
00078 p("texte") ;
00079 echo " Martial BRIAND, ".em("martial.briand@inra.fr") ;
00080 finp() ;
00081
00082 p("texte") ;
00083 echo " Gilles HUNAULT, ".em("gilles.hunault@univ-angers.fr").". " ;
00084 finp() ;
00085
00086 finblockquote() ;
00087
00088 ########################################################################################################################
00089
00090 pvide() ;
00091
00092 p() ;
00093 echo href("montresource.php?nomfic=proj_m1_2018.php","Code-source de la page","orange_stim nou")."." ;
00094 finp() ;
00095
00096 ##############################################################################
00097
00098 finblockquote() ; # section
00099 finSection() ;
00100 finPage() ;
00101 ?>
Pour ne pas voir les numéros de ligne, ajoutez &nl=non à la suite du nom du fichier.
Retour à la page principale de (gH)