Projet de programmation en Master 1 Informatique
(année 2016/2017)
Développement d'un pipeline de mesure de distances phylogénétiques à partir de génomes complets
Présentation du projet
Il s'agit d'un projet proposé par l'INRA d'Angers, équipe EmerSys.
Le texte de la proposition de stage est dans le fichier sujet_ANI_KMERpar.doc.
Le pipeline, à écrire de préférence en PERL, doit permettre de :
- calculer des ANI (Average Nucleotide Identity) entre génomes bactériens. Voir l'article PMC4256179 pour plus de détails.
- calculer des pourcentage de Kmers partagés. Voir le wiki anglais sur la notion de k-mer.
- fournir des représentations graphiques en arbres et nuages de points via le logiciel R.
En fin de stage, ce pipeline sera intégré à une plate-forme Galaxy.
Retour à la page principale de (gH)