Projets de programmation en Master 1 Informatique
K-mers et génomes bactériens (stage INRA rémunéré)
- analyse du programme SIMKA.
- analyse du mode et temps de calculs de matrices d'écarts et du stockage des résultats.
- développement de scripts de calcul, mise à jour et extraction.
Il faut cliquer sur une année pour voir le sujet correspondant.
Développement d'une interface de recherche et visualisation pour des données en chimie moléculaire et quantique
- création d'une base de données pour recenser des analyses de molécules en chimie quantique.
- mise en place d'une interface intuitive de recherche multi-critères dans cette base données.
- choix de visualisations optimisées (pov ?, jpg ?, viewmol ?, jsmol ?) pour consulter les analyses.
Développement d'un pipeline de mesure de distances phylogénétiques à partir de génomes complets
-- Stage de bioinformatique à l'INRA d'Angers --
Le pipeline, à écrire en PERL, doit permettre de :
- calculer des ANI (Average Nucleotide Identity) entre génomes bactériens. Voir l'article PMC4256179 pour plus de détails.
- calculer des pourcentage de Kmers partagés. Voir le wiki anglais sur la notion de k-mer.
- fournir des représentations graphiques en arbres et nuages de points via le logiciel R.
En fin de stage, ce pipeline sera intégré à une plate-forme Galaxy.
Caractérisations de groupes de génomes bactériens ou fongiques via des palindromes communs
Ecriture d'un ensemble de fonctions php ET perl pour :
- calculer le PGPCS (plus grand palindrome non constant commun spécifique) d'un groupe de génomes.
- déterminer les PGPCS pour les rangs taxonomiques de génomes bactériens, fongiques et humains.
Analyseur syntaxique et nouvelles cibles de traduction pour GALG
Ecriture d'un analyseur syntaxique multi-passes pour détecter les erreurs de syntaxe et expliciter l'erreur.
Ajout des langages Python, Ruby, Php, Javascript dans le traducteur d'algorithmes.
Palindromes communs à des groupes de génomes bactériens
Ecriture d'un ensemble de fonctions php (ou perl) pour calculer :
- le plus grand palindrome non constant d'une chaine de caractères,
- le plus grand palindrome non constant commun à un ensemble de chaines de caractères.
Production de seqlogos généralisés
Ecriture d'une page Web pour tracer des seqlogos généraux :
- pour une chaine de caractères quelconque,
- pour plusieurs chaines avec un affichage permettant la comparaison.
Plus-grandes sous-séquences de caractères qui...
Ecriture d'un ensemble de fonctions php (puis perl) pour calculer
- la plus grande sous-chaine constante,
- la plus grande sous-séquence constante avec un caractère donné,
- la plus grande sous-séquence commune répétée...
Amélioration des bases de données LEAPdb et sHSPdb :
- ajout du module MULTALIN (alignement multiple de séquences) ;
- import des coordonnées 3D via la RSCS PDB (protéines data bank) ;
- ajout de fonctions pour calculer des distances entre acides aminés dans une protéine...
Cliquer sur le bouton de l'année pour le détail du projet.
Retour à la page principale de (gH)