Valid XHTML     Valid CSS2    

 

Projet de programmation en Master 1 Informatique

(année 2015/2016)

 

Production de seqlogos généralisés

 

Présentation du projet

Classiquement, un seqlogo est un graphique qui représente l'abondance locale des des 4 lettres A, T, G et C pour une séquence d'ADN comme l'image ci-dessous :

non su

On voudrait étendre ce genre de graphique (en mode global et non local) à des séquences d'acides aminés, à des textes quelconques écrits en français, en anglais... et fournir aussi plusieurs seqlogos les uns sous les autres pour comparer visuellement les abondances de lettres...

Détails du projet

On viendra écrire en PHP une page Web qui propose une interface adaptée aux types de chaines de caractères utilisées. Ainsi pour des séquences d'ADN on pourra ajouter ou non l'affichage du GC contents, pour les séquences protéiques on pourra afficher soit les acides aminés soit les combinaisons classiques d'acides aminés (voir par exemple la page analysis. On fournira en plus des images les tableaux de comptage correspondants.

L'utilisateur devra pouvoir fournir une, deux, trois... n chaines de caractères ou fichiers-textes concernant les séquences. On veillera à ce que le programme s'exécute rapidement.

Il n'est pas sans doute pas indispensable de construire des classes d'objets PHP pour réaliser le projet et on pourra donc se contenter de fonctions. On respectera le style de codage de G. HUNAULT pour la syntaxe des fonctions PHP, voir par exemple std.php.

On prévoira des options globales de tri de l'affichage (tri par ordre alphabétique des lettres, par ordre d'occurences...).

Lorsque plusieurs chaines sont fournies, il serait intéressant de disposer de résultats statistiques indiquant si les distributions des comptges sont significativement différentes ou non.

Données à traiter

Toute chaine de carcatère peut être utilisée.

On trouvera sur la page 1055genomes.php des fichiers qui contiennent des séquences d'ADN bactériens. La page sHSP affiche de nombreuses séquences d'acides aminés et sur la page analexies il y a de exemples de textes français et anglais.

On pourra mettre des boutons générant rapidement ces exemples dans l'interface afin de pouvoir tester rapidement l'affichage.

Code-source de la page.

 

 

retour gH    Retour à la page principale de   (gH)