Valid XHTML     Valid CSS2    

Explications sur le programme MOCAR

Accueil     Aide

 

Voici quelques définitions pour mieux comprendre ce que fait ce programme.

Une classe de séquences est un ensemble de séquences Fasta avec une même fin numérique d'identifiant repérées par le symbole _ ("underscore" ou "souligné") suivi d'un numéro de classe. Ainsi >Seqa_1 et >Seqb_1 font partie de la même classe 1 alors que >Autre_2 fait partie de la classe 2.

Si vous n'avez pas de classe (pas de symbole _en fin d'identifiant) ou si vous voulez que toutes les séquences soient considérées comme faisant partie d'une seule et même classe, il suffit de cocher l'option découverte.

Une sous-chaine commune d'une classe est une suite de caractères consécutifs présente dans toutes les séquences de la classe. Une sous-suite est une succession de sous-chaines séparées par des caractères non communs.

Dans les sorties du programme, les sous-chaines et sous-suites sont nommées motifs. Le symbole @ (arrobase) indique un seul caractère non commun et Le symbole * (étoile) représente plusieurs caractères non communs consécutifs.

Contraintes du programme

Un numéro de classe ne doit pas être nul ou négatif. Par contre, les numéros de classe n'ont pas besoin de se suivre et n'ont pas besoin de commencer à 1. Ainsi dans l'exemple 2 il n'y a pas de classe 1, les séquences commencent par une classe 5, viennent ensuite des séquences de classe 2...

Rappel : en cas d'utilisation du mode découverte il n'y a pas besoin d'avoir de numéro de classe, donc tout fichier Fasta peut être utilisé par MOCAR.

Une séquence se compose d'un identifiant et d'une chaine d'acides aminés. L'identifiant commence par > (symbole supérieur), suivi d'un nombre quelconque de caractères. Les acides aminés doivent commencer sur la ligne suivante et peuvent s'étendre sur plusieurs lignes, comme dans l'exemple 2. On peut écrire en minuscule ou majuscule les acides aminés, avec les lettres ACDEFGHIJKLMNPQRSTVWY seulement. On ne peut donc pas utiliser MOCAR pour des alignements, ni avec la lettre X.

Description des exemples

Exemple 1

On dipose de deux classes, chacune avec 3 séquences. La classe 1 a une même partie centrale PAPATANGACHARLYE qui est donc une sous-chaine commune non dégénérée. De même, la classe 2 a comme sous-chaine commune non dégénérée EASYCAMPANY.

En mode découverte, on voit que PA est une sous-chaine commune globale non dégénérée. On remarquera que PA est répété pour la classe 1.

Exemple 2

On a deux classes, la classe 2 (3 séquences) et la classe 5 (4 séquences). La classe 2 est caractérisée par deux sous-chaines communes non dégénérées EASYT et CAMPANY. La classe 5 est caractérisée par trois sous-chaines communes PAPA, TANGA@CHARLIE et SE, dont la deuxième est dégénérée (ce qui est indiqué par le symbole @) .

En mode découverte, on voit qu'il y a une sous-chaine commune globale dégénérée A@A et une sous-chaine commune globale non dégénérée AN.

Une lecture attentive des séquences permet de comprendre que AN est l'intersection de CAMPANY et TANGA@CHARLIE alors que A@A ne correspond à rien de déjà vu pour la classe 5. (Pour la classe 2, A@A fait partie de PAPA).

 

Réalisation des pages Web :

(gH) à partir du projet en «Licence Pro.» de Julien DUMORTIER, Sylvain ARRACHART, Vincent MAHÉO, Nicolas CHARTIER. Année 2012.

Le programme C++ nommé MOCAR a été conçu par Philippe GALINIER.

Quelques exemples réels résolus :

leadb830  ; shsp2424  ; LEADB classe 8 : NPN unique  ; double NPN  ; NPN unique et double NPN.

Sources

Code-sources : de cette page (php)   ;   du javascript utilisé.

 

 

 

retour gH    Retour à la page principale de   (gH)