MOCAR : Recherche de motifs caractéristiques
dans des classes de séquences Fasta
Le programme MOCAR permet de rechercher des sous-séquences communes (sous-chaines, sous-suites, pures ou dégénérées...) d'acides aminés au sein de classes de séquences FASTA. Plus...
Voici quelques définitions pour mieux comprendre ce que fait ce programme.
Une classe de séquences est un ensemble de séquences Fasta avec une même fin numérique d'identifiant repérées par le symbole _ ("underscore" ou "souligné") suivi d'un numéro de classe. Ainsi >Seqa_1 et >Seqb_1 font partie de la même classe 1 alors que >Autre_2 fait partie de la classe 2.
Si vous n'avez pas de classe (pas de symbole _en fin d'identifiant) ou si vous voulez que toutes les séquences soient considérées comme faisant partie d'une seule et même classe, il suffit de cocher l'option découverte.
Une sous-chaine commune d'une classe est une suite de caractères consécutifs présente dans toutes les séquences de la classe. Une sous-suite est une succession de sous-chaines séparées par des caractères non communs.
Dans les sorties du programme, les sous-chaines et sous-suites sont nommées motifs. Le symbole @ (arrobase) indique un seul caractère non commun et Le symbole * (étoile) représente plusieurs caractères non communs consécutifs.
Vous pouvez cliquer sur la bouée en haut de page ou ici pour avoir plus d'explications et sur ce que calcule le programme pour les exemples fournis. Fermer les explications...
Réalisation des pages Web :
(gH) à partir du projet en «Licence Pro.» de Julien DUMORTIER, Sylvain ARRACHART, Vincent MAHÉO, Nicolas CHARTIER. Année 2012.
Le programme C++ nommé MOCAR a été conçu par Philippe GALINIER.
Quelques exemples réels résolus :
leadb830 ; shsp2424 ; LEADB classe 8 : NPN unique ; double NPN ; NPN unique et double NPN.
Code-sources : de cette page (php) ; du javascript utilisé.
Retour à la page principale de (gH)