Valid XHTML     Valid CSS2    

GREBA 210611 : taille de fenêtre d'analyse ; bioikseml

Partie un : taille de fenêtre d'analyse de séquences

A priori, un seul acide aminé, voire même un seul nucléotide suffit à faire une différence, comme le montre la définition d'un SNP, d'où les sites dbSNP et SNPedia. En ce sens, on pourrait donc dire que la taille minimale en analyse de séquences d'acides aminés est donc de 1/3 puisqu'il faut 3 codons pour faire un acide aminé, ou plutôt de 1/2 si on suit la règle du wobble connue depuis 1996 (Crick). Toutefois, ce n'est pas une valeur particulière qui est intéressante, mais un ensemble de valeurs successives présentant des valeurs similaires (toutes fortes, toutes faibles...) qu'on appréhende selon la technique de calcul nommée moyenne glissante ou mobile. Un exemple de visualisation est fourni par le site du calcul du FoldIndex : sélectionner par exemple CALD_CHICK comme séquence et essayer des fenêtres de taille 10 et 50 :

findex_calc_10       findex_calc_50

Il y a deux concepts importants derrière la notion de fenêtre : le premier est celui d'une étude locale de proche en proche (plutôt que partielle) de la séquence, par opposition à un calcul global sur l'ensemble de la séquence. Le second est celui de la prise en compte de de la «séquentialité» des acides aminés. Ainsi MASQQERQQLDARAR n'est pas AAADELMQQQQRRRS (même si tous les calculs effectués sur l'ensemble de la chaine donnent les mêmes valeurs car ce sont les mêmes acides aminés mis par ordre alphabétique) ni QQMASERQQLRARAD (alors qu'il s'agit des mêmes acides aminés mais dans un ordre différent). En gros, local et ordonné versus global et invariant par permutation.

Voici quelques tailles de fenêtres trouvées sur Internet :                      

deplie Tailles 13 et 17

deplie Tailles 9 et 19

deplie Tailles 9 à 21

deplie Taille 11

deplie Tailles 5 à 7 et 19 à 21

deplie Taille optimale

deplie Taille 7 à 10 et 6 à 7

deplie Petites et grandes tailles

deplie Taille variable

deplie Tailles 13, 14, 17 et 20

deplie Taille 30

deplie Tailles de 3 à 21

deplie Tailles 6 à 8

deplie Taille 17

deplie Taille 20

Partie deux : bioikseml

Le site bioikseml qui se prononce comme BioXML est développé par J. M. RICHER et facilite la conversion de séquences Fasta en fichiers XML. De plus, il permettra à terme de compléter ces fichiers.

 

bioikseml

Sites sans doute en rapport avec Knowledge Semantics Extraction et bioinformatique :

                          

 

                    retour à la page principale du GREBA

 

 

retour gH    Retour à la page principale de   (gH)