Valid XHTML     Valid CSS2    

Cours CMI / M1 Données - séance 3

 

Résumé de la séance 3

L'affichage et la visualisation de données issues de mapping se font plus facilement avec des outils adaptés, comme par exemple le logiciel R avec ses nombreux packages et fonctions.

 

1. Le logiciel R

Il est possible, non pas de présenter le logiciel R mais de donner un aperçu de ce qu'il est en quelques minutes. Pour preuve, notre courte page  R15 .

En ce qui concerne les possibilités graphiques de R, une fois notre page réalisation de graphiques élémentaires en R parcourue, issue de notre cours introduction non élémentaire à R, feuilleter le site R graph gallery devrait être suffisant.

On retiendra notamment les fonctions de tracé élémentaires nommées plot, barplot, hist, et les compléments indispensables nommés title, legend, points, abline.

2. Affichages et calculs sur vecteurs et matrices en R

On pourra se contenter de lire la page introduction à R séance 1 pour avoir une idée des structures de données et des possibilités de calcul et de formatage en R.

3. Visualisation de matrices issues de mapping en R

Notre cours numéro 5 à l'école doctorale, session Biostatistiques avancées contient sans doute ce qu'il faut comme information sur ces visualisations alors que la partie 4 de notre cours BioInformatique pour le Master BTV contient, en plus des visualisations des calculs adaptés aux puces à ADN.

4. Questions/réponses pour tester vos connaissances

Question 4.1

On se sert ici du rapport BGI fourni par Madame LANDES. Voici le code R pour générer les données de la page 4 :


     reads <- c( 112820 , 174694, 2424006, 47928168 )
     

Calculer les pourcentages correspondants et afficher ces pourcentages avec divers graphiques en R.

Reproduire aussi la figure 22 page 19 dont les données sont ci-dessous :


     up   <- c( 389 , 637 , 1136 )
     down <- c( 999 , 281 ,  205 )
     

Question 4.2

Quelle fonction de R permet de tracer un graphique comme la figure 5 page 8 ?

Question 4.3

Quelle(s) fonction(s) de R permettent de tracer des graphiques comme pour les figures 12 et 13 page 14 ?

Question 4.4

Est-il facile selon vous de produire en R des sorties factorielles comme la figure 14 page 15 ? Et pour les boxplots de la figure 15 page 15 ?

Question 4.5

On voudrait réaliser un script Bash nommé boxplot.sh qui produit, pour un fichier texte donné, le boxplot de la colonne 2 en fonction des modalités de la colonne 3, la colonne 1 étant un identificateur. Voici des exemples d'appel (via un alias) et les graphiques à produire. Les fichiers de données sont accessibles par wget.


     $gh> boxplot lea.dar
     
     $gh> boxplot elfgh.txt
     
non su non su

Solutions :    afficher les solutions  

 

Cliquer  ici  pour revenir à la page de départ des cours CMI / M1.

 

 

retour gH    Retour à la page principale de   (gH)