Valid XHTML     Valid CSS2    

Introduction à la programmation R (exercices)

Séance 7 : Programmation soutenue

                     gilles.hunault "at" univ-angers.fr

 

Table des matières cliquable

  1. Arbres et graphes en R

  2. Tableaux associatifs et dictionnaires

  3. Alignements, phylogénie, analyse d'images

  4. Gènes différentiellement exprimés et clustering

  5. Elimination de variables transitivement corrélées

 
Il est possible d'afficher toutes les solutions via ?solutions=1 et de toutes les masquer avec via ?solutions=0.

 

1. Arbres et graphes en R

Comment définit-on des arbres et des graphes en R ?

Application : générer les structures et reproduire les graphiques suivants.

non su non su

Pour le graphe, la liste des arcs est dans le fichier list_arcs.txt ; pour l'arbre, on peut utiliser le format de dot, soit le fichier arbre.dot.txt.

Solution :  

 

2. Tableaux associatifs et dictionnaires

Comment construire les dictionnaires alphabétiques et fréquentiels d'un texte en R ? On utilisera des tableaux associatifs où les clés sont les mots et les valeurs leur nombre d'occurrences.

Application : analyser les deux premiers chapitres du Candide de Voltaire disponibles dans le fichier candide.txt.

Solution :  

 

3. Alignements, phylogénie, analyse d'images

Comment lit-on des séquences Fasta en R ? Comment les aligne-t-on (qu'est-ce ?) ? Comment en construit-on une phylogénie (qu'est-ce ?) ?

Application : aligner les protéines de la classe 3 de la LEADPB et en donner un arbre phylogénétique. Où est le problème ? On pourra utiliser le fichier classe3.fasta.

Solution :  

 

4. Gènes différentiellement exprimés et clustering

Quel est le lien entre R et BioConductoR ?

Comment fait-on pour trouver les gènes différentiellement exprimés issus d'un séquençage ?

Solution :  

 

5. Elimination de variables transitivement corrélées

Il arrive qu'on ait un tableau de données avec beaucoup de colonnes quantitatives. En statistiques, on apprend à ne pas conserver des variables trop ressemblantes ("corrélées"). Ecrire une fonction qui à partir d'un tableau de données trouve les groupes de variables qui se ressemblent transitivement (si A ressemble à B et B ressemble à C, alors A ressemble à C) et qui ne conserve qu'une variable par groupe.

Application : essayer de définir des groupes de variables pour les données 710x46.dar.

Solution :  

 

 

Code-source php de cette page. Retour à la page principale du cours.

 

 

retour gH    Retour à la page principale de   (gH)