Valid XHTML     Valid CSS2    

Révision R à l'I.N.R.A., novembre 2014

 

Le but de ces deux demi-journées de révision est d'installer R, Rstudio et Rcmdr sur les portables de l'INRA puis de vérifier que vous arrivez à réaliser les premières manipulations et calculs statistiques simples sur vos données à vous. On trouvera donc ici à la fois des considérations conceptuelles et des informations techniques, le tout devrait permettre de savoir réaliser concrétement des petites analyses et des tracés graphiques simples tout en sachant s'adapter et progresser seul(e). La programmation R ne sera pas abordée mais on montrera comment écrire et exécuter des petits scripts (ensembles de commandes).

Pour que cette page soit facile à lire et à relire, tout est présenté sous forme de questions et réponses.

 

Table des matières cliquable

  1. Installation de R

  2. Installation de Rstudio

  3. Installation de Rcmdr

  4. Lecture de fichiers Excel

  5. Utilisation de l'aide

  6. Gestion de packages

  7. Calculs en colonnes

  8. Réalisation de graphiques

  9. Lecture de fichiers-texte

10. Création de variables

11. Fusion de données

12. Calculs par sous-groupes

13. Automatisation de commandes

 

Il est possible d'afficher toutes les solutions via ?solutions=1 et de les masquer avec ?solutions=0.

 

1. Installation de R

Comment installer R sur un portable ?

Solution :  

 

2. Installation de Rstudio

Faut-il installer Rstudio ? Si oui, comment faire pour l'installer ?

Solution :  

 

3. Installation de Rcmdr

Faut-il installer Rcmdr ? Si oui, comment faire pour l'installer ?

Et comment l'utiliser ensuite ? Faut-il l'utiliser dans RStudio ou en dehors de RStudio ?

Solution :  

 

4. Lecture de fichiers Excel

Comment lire le fichier Excel exemple1.xls qui ne contient qu'une feuille de calcul ?

Comment lire la deuxième feuille de calcul du fichier Excel exemple2.xls ?

On essaiera de réaliser les lectures avec et sans Rcmdr, dans l'ordre qui vous parait le plus simple.

Est-ce plus compliqué avec des fichiers .xlsx comme exemple3.xlsx et exemple4.xlsx ?

Solution :  

 

5. Utilisation de l'aide

trouver de l'aide et de la documentation sur les fonctions de R  ? Et sur les packages ?

Où trouver de l'aide sur Rcmdr ? Et sur Rstudio ? En français ?

Solution :  

 

6. Gestion de packages

Comment installer un package, comme le package beanplot ?

Et si un package requiert d'autres packages, comment faire pour l'installer ?

Comment charger en mémoire un package ? Et comment le retirer de la mémoire ? Comment lister les objets d'un package dont les données d'exemples du package ? Comment obtenir l'aide sur un package ?

Solution :  

 

7. Calculs en colonnes

Comment calculer les moyennes pour les trois premières colonnes quantitatives du fichier Excel her.xls puis trier ces moyennes par ordre décroissant ?

Le détail des données Health Exam Results est à l'adresse HER.

On pourra commencer par utiliser Rcmdr avant d'écrire une solution qui ne passe pas par des clic-souris.

Solution :  

 

8. Réalisation de graphiques

Comment tracer des boxplots pour la colonne AGE en fonction de la colonne SEXE dans le fichier Excel nommé exemple1.xls ?

On essaiera d'utiliser d'abord Rcmdr puis R en direct.

Solution :  

 

9. Lecture de fichiers-texte

Comment lire les fichiers-texte exemple3.txt et exemple4.txt ?

On essaiera d'utiliser d'abord Rcmdr puis R en direct.

Solution :  

 

10. Création de variables

Comment créer une variable à partir d'autres variables, par exemple la surface à partir de la longueur et de la largeur ? Ou le BMI qui est le rapport masse/(taille*taille) ? Comment discrétiser une variable, par exemple pour avoir "jeune" si l'age est inférieur à 30 et "vieux" sinon ? Comment découper en 4 classes si on connait les bornes des classes ?

Solution :  

 

11. Fusion de données

Je dispose de deux tableaux de données et je voudrais les fusionner. Quelles sont les fonctions R correspondantes ?

Solution :  

 

12. Calculs par sous-groupes

Comment effectuer des calculs et des rapports par sous-groupes ? Par exemple, comment effectuer des calculs sur l'age globalement puis pour les hommes seulement et enfin pour les femmes seulement ? Et pour des sous-échantillons plus techniques comme les femmes de plus de 40 ans dont la taille est inférieure à 180 cm ?

Solution :  

 

13. Automatisation de commandes

Je dispose de plusieurs fichiers Excel comme fic1ser1.xls, fic2ser1.xls et fic3ser1.xls ou de plusieurs feuilles de calcul dans le même fichier Excel comme f07s1, f08s1, f09s1, f10s1, f11s2, f12s2 et f13s2 dans le fichier series.xls. Comment automatiser le traitement de ces fichiers par exemple pour afficher le nombre de lignes de données dans chaque fichier ?

Solution :  

 

 

 

retour gH    Retour à la page principale de   (gH)