Introduction non élémentaire au logiciel R
Session de formation en 4 fois 3 heures.
gilles.hunault "at" univ-angers.fr
Le but de cette formation de 4 demi-journées est de présenter l'éventail des possibilités de R et d'apprendre à se servir de R à un niveau élémentaire de façon à être autonome sur les premières manipulations et calculs statistiques simples et à pouvoir progresser seul(e). L'accent sera mis la capacité à réaliser des manipulations en "routine" sans trop de clic-souris et sur la production de documents (texte et graphiques) pour rapports et publications.
On trouvera donc ici à la fois des considérations conceptuelles et des informations techniques, le tout devrait permettre de savoir réaliser concrétement des analyses et des tracés graphiques tout en sachant s'adapter et progresser seul(e). La programmation R ne sera pas abordée mais on montrera comment écrire et exécuter des scripts (ensembles de commandes). Les packages de BioConductor et plus généralement ceux liés à la bioinformatique seront évoqués.
Horaire probable des séances pour l'école doctorale MathSTIC en 2020
(les cours ont lieu dans la salle G101 de la faculté des sciences d'Angers)
Séance Date Horaire Séance 1 / 4 jeudi 07 mai 2020 14 h à 17 h Séance 2 / 4 jeudi 14 mai 2020 14 h à 17 h Séance 3 / 4 mercredi 20 mai 2020 14 h à 17 h Séance 4 / 4 mercredi 27 mai 2020 14 h à 17 h
Séance 1
- découverte de R, installation et système d'aide ; - structures de données, fonctions et packages, bioconductor ; - avantages et inconvénients de R ; - manipulations élémentaires dont lectures de fichiers ; - comparaison des différentes interfaces pour R dont Rcmdr et Rkward ; - R versus les autres logiciels statistiques, cours en ligne en français.
Séance 2
- répertoires, scripts et fonctions (gH), listes et vecteurs ; - lecture de fichiers textes, bureautique et gestion des accents ; - récupération de tableaux XHTML ; - filtrage, regroupement et fusion de données ; - structures de données, conversion et export en HTML et LaTeX ; - gestion des données manquantes ; - non présentation (!) des packages base, gdata, tools, foreign et utils.
Séance 3
- types de graphiques et philosophie des graphiques en R ; - tracé de points, de courbes et gestion des options (axes, couleurs...) ; - superposition de graphiques, histogrammes et "boxplots", export de graphiques en PNG et PDF ; - configuration de R et des graphiques ; - non présentation (!) des packages graphics, beanplot, lattice, grid, plotrix et ggplot ; - bibliographie des graphiques en R.
Séance 4
- rappels sur les indicateurs (moyenne, médiane...) et leur usage ; - calculs statistiques par série, par groupes, tris à plat et tris croisés ; - exemples de régression (linéaire, logistique...) et d'analyse de variance ; - export de tableaux de résultats en PDF avec Sweave ; - non présentation (!) du package stats.
Conclusion
Ce passage en revue montre que R est un logiciel extrêmement riche de possibilités, que ce soit au niveau de la gestion de données, des calculs, statistiques ou non, des graphiques, de la production automatique de rapports et d'articles. Et encore, la programmation n'a pas été abordée, ni l'écriture de packages, ni l'automatisation de traitements. C'est pourquoi deux autres sessions de formation sont prévues : une pour le rappel des méthodes statistiques par la pratique à l'aide de R (avec un peu de programmation au passage) et une pour la programmation avancée. Ce qui est présenté ici est suffisant théoriquement pour suivre ces formations. En pratique, si vous n'utilisez pas régulièrement R, ces formations seront un peu difficiles à suivre...
Avant d'utiliser R à la Faculté des Sciences d'Angers, consultez la note locale sur R.
Retour à la page principale de (gH)