Module de Biostatistiques,
partie 2
Ecole Doctorale Biologie Santé
gilles.hunault "at" univ-angers.fr
Les dates de formation sont ici.
Enoncés pour la séance numéro 1 solutions
Qu'est-ce qu'une régression en général ? Que signifient les sigles RL, RLINS, RLOB, RLM ?
Quelles sont les grandes étapes d'une régression ?
Quand parle-t-on de corrélation ?
Quand parle-t-on de causalité et pourquoi dit-on que «corrélation n'est pas causalité» ?
Y a-t-il plusieurs types de corrélation ? Et des tests statistiques associés ?
Quelles sont les propriétés mathématiques d'une corrélation linéaire parfaite, soit |ρp|=1 ?
Pourquoi parle-t-on de transitivité faible de la propriété de corrélation ?
Qu'est-ce qu'une ANOVA, une ANCOVA ? Et une AOV ?
On dit «partout» qu'il y a un lien entre ANOVA et RLIN. Pourquoi ?
Avant de réaliser une analyse de variance, une régression, il est usage d'analyser et de décrire les variables. Comment réalise-t-on cela ? Avec quel vocabulaire ?
Que signifie par exemple les termes symétrique, lepto-kurtique, right skewed, équidistribuée pour une distribution ? Y a-t-il des tests statistiques associés ?
Application :
Décrire les variables du dossier sommeil animal. On pourra utiliser notre fichier de données en copie locale qui en est une version légèrement aménagée.
Il est conseillé de commencer par décrire les variables qualitatives qui sont moins nombreuses que les quantitatives.
Certaines analyses statistiques requièrent que les variables soient normales, symétriques, centrées, réduites... Quels tests et quelles transformations classiques réalise-t-on pour cela ? Quelles variables transformées sont en corrélation parfaite avec la variable originale ?
Ecrire une fonction en R nommée centrerVar() pour centrer une variable, puis une fonction nommée reduireVar() pour réduirer une variable. Comment fait-on alors pour centrer et réduire une variable ? Obtient-on des variables en corrélation parfaite avec la variable originale ? Comment appliquer ces fonctions à un ensemble de colonnes d'un data frame ? Quelle est la «vraie» fonction R pour effectuer ces transformations ?
Que faut-il faire pour tester qu'une moyenne est égale à zéro ? Qu'une variance est égale à 1 ?
Que sont les transformations de Box-Cox et de Box-Tidwell ?
Application :
Faut-il transformer la variable NIDS du dossier chenilles ? Si oui, quelle(s) transformation(s) faut-il effectuer ?
Faut-il transformer les variables du dossier sommeil animal (copie locale) ? Si oui, quelle(s) transformation(s) faut-il effectuer ?
Fournir un data frame issu des variables QT de ces données avec des variables centrées et réduites.
Comment réalise-t-on une régression linéaire en R ? Et une régression logistique ?
Comment effectuer une ANOVA, une AOV, une ANCOVA en R ? Quel est le rapport avec un test t de Student ?
Comment effectuer des calculs de corrélation en R ? Quels sont les tests associés ? Quel est le rapport entre la corrélation de Pearson et celle de Spearman ?
Quels livres permettent de se remettre rapidement en mémoire les notions élémentaire de BioStatistique ? Quels ouvrages spécialisés traitent de la régression en BioStatistique ? Quels ouvrages pour R sont à lire en général, puis pour la régression ? Et quels packages R faut-il connaitre ?
Décrire et éventuellement transformer les variables SBPglucose, exercice, drinkany, BMI, diabetes et age des données hersdata.xls de l'ouvrage Regression Methods in Biostatistics.
Retour à la page principale de (gH)