Valid XHTML     Valid CSS2    

Statistiques élémentaires avec le logiciel R

-- Session de formation continue pour l'université d'Angers --

Exercices du module 4

 

Table des matières cliquable

  1. Chameau ou dromadaire ?

  2. Rédiger au vu des résumés numériques

  3. Analyse par sous-groupe

  4. Tracer et colorier pour mieux comprendre

  5. Analyse conjointe et régression linéaire

  6. Mots barbares : skewness et kurtosis

 

Il est possible d'afficher toutes les solutions via ?solutions=1 et de les masquer via ?solutions=0.

 

1. Chameau ou dromadaire ?

Représenter graphiquement la variable AGE pour les données odetab. La distribution est-elle unimodale (une bosse) ou bimodale (deux bosses) ?

Que peut-on en déduire sur le calcul de la médiane ou de la moyenne pour ces données d'age ?

Solution :  

 

2. Rédiger au vu des résumés numériques

On s'intéresse à des valeurs d'AGE pour des personnes. Peut-on commenter directement les résultats numériques ci-dessous :


     Variable AGE, dossier HERS     
     n=2763 moy=66.65 med=67 ect=6.65 iqr=10 cdv=10% iqrr=15% min=44 max=79 pdv=35     
          
     Variable AGE, dossier ELF     
     n=99 moy=35.83 med=29 ect=17.55 iqr=26.5 cdv=49% iqrr=91% min=11 max=78 pdv=67     
          
     Variable AGE, dossier TRIOLA     
     n=80 moy=34.35 med=32 ect=13.18 idr=18.75 cdv=38% iqrr=59% min=12 max=73 pdv=61     
          
     Variable AGE, dossier ODETAB     
     n=27 moy=41.41 med=32 ect=22.61 iqr=41 cdv=54% iqrr=128% min=19 max=78 pdv=59     
          
     Variable AGE, dossier FIBROSE     
     n=1011 moy=45.42 med=43.3 ect=12.50 iqr=17.25 cdv=28% iqrr=40% min=8.3 max=79.0 pdv=7.07     
          

Peut-on penser que, pour une petite série de données, connaitre la moyenne et l'écart-type permet de se faire une bonne idée des données ? Par exemple, comment sont distribuées les données avec les valeurs suivantes :


      Taille                  11      valeurs     
      Moyenne                7.5      UI     
      Ecart-type             2.0      UI     
      Coef. de variation      26      %     
          

Solution :  

 

3. Analyse par sous-groupe

Il est très classique d'avoir à effectuer des calculs sur des variables QT restreintes à des sous-groupes définis par des variables QL, comme l'étude de l'age par sexe, ou le taux de réussite à un test en fonction du degré de pathologie. Comment réaliser cela avec R et Rstudio ?

Application : étudier l'AGE en fonction du SEXE dans le dossier ELF.

Solution :  

 

4. Tracer et colorier pour mieux comprendre

En plus de calculer, il est souvent bon de représenter graphiquement les données, y compris par sous-groupe. Quelles sont les possibilités offertes par R et Rstudio dans ce domaine ?

Application : essayer de trouver des représentations adaptées et coloriées pour l'AGE en fonction du SEXE dans le dossier ELF ou pour les données RONFLE.

Solution :  

 

5. Analyse conjointe et régression linéaire

Décrire conjointement les variables QT du dossier RONFLE.

Solution :  

 

6. Mots barbares : skewness et kurtosis

Lorsqu'on décrit numériquement une variable quantitative, certains auteurs utilisent les deux indicateurs numériques skewness et kurtosis. Comment les calcule-t-on et à quoi servent-t-ils ?

Solution :  

 

 

       retour au plan de cours  

 

 

retour gH    Retour à la page principale de   (gH)