Valid XHTML     Valid CSS2    

 

Module de Biostatistiques,

partie 1

Ecole Doctorale Biologie Santé

gilles.hunault "at" univ-angers.fr

      

 

Enoncés pour la séance numéro 2 (solutions)

  1. Nous avons vu à la séance précédente que deux composantes du résumé statistique d'une QT sont souvent la moyenne et la médiane. Quels autres indicateurs sont utilisés dans le tableau 1 de l'article Ratziu et al (2006) ? Comment choisir entre moyenne et médiane ? Et entre sd et se ? Quel graphique pour les QT est utilisé dans la figure 2 ? Est-il disponible sous Excel ? Et en R ?

    Quels calculs et analyses sont présents dans les articles fournis par les doctorants au 03 avril 2019 ? Et pour les années précédentes ?

    Quels livres peut-on lire pour s'initier rapidement et en français à R ?

  2. Coment lit-on des données-texte en R ? Quelles sont les options-possibles ? Et si les données sont au format Excel ? Ou en CSV ? Et en DBF ? Et des données de puces à ADN au format Genepix (fichiers .gpr) ? Comment lit-on des données-texte avec statgh.r ? Quelles instructions permettent alors d'accéder aux lignes ? Aux colonnes ? Comment choisir des groupes d'individus ? De colonnes ? Comment trier une colonne ? Une matrice suivant une colonne donnée ?

    Application :

    Après avoir exécuté la commande data(iris), conserver les 4 premières colonnes de données puis ajouter une ligne en haut des données avec les moyennes de chaque colonne. On pourra lire l'aide sur la fonction apply.

  3. Une fois calculés la moyenne et l'écart-type de l'échantillon, comment en déduit-on la moyenne et l'écart-type de la population sous-jacente ? Pourquoi dit-on que ces valeurs sont des estimations ponctuelles ?

  4. Comment écrit-on les intervalles fermés en mathématiques ? Tout intervalle fini peut-il être écrit comme un intervalle centré ?

  5. Dans les calculs d'estimation, la marge d'erreur E est souvent donnée par une formule du modèle suivant :

    non su

    A l'aide d'une telle formule, quelle valeur de n doit-on utiliser pour avoir une valeur de E inférieure ou égale à une précision donnée ?

    Comment en déduit-on la taille d'échantillon minimale sachant la précision sur une proportion ?

    Comment en déduit-on la taille d'échantillon minimale sachant la précision sur une moyenne ?

  6. A quoi servent les intervalles de confiance ? Comment les calcule-on en mathématiques ?

    Et avec R ? Comment calcule-t-on en R les tailles minimales d'échantillons pour une précision donnée ?

  7. Une des fameuses expériences de G. Mendel montrait que pour une certaine lignée de pois, 428 avait des gousses vertes et 152 des gousses jaunes. Quelle est la proportion de pois à gousses jaunes ? Quel est l'intervalle de confiance de cette proportion ? Une discussion détaillée de l'estimation pour une proportion, avec ces mêmes données se trouve dans le chapitre 3 de l'ouvrage Biostatistique pour les sciences de la vie et de la santé de Marc TRIOLA et Mario TRIOLA, éditions Pearson.

  8. Si on doit faire une enquête auprès de femmes françaises pour savoir si elles ont des problèmes digestifs le matin, après le petit déjeuner, combien faut-il interroger de femmes pour avoir une erreur de moins de "4 points" ? Ce nombre serait-il différent si on interrogeait des femmes américaines ? On pourra supposer qu'il y en gros 65 millions de Français et 310 millions d'Américains.

    Et si une enquête précédente avait indiqué qu'on sait que la proportion de femmes avec problèmes digestifs le matin, après le petit déjeuner, est de 0,169 aurait-on une taille d'échantillon différente ? Plus grande ? Plus petite ? Et surtout, pourquoi ?

  9. La détermination du taux d'urée sanguin sur un échantillon de 100 individus d'une population donnée a conduit à une somme de 4000 mg/l et à une somme des carrés de 166336 (mg/l)^2. Estimer la moyenne et l'écart-type de la population sous-jacente. Estimer ensuite la variance et l'écart-type de la moyenne. Donner également l'intervalle de confiance à 95 % puis à 99 % du taux d'urée. L'intervalle à 99 % est-il plus grand ou plus petit que celui à 95 % ? Pourquoi ? (exercice de J.-B. Hardouin).

    La solution statistique (sans utiliser R) est ici : il s'agit de l'exercice II.

  10. Si on admet que l'écart-type de la pression artérielle chez l'être humain est de 10 mmHg, quelle taille d'échantillon faut-il utiliser si on veut connaitre la moyenne avec une précision de "5 points" ? Cet exercice est adapté d'un exercice du chapitre 22 de l'ouvrage Biostatistique, une approche intuitive d'Harvey Motulsky, éditions De Boeck Université. On pourra utiliser la page tailles d'échantillons.

  11. Comment fonctionne un test d'hypothèse ? Quels sont les tests possibles ? A quoi faut-il faire attention avant d'appliquer un test ?

    Application :

    Après avoir exécuté la commande data(iris), commenter les résultats de la commande t.test(iris[,1]).

    Ouvrages cités (images cliquables) :

    statr                         triola                          motulsky

 

 

retour gH    Retour à la page principale de   (gH)