TP de biostatistiques L3 - Cytomegalovirus humain
Aujourd’hui, j’exhume un TP de biostatistiques sous R
que j’avais préparé en
2019 pour les étudiants de Licence de biologie, qu’il aurait été dommage de ne
pas partager. Je le mets donc à disposition sous licence CC-BY-NC-SA 4.0.
Le jeu de donnée est adapté de :
Stockdale, Lisa et al. (2019). Data from: Human cytomegalovirus epidemiology and relationship to tuberculosis and cardiovascular disease risk factors in a rural Ugandan cohort [Dataset]. Dryad. https://doi.org/10.5061/dryad.d1k17
Attention, je l’ai modifié, et en particulier j’ai dû fabriquer de toute pièce
la colonne TB
(tuberculose) qui manquait, afin que ça donne le résultat
attendu ;). Le script qui m’a servi a modifier le jeu de données est accessible
ici: Stockdale2018_analysis.R
, et le
jeu de données transformé ici: projet_HCMV.csv
.
Le TP demande de maîtriser les bases des statistiques fréquentistes paramétriques (test de Student, ANOVA, corrélation de Pearson, Chi²) ou non (test de Kruskal-Wallis, corrélation de Spearman, test de Fisher).
Par contre le programme des licences ne comportait pas la régression linéaire. Ce jeu de donnée s’y prête bien, c’est d’ailleurs ce qui a été utilisé dans l’article original, donc libre à vous de l’adapter au besoin ;)
Le TP: projet_HCMV.pdf