Guillaume Louvel

Evolutionary genomics & bioinformatics

TP de biostatistiques L3 - Cytomegalovirus humain

Aujourd’hui, j’exhume un TP de biostatistiques sous R que j’avais préparé en 2019 pour les étudiants de Licence de biologie, qu’il aurait été dommage de ne pas partager. Je le mets donc à disposition sous licence CC-BY-NC-SA 4.0.

Le jeu de donnée est adapté de :

Stockdale, Lisa et al. (2019). Data from: Human cytomegalovirus epidemiology and relationship to tuberculosis and cardiovascular disease risk factors in a rural Ugandan cohort [Dataset]. Dryad. https://doi.org/10.5061/dryad.d1k17

Attention, je l’ai modifié, et en particulier j’ai dû fabriquer de toute pièce la colonne TB (tuberculose) qui manquait, afin que ça donne le résultat attendu ;). Le script qui m’a servi a modifier le jeu de données est accessible ici: Stockdale2018_analysis.R, et le jeu de données transformé ici: projet_HCMV.csv.

Le TP demande de maîtriser les bases des statistiques fréquentistes paramétriques (test de Student, ANOVA, corrélation de Pearson, Chi²) ou non (test de Kruskal-Wallis, corrélation de Spearman, test de Fisher).

Par contre le programme des licences ne comportait pas la régression linéaire. Ce jeu de donnée s’y prête bien, c’est d’ailleurs ce qui a été utilisé dans l’article original, donc libre à vous de l’adapter au besoin ;)

Le TP: projet_HCMV.pdf