Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le...

16
Extrait de la publication

Transcript of Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le...

Page 1: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

puq.ca

3489D-Couvert caisse O.indd 2-4 12-06-06 09:51

Extrait de la publication

Page 2: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

Extrait de la publication

Page 3: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

Extrait de la publication

Page 4: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

Prévoir l’imprévisible

biostatistiqueUne introdUction à la

Extrait de la publication

Page 5: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

La Loi sur le droit d’auteur interdit la reproduction des œuvres sans autorisation des titulaires de droits. Or, la photocopie non autorisée – le « photocopillage » – s’est généralisée, provoquant une baisse des ventes de livres et compromettant la rédaction et la production de nouveaux ouvrages par des professionnels. L’objet du logo apparaissant ci-contre est d’alerter le lecteur sur la menace que représente pour l’avenir de l’écrit le développement massif du « photocopillage ».

Presses de l’Université du Québec Le Delta I, 2875, boulevard Laurier, bureau 450, Québec (Québec) G1V 2M2 Téléphone : 418 657-4399 − Télécopieur : 418 657-2096 Courriel : [email protected] − Internet : www.puq.ca

Diffusion / Distribution :Canada : Prologue inc., 1650, boulevard Lionel-Bertrand, Boisbriand (Québec) J7H 1N7

Tél. : 450 434-0306 / 1 800 363-2864

France : Sodis, 128, av. du Maréchal de Lattre de Tassigny, 77403 Lagny, France Tél. : 01 60 07 82 99

Afrique : Action pédagogique pour l’éducation et la formation, Angle des rues Jilali Taj Eddine et El Ghadfa, Maârif 20100, Casablanca, Maroc – Tél. : 212 (0) 22-23-12-22

Belgique : Patrimoine SPRL, avenue Milcamps 119, 1030 Bruxelles, Belgique – Tél. : 02 7366847

Suisse : Servidis SA, Chemin des Chalets, 1279 Chavannes-de-Bogis, Suisse – Tél. : 022 960.95.32

Mem

bre

de

Extrait de la publication

Page 6: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

Raluca BalanGilles lamothe

Prévoir l’imprévisible

biostatistiqueUne introdUction à la

Traduit par didier alexandre Bilodeau

Extrait de la publication

Page 7: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

Catalogage avant publication de Bibliothèque et Archives nationales du Québec et Bibliothèque et Archives Canada

Balan, Raluca M.

Prévoir l’imprévisible : une introduction à la biostatistique

Traduction de : Expect the Unexpected : A First Course in Biostatistics

Comprend des réf. bibliogr.

ISBN 978-2-7605-3489-6

1. Biométrie - Manuels d’enseignement supérieur. 2. Sciences naturelles - Méthodes statistiques. 3. Probabilités. 4. Statistiques. I. Lamothe, Gilles, 1971- . II. Titre.

QH323.5.B3414 2012 570.1’5195 C2012-940887-5

2012-1.1 – Tous droits de reproduction, de traduction et d’adaptation réservés © 2012 Presses de l’Université du Québec

Traduction de Expect the Unexpected : A First Course in Biostatistics, 2011, World Scientific Publishing, ISBN 978-981-4291-32-3.

Dépôt légal – 3e trimestre 2012 Bibliothèque et Archives nationales du Québec / Bibliothèque et Archives Canada Imprimé au Canada

Les Presses de l’Université du Québec reconnaissent l’aide financière du gouvernement du Canada par l’entremise du Fonds du livre du Canada et du Conseil des Arts du Canada pour leurs activités d’édition.

Elles remercient également la Société de développement des entreprises culturelles (SODEC) pour son soutien financier.

Mise en pages : Gilles LamotheCouverture : Michèle Blondeau Traduction : Didier Alexandre Bilodeau

Extrait de la publication

Page 8: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

Preface

Des chercheurs ont essaye pendant plusieurs annees de decouvrir le sens

des derniers mots de Hamlet : �Tout le reste est silence ?� dans la piece de

theatre de Shakespeare. Dans un film de 2007 du meme titre, dans la ville de

Bucharest en 1911, un acteur age de 19 ans decide de devenir un realisateur

de film (un reve utopique a l’epoque), apres qu’il realise que le cinema peut

sauvegarder la magie des performances de theatre pour l’eternite. Ce livre

fut cree du desir de trouver une reponse a la meme question, a laquelle nous

faisons face a la fin de chaque semestre lorsque nous terminons d’enseigner

un cours. Serait-il possible de sauvegarder, pour des generations futures

d’etudiants, certaines parties de l’atmosphere vibrante de la salle de classe

et de leur partager cette experience incroyable ?

Ce manuscrit fut developpe par les auteurs des notes de cours pour le

cours MAT 2779 �Introduction a la biostatistique� (et le cours equivalent

MAT 2778 �Probabilites et statistique pour les sciences naturelles�), qui

furent enseignes a l’Universite d’Ottawa depuis 2003 jusqu’a present. Pen-

dant ces annees, ces notes ont constamment evoluees et ont ete enrichies

avec plus d’exemples, un processus qui continuera sans doute au cours des

annees a venir. Cependant, la plupart des exemples qui sont inclus dans

ce livre sont nouveaux et n’ont pas ete utilises en salle de classe avant

maintenant.

Sauf si une source d’information specifique est mentionnee, tous les

exemples du livre utilisent des donnees hypothetiques. Les exemples sont

habituellement bases sur une situation de la vie quotidienne, qui est

connectee d’une facon tres simple aux sciences naturelles. Des donnees

generees par des logiciels sont evitees, et les resultats de simulations ne

sont pas discutes.

Extrait de la publication

Page 9: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

viii Prevoir l’imprevisible – Une introduction a la biostatistique

Le but de ce livre est d’introduire et d’explorer l’utilite de di-

verses methodes statistiques et probabilistiques, par l’entremise d’exemples

simples et non-techniques, permettant au lecteur de comprendre rapidement

les nouveaux concepts et de les appliquer a des situations plus complexes

plus tard. Quelques exemples utilises dans le livre attirent l’attention sur

divers problemes du monde d’aujourd’hui, lies a des problemes environne-

mentaux, au changement climatique, a la perte de biodiversite et a leur

impact sur la faune et la population humaine.

Le livre est divise en deux parties. La partie I introduit les concepts

fondamentaux et les regles de la theorie des probabilites, tandis que la

partie II se concentre sur les statistiques. Cet ordre reflete la philosophie

des auteurs que la theorie des probabilites se situe au fondement de la

statistique et qu’il est important de comprendre le sens du hasard avant

d’effectuer toute analyse de donnees. Ceci explique pourquoi le sujet des

statistiques descriptives est discute seulement dans la partie II, et non au

debut tel qu’il semble etre la pratique commune lors de l’enseignement de

la statistique.

Dans une adresse par Raymond Pearl a la Societe Statistique Americaine

en 1914, intitulee �Le Service et l’Importance des Statistiques a la Biolo-

gie �, il mentionna trois contributions importantes des methodes statis-

tiques a la biologie : (i) pour decrire un groupe d’individus en termes des

attributs et des qualites du groupe ; (ii) pour mesurer la precision d’une

estimation avec un haut niveau de confiance ; (iii) pour mesurer le degre

d’association entre les variations d’une serie de caracteres ou d’evenements

(voir [46]). Ces trois methodes fondamentales sont discutees en longueur

dans ce manuel.

La biostatistique represente un sujet interdisciplinaire qui se situe a l’in-

tersection de la biologie et de la statistique, et qui consiste de l’etude des

methodes quantitatives ou statistiques appliquees a la biologie. Ce sujet a

une histoire recente, ses origines datant de Francis Galton, un cousin de

Charles Darwin, qui etait interesse par le probleme d’heredite. Il utilisa des

techniques quantitatives (telles qu’ajuster une droite pour decrire l’associa-

tion entre deux variables) pour repondre a des questions biologiques.

Le domaine de la biostatistique (aussi connue sous le nom de biometrie)

est ne a la fin du 19e siecle et au debut du 20e siecle, surtout en raison des

travaux de Karl Pearson (le fondateur du premier departement de statis-

tique au monde a l’Universite College de Londres) et de Ronald Fisher (un

pionier dans le domaine des plans experimentaux). Les deux ont developpe

des methodes statistiques pour repondre aux questions des sciences biolo-

Extrait de la publication

Page 10: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

Preface ix

giques. En effet, les travaux de Gregor Mendel sont restes inapercus pour

plusieurs annees par les biologistes, puisqu’ils n’etaient pas habitues de pen-

ser en termes quantitatifs ou statistiques. Ce fut Pearson et ses pairs qui

ont redecouvert les travaux de Mendel et les lois de l’heredite.

Le but de ce livre est de presenter aux etudiants de la biologie le rai-

sonnement et la modelisation statistique, qui sont tres importants au fon-

dement de la biologie moderne.

Cette œuvre fut traduite de l’anglais au francais par Didier Alexandre

Bilodeau. Nous sommes fiers d’avoir eu l’opportunite de travailler avec

Didier. Nous voulons le remercier pour la tres grande qualite de son travail.

Ottawa, le 13 fevrier 2012.

Extrait de la publication

Page 11: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

Tout au long de cet ouvrage, les chiffres entre crochets

font reference a la bibliographie.

Extrait de la publication

Page 12: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

Table des matieres

Preface vii

Probabilite 1

1. Introduction aux probabilites 3

1.1 Interpreter les probabilites . . . . . . . . . . . . . . . . . . 3

2. La genetique elementaire et les probabilites 9

2.1 Dendrogrammes et carres de Punnett . . . . . . . . . . . 9

2.2 Methodes de calcul . . . . . . . . . . . . . . . . . . . . . . 14

2.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3. Axiomes de probabilite 25

3.1 Diagrammes de Venn . . . . . . . . . . . . . . . . . . . . . 25

3.2 La regle d’addition . . . . . . . . . . . . . . . . . . . . . . 30

3.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4. Probabilite conditionnelle 37

4.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.2 La regle de la multiplication . . . . . . . . . . . . . . . . . 41

4.3 La formule de Bayes . . . . . . . . . . . . . . . . . . . . . 44

4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Extrait de la publication

Page 13: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

xii Prevoir l’imprevisible – Une introduction a la biostatistique

5. Independance 53

5.1 Independance statistique . . . . . . . . . . . . . . . . . . . 53

5.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6. Variables aleatoires discretes 61

6.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6.2 La loi binomiale . . . . . . . . . . . . . . . . . . . . . . . 65

6.3 La loi de Poisson . . . . . . . . . . . . . . . . . . . . . . . 68

6.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

7. Variables aleatoires continues 75

7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

7.2 La loi normale . . . . . . . . . . . . . . . . . . . . . . . . 78

7.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

8. Exercices supplementaires (Probabilite) 85

Statistique 91

9. Introduction a la statistique 93

9.1 Echantillonage aleatoire et description de donnees . . . . 93

9.2 Distribution d’echantillonage et estimation ponctuelle . . 107

9.3 Verifier la normalite . . . . . . . . . . . . . . . . . . . . . 116

9.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

10. Intervalles de confiance 127

10.1 Intervalles de confiance pour la moyenne : σ2 connue . . . 127

10.2 Intervalles de confiance pour la moyenne : σ2 inconnue . . 135

10.3 Intervalles de confiance pour la proportion . . . . . . . . . 138

10.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

11. Test d’hypothese 147

11.1 Test d’hypothese pour la moyenne : σ2 connue . . . . . . 147

11.2 Test d’hypothese pour la moyenne : σ2 inconnue . . . . . 155

11.3 Test d’hypothese pour la proportion . . . . . . . . . . . . 160

11.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

Extrait de la publication

Page 14: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

Table des matieres xiii

12. Comparaison de deux echantillons independants 167

12.1 Plan d’experience/d’etude . . . . . . . . . . . . . . . . . . 167

12.2 Intervalles de confiance et tests pour les moyennes . . . . 169

12.3 Intervalles de confiance et tests pour les proportions . . . 184

12.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

13. Echantillons apparies 193

13.1 Intervalles de confiance pour µD . . . . . . . . . . . . . . 193

13.2 Test d’hypothese pour µD . . . . . . . . . . . . . . . . . . 197

13.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

14. Donnees categoriques 207

14.1 Test d’independance . . . . . . . . . . . . . . . . . . . . . 207

14.2 Test d’homogeneite . . . . . . . . . . . . . . . . . . . . . . 213

14.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

15. Regression et correlation 223

15.1 Droite des moindres carres . . . . . . . . . . . . . . . . . . 223

15.2 Modele de regression . . . . . . . . . . . . . . . . . . . . . 227

15.3 Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . 239

15.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

16. Exercices supplementaires (Statistique) 253

17. Tableaux 267

Bibliographie 273

Extrait de la publication

Page 15: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

1er juin 2012 13:46 World Scientific Book - 9in x 6in book˙FRA

Extrait de la publication

Page 16: Extrait de la publication · 2018. 4. 13. · Le domaine de la biostatistique (aussi connue sous le nom de biom etrie) est n e a la n du 19 esi ecle et au d ebut du 20 si ecle, surtout

puq.ca

3489D-Couvert caisse O.indd 2-4 12-06-06 09:51

Extrait de la publication