1 MBA Statistique 51-601-02

65
1 MBA MBA Statistique 51-601- Statistique 51-601- 02 02 http://www. http://www. hec.ca hec.ca /sites/cours/51-601-02/ /sites/cours/51-601-02/

Transcript of 1 MBA Statistique 51-601-02

Page 1: 1 MBA Statistique 51-601-02

11

MBAMBAStatistique 51-601-02Statistique 51-601-02

http://www.http://www.hec.cahec.ca/sites/cours/51-601-02//sites/cours/51-601-02/

Page 2: 1 MBA Statistique 51-601-02

La Statistique, c ’est ?La Statistique, c ’est ?

« C’est la science d’apprendre à partir de données. « C’est la science d’apprendre à partir de données. Cette définition doit être interprétée dans un sens Cette définition doit être interprétée dans un sens très large. Elle doit tout inclure, de la planification très large. Elle doit tout inclure, de la planification pour la cueillette des données en passant par la pour la cueillette des données en passant par la gestion subséquente de celles-ci jusqu’aux gestion subséquente de celles-ci jusqu’aux dernières activités comme l’inférence statistique dernières activités comme l’inférence statistique pour la prise de décision et la présentation des pour la prise de décision et la présentation des résultats. »résultats. »

Jon Kettenring, ASA Past PresidentJon Kettenring, ASA Past President

Page 3: 1 MBA Statistique 51-601-02

Plan du coursPlan du cours

Variation. Échantillonnage et estimation.Variation. Échantillonnage et estimation. Inférence statistique et prise de décision.Inférence statistique et prise de décision. Analyse de données qualitatives.Analyse de données qualitatives. Régression linéaire simple et multiple.Régression linéaire simple et multiple. Prévisions. Contrôle statistique des procédés.Prévisions. Contrôle statistique des procédés. Révision.Révision.

Page 4: 1 MBA Statistique 51-601-02

ÉVALUATIONÉVALUATION

Travail en équipeTravail en équipe::40%40%

Examen final:Examen final: 60%60%

Page 5: 1 MBA Statistique 51-601-02

COURS # 1COURS # 1Variation, échantillonnage Variation, échantillonnage

et estimation.et estimation.

Page 6: 1 MBA Statistique 51-601-02

VariationVariation

““Le principalLe principal problème en gestion est problème en gestion est l’incapacité à comprendre et l’incapacité à comprendre et interpréter le concept de variationinterpréter le concept de variation""

W. Edwards DemingW. Edwards Deming

Page 7: 1 MBA Statistique 51-601-02

VariationVariation

""ManagementManagement takes a major step takes a major step forward when they stop asking you to forward when they stop asking you to explain random variationexplain random variation""

F. Timothy FullerF. Timothy Fuller

Page 8: 1 MBA Statistique 51-601-02

VariationVariation

""Failure to understand variation is a Failure to understand variation is a central problem of managementcentral problem of management""

Lloyd S NelsonLloyd S Nelson

Page 9: 1 MBA Statistique 51-601-02

Airport ImmigrationAirport Immigration

Officer Passengers processed

Alan 9 Barbara 10 Colin 4 Dave 8 Enid 6 Frank 14

Page 10: 1 MBA Statistique 51-601-02

AirportAirport ImmigrationImmigration

La direction s’attendait à ce que les employés La direction s’attendait à ce que les employés s’occupent de 10 passagers durant cette s’occupent de 10 passagers durant cette période.période.

Le directeur des services d’immigration, en Le directeur des services d’immigration, en prenant connaissance de ces données, prenant connaissance de ces données, était insatisfait de la performance de Colinétait insatisfait de la performance de Colin songeait à récompenser Franksongeait à récompenser Frank

Page 11: 1 MBA Statistique 51-601-02

Expérience des billes Expérience des billes (Deming)(Deming)

Programme EXCEL: Programme EXCEL: beadsbeads..xlsxls

Les billes rouges sont associées à des Les billes rouges sont associées à des produits défectueux. produits défectueux.

Cinq fois par jour, des techniciens choisissent Cinq fois par jour, des techniciens choisissent au hasard un échantillon de 50 billes et au hasard un échantillon de 50 billes et comptent le nombre de billes rouges comptent le nombre de billes rouges (produits défectueux).(produits défectueux).

Page 12: 1 MBA Statistique 51-601-02

Beads History – 17 July 2000Beads History – 17 July 2000

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 13: 1 MBA Statistique 51-601-02

Beads History - 9 March 2000Beads History - 9 March 2000

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 14: 1 MBA Statistique 51-601-02

Beads History - 8 March 2001Beads History - 8 March 2001

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 15: 1 MBA Statistique 51-601-02

Beads History Beads History - - 5 March 19995 March 1999

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 16: 1 MBA Statistique 51-601-02

Beads History - 19 July 1996Beads History - 19 July 1996

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 17: 1 MBA Statistique 51-601-02

Beads History Beads History - - 8 March 19968 March 1996

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 18: 1 MBA Statistique 51-601-02

Beads History - 10 March 1995Beads History - 10 March 1995

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 19: 1 MBA Statistique 51-601-02

Beads History Beads History - - 6 March 19986 March 1998

0

5

10

15

20

Num

ber o

f red

bea

ds

Page 20: 1 MBA Statistique 51-601-02

Beads History: 27 ExperimentsBeads History: 27 Experiments

0

5

10

15

20

25

Nu

mb

er o

f re

d b

ead

s

Page 21: 1 MBA Statistique 51-601-02

Beads AveragesBeads Averages

0

5

10

15

1 3 5 7 9 11 13 15 17 19 21 23 25 27

Nu

mb

er o

f re

d b

ead

s

Page 22: 1 MBA Statistique 51-601-02

Approche de pompierApproche de pompier

Problème Solution

Page 23: 1 MBA Statistique 51-601-02

Approche scientifiqueApproche scientifique Baser ses décisions sur des données et Baser ses décisions sur des données et

non des intuitions.non des intuitions. Tenter de trouver les causes du problème Tenter de trouver les causes du problème

au lieu de simplement réagir aux au lieu de simplement réagir aux symptômes.symptômes.

Chercher des solutions permanentes au Chercher des solutions permanentes au lieu de solutions rapides.lieu de solutions rapides.

Page 24: 1 MBA Statistique 51-601-02

Approche scientifiqueApproche scientifique

SolutionProblème

Cause

Page 25: 1 MBA Statistique 51-601-02

On a besoin de données pour On a besoin de données pour

Comprendre le processusComprendre le processus Déterminer les prioritésDéterminer les priorités Éliminer les causes de variationÉliminer les causes de variation Observer le processusObserver le processus Établir des liensÉtablir des liens

Page 26: 1 MBA Statistique 51-601-02

Étapes d’une analyse Étapes d’une analyse statistique:statistique:

Planifier la collecte de données;Planifier la collecte de données;Récolter les données;Récolter les données;Les évaluer;Les évaluer;Tirer des conclusions.Tirer des conclusions.

Page 27: 1 MBA Statistique 51-601-02

L ’échantillonnageL ’échantillonnage

Notre connaissance, nos attitudes et nos Notre connaissance, nos attitudes et nos actions sont basés, en grande partie, sur actions sont basés, en grande partie, sur des échantillons.des échantillons.

Par exemple, l’opinion d’une personne sur Par exemple, l’opinion d’une personne sur une institution ou une entreprise qui fait une institution ou une entreprise qui fait des milliers de transactions dans une des milliers de transactions dans une journée est souvent déterminé par journée est souvent déterminé par seulement une ou deux rencontres avec seulement une ou deux rencontres avec cette institution.cette institution.

Page 28: 1 MBA Statistique 51-601-02

Opérations gouvernementales:Opérations gouvernementales:

Faire des études pour aider au développement Faire des études pour aider au développement des affaires publiques et des programmes des affaires publiques et des programmes sociaux. sociaux.

Exemples:Exemples: prix des biens et services;prix des biens et services; fluctuations de l’économie;fluctuations de l’économie; taux de chômage;taux de chômage; évolution de la population.évolution de la population.

Page 29: 1 MBA Statistique 51-601-02

Recherche scientifique: Recherche scientifique:

La statistique permet de valider des inférences La statistique permet de valider des inférences dans divers domaines:dans divers domaines:Datation au carbone 14;Datation au carbone 14;Estimation de risque d’éruptions ou de Estimation de risque d’éruptions ou de

tremblements de terre;tremblements de terre;Essais cliniques (performance d’un nouveau Essais cliniques (performance d’un nouveau

traitement);traitement);Études de populations en biologie(cerfs, Études de populations en biologie(cerfs,

poissons);poissons);Qualité de l’eau;Qualité de l’eau;Tests psychologiques.Tests psychologiques.

Page 30: 1 MBA Statistique 51-601-02

Affaires et industries: Affaires et industries:

Prévision de la demande de biens et Prévision de la demande de biens et services;services;

Contrôles de la qualité;Contrôles de la qualité; Gestion de portefeuilles;Gestion de portefeuilles; Prévision des risques.Prévision des risques.

Page 31: 1 MBA Statistique 51-601-02

Recensement vs ÉchantillonRecensement vs Échantillon

Recensement = véritéRecensement = vérité l’information que l’on désire est disponible l’information que l’on désire est disponible

pour tous les individus de la population pour tous les individus de la population étudiée.étudiée.

Échantillon = estimation de la véritéÉchantillon = estimation de la vérité l’information n’est disponible que pour un l’information n’est disponible que pour un

sous-ensemble des individus de la sous-ensemble des individus de la population étudiée.population étudiée.

Page 32: 1 MBA Statistique 51-601-02

Schéma de l’échantillonnageSchéma de l’échantillonnage

Population

Échantillon

Paramètre

Statistique

Choix

calcul

estimation

Page 33: 1 MBA Statistique 51-601-02

Avantages d’un échantillonAvantages d’un échantillon

Coût réduitCoût réduit Rapidité accrue Rapidité accrue Offre plus de possibilitésOffre plus de possibilités

dans certains cas il peut être impossible de dans certains cas il peut être impossible de faire un recensement (ex: contrôle de qualité)faire un recensement (ex: contrôle de qualité)

Peut-être plus précis!Peut-être plus précis! cas où une main-d’œuvre hautement qualifiée cas où une main-d’œuvre hautement qualifiée

est requise pour la collecte des données est requise pour la collecte des données

Page 34: 1 MBA Statistique 51-601-02

Échantillons probabilistes et non Échantillons probabilistes et non probabilistesprobabilistes

Méthodes d'échantillonnage

Probabiliste

aléatoire simple systématique stratifié par grappes

Non probabiliste

sur base volontaire commodité

Page 35: 1 MBA Statistique 51-601-02

Les erreurs d’échantillonnagesLes erreurs d’échantillonnages

Erreur aléatoireErreur aléatoire différents échantillons vont produire différentes différents échantillons vont produire différentes

estimations de la caractéristique de la population à estimations de la caractéristique de la population à l’étudel’étude

Erreurs systématiques - biaisErreurs systématiques - biais échantillon non probabilisteéchantillon non probabiliste échantillon probabiliste mais avec un taux élevé de échantillon probabiliste mais avec un taux élevé de

non-répondantsnon-répondants instrument de mesure biaiséinstrument de mesure biaisé

Page 36: 1 MBA Statistique 51-601-02

TV Show Poll - March 1998TV Show Poll - March 1998 Should Hamilton be renamed Waikato Should Hamilton be renamed Waikato

City?City?4400 ont appelé participé4400 ont appelé participé73% étaient contre le changement73% étaient contre le changement

Quel type d’échantillonnage a été utilisé?Quel type d’échantillonnage a été utilisé? Quelles sont les conclusions à tirer?Quelles sont les conclusions à tirer?

Page 37: 1 MBA Statistique 51-601-02

Illustration : biais vs variabilitéIllustration : biais vs variabilité

Le biais est la divergence répétée, dans la Le biais est la divergence répétée, dans la même direction, des estimations d'un même direction, des estimations d'un paramètre.paramètre.

Une grande variabilité signifie que les Une grande variabilité signifie que les valeurs répétées des estimations sont très valeurs répétées des estimations sont très éparpillées; les résultats de éparpillées; les résultats de l'échantillonnage ne sont pas l'échantillonnage ne sont pas reproductibles.reproductibles.

Page 38: 1 MBA Statistique 51-601-02

a) Grand biais, faible variabilité b) faible biais, grande variabilité

c) Grand biais, grande variabilité d) faible biais, faible variabilité

Page 39: 1 MBA Statistique 51-601-02

Biais dBiais dû à la non-réponseû à la non-réponse

Le biais est souvent le résultat de la non-réponse lors de Le biais est souvent le résultat de la non-réponse lors de sondages.sondages.

En effet supposons que la population est divisée en deux En effet supposons que la population est divisée en deux groupes : les répondants (60%) et les non répondants groupes : les répondants (60%) et les non répondants (40%). (40%).

Parmi les répondants 65% des personnes sont en faveur Parmi les répondants 65% des personnes sont en faveur d’un projet et parmi les non répondants 20% sont en d’un projet et parmi les non répondants 20% sont en faveur du projet. La vraie proportion de la population en faveur du projet. La vraie proportion de la population en faveur du projet est donc p = 47%. Un sondage nous faveur du projet est donc p = 47%. Un sondage nous donnera une estimation de p autour de 65 (n’égale pas donnera une estimation de p autour de 65 (n’égale pas 47%). Le biais est donc de 18%. 47%). Le biais est donc de 18%.

Page 40: 1 MBA Statistique 51-601-02

Comment faire un tirage aléatoire Comment faire un tirage aléatoire simple?simple?

Mettre les noms de tous les Mettre les noms de tous les NN individus de la individus de la population dans un chapeau et en tirer un population dans un chapeau et en tirer un échantillon de échantillon de nn au hasard. au hasard.

Numéroter les individus de la population de 1 à Numéroter les individus de la population de 1 à NN et utiliser une table de nombres aléatoires. et utiliser une table de nombres aléatoires.

Utiliser un logiciel qui génère des nombres Utiliser un logiciel qui génère des nombres aléatoires (ex: Excel, MINITAB, SAS).aléatoires (ex: Excel, MINITAB, SAS).

Page 41: 1 MBA Statistique 51-601-02

Ex: Une population est constituée de 400 hommes et 600 femmes. On étudie les habitudes de lecture de ces individus. Parmi les hommes, 80 préfèrent lire un livre, 200 préfèrent lire les journaux et 120 lire des revues. Chez les femmes, ces nombres sont de 240 pour les livres, 120 pour les journaux et 240 pour les revues. La distribution de ces individus peut être représentée dans le tableau suivant:

LIVRES JOURNAUX REVUES TOTAL

HOMMES 80 (0.080)

200 (0.200)

120 (0.120)

400 (0.400)

FEMMES 240 (0.240)

120 (0.120)

240 (0.240)

600 (0.600)

TOTAL 320 (0.320)

320 (0.320)

360 (0.360)

1000 (100%)

Page 42: 1 MBA Statistique 51-601-02

On supposera que les individus de la population sont ordonnés de la manière suivante, afin d ’obtenir les résultats pour divers échantillons que nous choisirons au hasard ultérieurement:

1 à 80 Homme Livre 81 à 280 Homme Journal 281 à 400 Homme Revue 401 à 640 Femme Livre 641 à 760 Femme Journal 761 à 1000 Femme Revue.

On choisit un échantillon de 30 personnes: (en partant de la colonne 6, ligne 6 en se déplaçant horizontalement dans la table de nombres aléatoires)

individu résultat individu résultat individu résultat

033 H L 924 F R 646 F J648 F J 707 F J 886 F R847 F R 054 H L 823 F R204 H J 329 H R 920 F R334 H R 776 F R 461 F L

639 F L 100 H J 893 F R193 H J 871 F R 829 F R639 F L 007 H L 380 H R411 F L 255 H J 900 F R095 H J 980 F R 796 F R

Page 43: 1 MBA Statistique 51-601-02

Exemple:Exemple:

Le tableau suivant résume la distribution des individus de l'échantillon:

LIVRES JOURNAUX REVUES TOTAL

HOMMES 3 (0.100)

5 (0.167)

3 (0.100)

11 (0.367)

FEMMES 4 (0.133)

3 (0.100)

12 (0.400)

19 (0.633)

TOTAL 7 (0.233)

8 (0.267)

15 (0.500)

30 (100%)

Page 44: 1 MBA Statistique 51-601-02

Dans l’exemple précédent, si on était parti de la colonne 1, ligne 1 en se déplaçant verticalement dans la table de nombres aléatoires, on aurait obtenu:

492 F L 829 F R 702 F J 618 F L 390 H R 851 F R 438 F L 557 F L 111 H J 629 F L 147 H J 368 H R 338 H R 321 H R 239 H J 973 F R 232 H J 793 F R 705 F J 457 F L 920 F R 893 F R 098 H J 068 H L 378 H R 543 F L 124 H J 604 F L 947 F R 571 F L Et le tableau de résultats aurait été différent du premier:

LIVRES JOURNAUX REVUES TOTAL

HOMMES 1 (0.033)

6 (0.200)

5 (0.167)

12 (0.400)

FEMMES 9 (0.300)

2 (0.067)

7 (0.233)

18 (0.600)

TOTAL 10 (0.333)

8 (0.267)

12 (0.400)

30 (100%)

Page 45: 1 MBA Statistique 51-601-02

Remarques :Remarques :

Les résultats obtenus dépendent de l ’échantillon Les résultats obtenus dépendent de l ’échantillon prélevé.prélevé.

Si les échantillons sont prélevés selon les règles de Si les échantillons sont prélevés selon les règles de l ’art, les résultats devraient se ressembler.l ’art, les résultats devraient se ressembler.

Pour un tirage aléatoire simple, chaque individu de Pour un tirage aléatoire simple, chaque individu de la population a la même chance d ’être sélectionné la population a la même chance d ’être sélectionné à chaque tirage.à chaque tirage.

Pour un tirage aléatoire simple, tous les échantillons Pour un tirage aléatoire simple, tous les échantillons possibles de possibles de même taillemême taille ont la même chance ont la même chance d ’être sélectionnés.d ’être sélectionnés.

Page 46: 1 MBA Statistique 51-601-02

Les sondages d’opinionLes sondages d’opinion Les résultats obtenus dans un échantillon Les résultats obtenus dans un échantillon

probabiliste serviront à généraliser à l’ensemble probabiliste serviront à généraliser à l’ensemble de la population.de la population.

Mais le fait d’utiliser un échantillon induit Mais le fait d’utiliser un échantillon induit nécessairement une marge d’erreur que nous nécessairement une marge d’erreur que nous essayerons de contrôler.essayerons de contrôler.

Nous distinguerons deux types de données: Nous distinguerons deux types de données: qualitatives et quantitatives.qualitatives et quantitatives.

Page 47: 1 MBA Statistique 51-601-02

Types de donnéesTypes de données Qualitatives Qualitatives (échelle de mesure: nominale ou ordinale) (échelle de mesure: nominale ou ordinale)

(paramètre: %)(paramètre: %)

exemples:exemples: sexe (F, M)sexe (F, M) parti politique (PLQ, PQ, ADQ)parti politique (PLQ, PQ, ADQ) marque préférée (Coke, Pepsi, Marque maison, …)marque préférée (Coke, Pepsi, Marque maison, …) niveau de satisfaction (échelle de Likert de 1 à 5)niveau de satisfaction (échelle de Likert de 1 à 5)

QuantitativesQuantitatives (échelle de mesure: intervalle ou rapport)(échelle de mesure: intervalle ou rapport)

(paramètre: moyenne)(paramètre: moyenne)

exemples:exemples: Âge, revenu, rendementÂge, revenu, rendement

Page 48: 1 MBA Statistique 51-601-02

Estimation par intervalle de Estimation par intervalle de confianceconfiance

Pour estimer la proportion Pour estimer la proportion pp d ’individus d ’individus possédant la caractéristique à l ’étude dans possédant la caractéristique à l ’étude dans

la population, ou la moyenne la population, ou la moyenne , on utilise , on utilise un intervalle de confiance au niveau (1- un intervalle de confiance au niveau (1- ).).

Page 49: 1 MBA Statistique 51-601-02

L ’estimation par intervalle de confiance consiste L ’estimation par intervalle de confiance consiste à établir un intervalle de valeurs qui nous permet à établir un intervalle de valeurs qui nous permet d ’affirmer, avec un certain niveau de confiance d ’affirmer, avec un certain niveau de confiance ou de certitude prédéterminé (en général: 90%, ou de certitude prédéterminé (en général: 90%, 95% ou 99%), que la vraie valeur du paramètre 95% ou 99%), que la vraie valeur du paramètre dans la population se trouve dans cet intervalle.dans la population se trouve dans cet intervalle.

Estimation par intervalle de Estimation par intervalle de confiance (suite)confiance (suite)

Page 50: 1 MBA Statistique 51-601-02

Intervalle de confiance pour Intervalle de confiance pour estimer une proportionestimer une proportion pp

ExempleExemple: Sur un échantillon de 125 étudiants : Sur un échantillon de 125 étudiants d ’un collège interrogés pour savoir s ’ils ont d ’un collège interrogés pour savoir s ’ils ont l ’intention de voter aux prochaines élections de l ’intention de voter aux prochaines élections de leur association, 45 ont répondu positivement.leur association, 45 ont répondu positivement.

Estimer, de façon ponctuelle, la proportion de Estimer, de façon ponctuelle, la proportion de l ’ensemble des étudiants de cette institution qui l ’ensemble des étudiants de cette institution qui ont l ’intention de voter aux prochaines élections.ont l ’intention de voter aux prochaines élections.

Page 51: 1 MBA Statistique 51-601-02

On estime la proportion On estime la proportion pp inconnue (de la population) par inconnue (de la population) par celle obtenue dans l’échantillon.celle obtenue dans l’échantillon.

Solution:

Page 52: 1 MBA Statistique 51-601-02

I.C. pour estimer une I.C. pour estimer une proportionproportion p p

PProgramme EXCEL: rogramme EXCEL: ICproportion.xlsICproportion.xls Si la taille de l’échantillon Si la taille de l’échantillon nn est assez grande, l ’intervalle de confiance est assez grande, l ’intervalle de confiance

au niveau (1 - au niveau (1 - ) pour estimer ) pour estimer la vraie proportion la vraie proportion pp du caractère à du caractère à l ’étude dans la population, est donnée par:l ’étude dans la population, est donnée par:

où est la proportion de succès dans où est la proportion de succès dans l’échantillon,l’échantillon,

Page 53: 1 MBA Statistique 51-601-02

Exemple Exemple (suite)(suite) : :

Par conséquent, un intervalle de confiance de 95% Par conséquent, un intervalle de confiance de 95% de certitude pour la proportion de l ’ensemble des de certitude pour la proportion de l ’ensemble des étudiants de cette institution qui ont l ’intention de étudiants de cette institution qui ont l ’intention de voter aux prochaines élections nous est donné par:voter aux prochaines élections nous est donné par:

Page 54: 1 MBA Statistique 51-601-02

Exemple Exemple (suite)(suite) : :

Comment rapporterait-on les résultats de ce Comment rapporterait-on les résultats de ce sondage dans le journal étudiant de ce collège?sondage dans le journal étudiant de ce collège?

36% des étudiants du collège ont l ’intention 36% des étudiants du collège ont l ’intention d ’exercer leur droit de vote aux prochaines d ’exercer leur droit de vote aux prochaines élections de l ’association étudiante. La marge élections de l ’association étudiante. La marge d ’erreur est de 8,4% avec un niveau de confiance d ’erreur est de 8,4% avec un niveau de confiance de 95% (ou avec un degré de certitude de 95% ou de 95% (ou avec un degré de certitude de 95% ou 19 fois sur 20).19 fois sur 20).

Page 55: 1 MBA Statistique 51-601-02

Remarques:Remarques: Cette formule est approximative et s ’applique Cette formule est approximative et s ’applique

uniquement pour les grands échantillons.uniquement pour les grands échantillons. Si je prends tous les échantillons aléatoires Si je prends tous les échantillons aléatoires

possibles de taille possibles de taille nn et que je calcule pour chacun un et que je calcule pour chacun un intervalle de confiance au niveau de 95%, 95% intervalle de confiance au niveau de 95%, 95% d’entre eux incluront la vraie proportion d’entre eux incluront la vraie proportion pp de la de la population, et donc 5% ne l ’incluront pas.population, et donc 5% ne l ’incluront pas.

La quantité est appelé marge La quantité est appelé marge

d ’erreur ou précision, au niveau de confiance 95% d ’erreur ou précision, au niveau de confiance 95% (19 fois sur 20).(19 fois sur 20).

Page 56: 1 MBA Statistique 51-601-02

Marge d ’erreur au niveau Marge d ’erreur au niveau 95%95%

p (%)

100 300 500 1000 3000 1000010 5,9 3,4 2,6 1,9 1,1 0,620 7,8 4,5 3,5 2,5 1,4 0,830 9,0 5,2 4,0 2,8 1,6 0,940 9,6 5,5 4,3 3,0 1,8 1,050 9,8 5,7 4,4 3,1 1,8 1,060 9,6 5,5 4,3 3,0 1,8 1,070 9,0 5,2 4,0 2,8 1,6 0,980 7,8 4,5 3,5 2,5 1,4 0,8

taille de l'échantillon n

Marge d'erreur ou précision (en %) selon la taille de l'échantillon n et la valeur de p au niveau 95%

Page 57: 1 MBA Statistique 51-601-02

Marge d ’erreur au niveau Marge d ’erreur au niveau 90%90%

p (%)

100 300 500 1000 3000 1000010 4,9 2,8 2,2 1,6 0,9 0,520 6,6 3,8 2,9 2,1 1,2 0,730 7,5 4,4 3,4 2,4 1,4 0,840 8,1 4,7 3,6 2,5 1,5 0,850 8,2 4,7 3,7 2,6 1,5 0,860 8,1 4,7 3,6 2,5 1,5 0,870 7,5 4,4 3,4 2,4 1,4 0,880 6,6 3,8 2,9 2,1 1,2 0,790 4,9 2,8 2,2 1,6 0,9 0,5

taille de l'échantillon n

Marge d'erreur ou précision (en %) selon la taille de l'échantillon n et la valeur de p au niveau 90%

Page 58: 1 MBA Statistique 51-601-02

Calcul de la taille Calcul de la taille nn pour assurer une pour assurer une marge d ’erreur maximalemarge d ’erreur maximale

Si nous voulons estimer la proportion Si nous voulons estimer la proportion pp au au niveau de confiance (1-niveau de confiance (1-) avec une marge ) avec une marge d ’erreur maximale notée d ’erreur maximale notée ee, alors nous , alors nous avons la relation suivante pour le calcul de la avons la relation suivante pour le calcul de la taille taille nn de l ’échantillon: de l ’échantillon:

Page 59: 1 MBA Statistique 51-601-02

I.C. pour estimer la moyenneI.C. pour estimer la moyenne Programme EXCEL: Programme EXCEL: ICmoyenne.xlsICmoyenne.xls De façon générale, si la taille de l’échantillon De façon générale, si la taille de l’échantillon nn est assez grande, est assez grande,

l ’intervalle de confiance au niveau (1 - l ’intervalle de confiance au niveau (1 - ) pour estimer ) pour estimer la vraie la vraie

moyenne moyenne de la population, est donnée par: de la population, est donnée par:

Page 60: 1 MBA Statistique 51-601-02

Remarques:Remarques:

Cette formule est approximative et s’applique Cette formule est approximative et s’applique uniquement pour les grands échantillons (sauf si uniquement pour les grands échantillons (sauf si la caractéristique a une distribution normale et la caractéristique a une distribution normale et que l ’écart type est connu que l ’écart type est connu la formule est la formule est exacte).exacte).

Lorsque l ’écart type Lorsque l ’écart type est inconnu, on utilise une est inconnu, on utilise une estimation de estimation de et on remplace la valeur de et on remplace la valeur de ZZ0,0250,025=1,96 pour une valeur légèrement supérieure =1,96 pour une valeur légèrement supérieure lu dans une table de la loi de Student qui dépend lu dans une table de la loi de Student qui dépend de la taille de l ’échantillon.de la taille de l ’échantillon.

Page 61: 1 MBA Statistique 51-601-02

Remarques: Remarques: (suite)(suite)

Interprétation d’un intervalle de confiance au Interprétation d’un intervalle de confiance au niveau 95% pour la moyenne niveau 95% pour la moyenne d ’une d ’une caractéristique dans la population:caractéristique dans la population:

Si je prends tous les échantillons aléatoires de Si je prends tous les échantillons aléatoires de taille taille nn et que je calcule pour chacun un intervalle et que je calcule pour chacun un intervalle de confiance de 95%, 95% d’entre eux incluront de confiance de 95%, 95% d’entre eux incluront la vraie moyenne la vraie moyenne de la population, et donc 5% de la population, et donc 5% ne l ’incluront pas.ne l ’incluront pas.

Page 62: 1 MBA Statistique 51-601-02

ExempleExemple

Afin de connaître le coût hebdomadaire moyen du Afin de connaître le coût hebdomadaire moyen du panier d ’épicerie pour une famille de 4 personnes panier d ’épicerie pour une famille de 4 personnes résidant à Sherbrooke, on prélève un échantillon résidant à Sherbrooke, on prélève un échantillon de 50 de ces familles et on note le montant de leur de 50 de ces familles et on note le montant de leur épicerie de cette semaine. On obtient un montant épicerie de cette semaine. On obtient un montant moyen de 155$. L’écart type de l’échantillon est de moyen de 155$. L’écart type de l’échantillon est de 15$. 15$.

Page 63: 1 MBA Statistique 51-601-02

EExemple xemple (suite) :(suite) :

Estimer le coût actuel moyen du panier d ’épicerie Estimer le coût actuel moyen du panier d ’épicerie d ’une famille de 4 personnes résidant à Sherbrooke à d ’une famille de 4 personnes résidant à Sherbrooke à l ’aide d ’un intervalle de confiance de 95% de certitude l ’aide d ’un intervalle de confiance de 95% de certitude (on suppose l ’écart type connu à 15$):(on suppose l ’écart type connu à 15$): = 155 ± 4.16= 155 ± 4.16

En affirmant que le coût actuel moyen du panier En affirmant que le coût actuel moyen du panier d ’épicerie d ’une famille de 4 personnes résidant à d ’épicerie d ’une famille de 4 personnes résidant à Sherbrooke est dans l ’intervalle [150.84$, 159.16$], je Sherbrooke est dans l ’intervalle [150.84$, 159.16$], je suis 95% certain d’avoir raison.suis 95% certain d’avoir raison.

Page 64: 1 MBA Statistique 51-601-02

Étude de casÉtude de cas

Les données du fichier Les données du fichier creditcredit..xls xls représentent le montant représentent le montant dû sur des cartes de crédit ainsi que le revenu total de dû sur des cartes de crédit ainsi que le revenu total de 100 familles québécoises choisies au hasard.100 familles québécoises choisies au hasard.

Quel est le montant dû moyen d’une famille québécoise? Quel est le montant dû moyen d’une famille québécoise? Quelle est la précision de votre estimation?Quelle est la précision de votre estimation?

Que peut-on dire pour une famille canadienne?Que peut-on dire pour une famille canadienne? En faisant l’hypothèse que 2 500 000 familles utilisent au En faisant l’hypothèse que 2 500 000 familles utilisent au

moins une carte de crédit régulièrement, quelle est la moins une carte de crédit régulièrement, quelle est la dette totale de ces familles québécoises? Quelle est la dette totale de ces familles québécoises? Quelle est la précision de votre estimation?précision de votre estimation?

Page 65: 1 MBA Statistique 51-601-02

ExempleExemple

Une compagnie désire mettre sur le marché un nouveau Une compagnie désire mettre sur le marché un nouveau logiciel permettant de ne plus recevoir de pourriels. Elle logiciel permettant de ne plus recevoir de pourriels. Elle vise un marché de 800 000 consommateurs potentiels. vise un marché de 800 000 consommateurs potentiels.

Avant de lancer le produit elle fait une enquête auprès de 40 Avant de lancer le produit elle fait une enquête auprès de 40 ménages et 6 se déclarent intéressés par le nouveau produit. ménages et 6 se déclarent intéressés par le nouveau produit.

Le profit par logiciel vendu est de 3$ et la compagnie doit Le profit par logiciel vendu est de 3$ et la compagnie doit absorber des coûts fixes de 50 000$. absorber des coûts fixes de 50 000$.

Quelle est la décision? Quelle est la décision?

Discussion: Est-ce la meilleure façon de répondre à la Discussion: Est-ce la meilleure façon de répondre à la question?question?