1 MBA Statistique 51-601-02
-
Upload
liliane-rio -
Category
Documents
-
view
111 -
download
8
Transcript of 1 MBA Statistique 51-601-02
11
MBAMBAStatistique 51-601-02Statistique 51-601-02
http://www.http://www.hec.cahec.ca/sites/cours/51-601-02//sites/cours/51-601-02/
La Statistique, c ’est ?La Statistique, c ’est ?
« C’est la science d’apprendre à partir de données. « C’est la science d’apprendre à partir de données. Cette définition doit être interprétée dans un sens Cette définition doit être interprétée dans un sens très large. Elle doit tout inclure, de la planification très large. Elle doit tout inclure, de la planification pour la cueillette des données en passant par la pour la cueillette des données en passant par la gestion subséquente de celles-ci jusqu’aux gestion subséquente de celles-ci jusqu’aux dernières activités comme l’inférence statistique dernières activités comme l’inférence statistique pour la prise de décision et la présentation des pour la prise de décision et la présentation des résultats. »résultats. »
Jon Kettenring, ASA Past PresidentJon Kettenring, ASA Past President
Plan du coursPlan du cours
Variation. Échantillonnage et estimation.Variation. Échantillonnage et estimation. Inférence statistique et prise de décision.Inférence statistique et prise de décision. Analyse de données qualitatives.Analyse de données qualitatives. Régression linéaire simple et multiple.Régression linéaire simple et multiple. Prévisions. Contrôle statistique des procédés.Prévisions. Contrôle statistique des procédés. Révision.Révision.
ÉVALUATIONÉVALUATION
Travail en équipeTravail en équipe::40%40%
Examen final:Examen final: 60%60%
COURS # 1COURS # 1Variation, échantillonnage Variation, échantillonnage
et estimation.et estimation.
VariationVariation
““Le principalLe principal problème en gestion est problème en gestion est l’incapacité à comprendre et l’incapacité à comprendre et interpréter le concept de variationinterpréter le concept de variation""
W. Edwards DemingW. Edwards Deming
VariationVariation
""ManagementManagement takes a major step takes a major step forward when they stop asking you to forward when they stop asking you to explain random variationexplain random variation""
F. Timothy FullerF. Timothy Fuller
VariationVariation
""Failure to understand variation is a Failure to understand variation is a central problem of managementcentral problem of management""
Lloyd S NelsonLloyd S Nelson
Airport ImmigrationAirport Immigration
Officer Passengers processed
Alan 9 Barbara 10 Colin 4 Dave 8 Enid 6 Frank 14
AirportAirport ImmigrationImmigration
La direction s’attendait à ce que les employés La direction s’attendait à ce que les employés s’occupent de 10 passagers durant cette s’occupent de 10 passagers durant cette période.période.
Le directeur des services d’immigration, en Le directeur des services d’immigration, en prenant connaissance de ces données, prenant connaissance de ces données, était insatisfait de la performance de Colinétait insatisfait de la performance de Colin songeait à récompenser Franksongeait à récompenser Frank
Expérience des billes Expérience des billes (Deming)(Deming)
Programme EXCEL: Programme EXCEL: beadsbeads..xlsxls
Les billes rouges sont associées à des Les billes rouges sont associées à des produits défectueux. produits défectueux.
Cinq fois par jour, des techniciens choisissent Cinq fois par jour, des techniciens choisissent au hasard un échantillon de 50 billes et au hasard un échantillon de 50 billes et comptent le nombre de billes rouges comptent le nombre de billes rouges (produits défectueux).(produits défectueux).
Beads History – 17 July 2000Beads History – 17 July 2000
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History - 9 March 2000Beads History - 9 March 2000
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History - 8 March 2001Beads History - 8 March 2001
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History Beads History - - 5 March 19995 March 1999
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History - 19 July 1996Beads History - 19 July 1996
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History Beads History - - 8 March 19968 March 1996
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History - 10 March 1995Beads History - 10 March 1995
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History Beads History - - 6 March 19986 March 1998
0
5
10
15
20
Num
ber o
f red
bea
ds
Beads History: 27 ExperimentsBeads History: 27 Experiments
0
5
10
15
20
25
Nu
mb
er o
f re
d b
ead
s
Beads AveragesBeads Averages
0
5
10
15
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Nu
mb
er o
f re
d b
ead
s
Approche de pompierApproche de pompier
Problème Solution
Approche scientifiqueApproche scientifique Baser ses décisions sur des données et Baser ses décisions sur des données et
non des intuitions.non des intuitions. Tenter de trouver les causes du problème Tenter de trouver les causes du problème
au lieu de simplement réagir aux au lieu de simplement réagir aux symptômes.symptômes.
Chercher des solutions permanentes au Chercher des solutions permanentes au lieu de solutions rapides.lieu de solutions rapides.
Approche scientifiqueApproche scientifique
SolutionProblème
Cause
On a besoin de données pour On a besoin de données pour
Comprendre le processusComprendre le processus Déterminer les prioritésDéterminer les priorités Éliminer les causes de variationÉliminer les causes de variation Observer le processusObserver le processus Établir des liensÉtablir des liens
Étapes d’une analyse Étapes d’une analyse statistique:statistique:
Planifier la collecte de données;Planifier la collecte de données;Récolter les données;Récolter les données;Les évaluer;Les évaluer;Tirer des conclusions.Tirer des conclusions.
L ’échantillonnageL ’échantillonnage
Notre connaissance, nos attitudes et nos Notre connaissance, nos attitudes et nos actions sont basés, en grande partie, sur actions sont basés, en grande partie, sur des échantillons.des échantillons.
Par exemple, l’opinion d’une personne sur Par exemple, l’opinion d’une personne sur une institution ou une entreprise qui fait une institution ou une entreprise qui fait des milliers de transactions dans une des milliers de transactions dans une journée est souvent déterminé par journée est souvent déterminé par seulement une ou deux rencontres avec seulement une ou deux rencontres avec cette institution.cette institution.
Opérations gouvernementales:Opérations gouvernementales:
Faire des études pour aider au développement Faire des études pour aider au développement des affaires publiques et des programmes des affaires publiques et des programmes sociaux. sociaux.
Exemples:Exemples: prix des biens et services;prix des biens et services; fluctuations de l’économie;fluctuations de l’économie; taux de chômage;taux de chômage; évolution de la population.évolution de la population.
Recherche scientifique: Recherche scientifique:
La statistique permet de valider des inférences La statistique permet de valider des inférences dans divers domaines:dans divers domaines:Datation au carbone 14;Datation au carbone 14;Estimation de risque d’éruptions ou de Estimation de risque d’éruptions ou de
tremblements de terre;tremblements de terre;Essais cliniques (performance d’un nouveau Essais cliniques (performance d’un nouveau
traitement);traitement);Études de populations en biologie(cerfs, Études de populations en biologie(cerfs,
poissons);poissons);Qualité de l’eau;Qualité de l’eau;Tests psychologiques.Tests psychologiques.
Affaires et industries: Affaires et industries:
Prévision de la demande de biens et Prévision de la demande de biens et services;services;
Contrôles de la qualité;Contrôles de la qualité; Gestion de portefeuilles;Gestion de portefeuilles; Prévision des risques.Prévision des risques.
Recensement vs ÉchantillonRecensement vs Échantillon
Recensement = véritéRecensement = vérité l’information que l’on désire est disponible l’information que l’on désire est disponible
pour tous les individus de la population pour tous les individus de la population étudiée.étudiée.
Échantillon = estimation de la véritéÉchantillon = estimation de la vérité l’information n’est disponible que pour un l’information n’est disponible que pour un
sous-ensemble des individus de la sous-ensemble des individus de la population étudiée.population étudiée.
Schéma de l’échantillonnageSchéma de l’échantillonnage
Population
Échantillon
Paramètre
Statistique
Choix
calcul
estimation
Avantages d’un échantillonAvantages d’un échantillon
Coût réduitCoût réduit Rapidité accrue Rapidité accrue Offre plus de possibilitésOffre plus de possibilités
dans certains cas il peut être impossible de dans certains cas il peut être impossible de faire un recensement (ex: contrôle de qualité)faire un recensement (ex: contrôle de qualité)
Peut-être plus précis!Peut-être plus précis! cas où une main-d’œuvre hautement qualifiée cas où une main-d’œuvre hautement qualifiée
est requise pour la collecte des données est requise pour la collecte des données
Échantillons probabilistes et non Échantillons probabilistes et non probabilistesprobabilistes
Méthodes d'échantillonnage
Probabiliste
aléatoire simple systématique stratifié par grappes
Non probabiliste
sur base volontaire commodité
Les erreurs d’échantillonnagesLes erreurs d’échantillonnages
Erreur aléatoireErreur aléatoire différents échantillons vont produire différentes différents échantillons vont produire différentes
estimations de la caractéristique de la population à estimations de la caractéristique de la population à l’étudel’étude
Erreurs systématiques - biaisErreurs systématiques - biais échantillon non probabilisteéchantillon non probabiliste échantillon probabiliste mais avec un taux élevé de échantillon probabiliste mais avec un taux élevé de
non-répondantsnon-répondants instrument de mesure biaiséinstrument de mesure biaisé
TV Show Poll - March 1998TV Show Poll - March 1998 Should Hamilton be renamed Waikato Should Hamilton be renamed Waikato
City?City?4400 ont appelé participé4400 ont appelé participé73% étaient contre le changement73% étaient contre le changement
Quel type d’échantillonnage a été utilisé?Quel type d’échantillonnage a été utilisé? Quelles sont les conclusions à tirer?Quelles sont les conclusions à tirer?
Illustration : biais vs variabilitéIllustration : biais vs variabilité
Le biais est la divergence répétée, dans la Le biais est la divergence répétée, dans la même direction, des estimations d'un même direction, des estimations d'un paramètre.paramètre.
Une grande variabilité signifie que les Une grande variabilité signifie que les valeurs répétées des estimations sont très valeurs répétées des estimations sont très éparpillées; les résultats de éparpillées; les résultats de l'échantillonnage ne sont pas l'échantillonnage ne sont pas reproductibles.reproductibles.
a) Grand biais, faible variabilité b) faible biais, grande variabilité
c) Grand biais, grande variabilité d) faible biais, faible variabilité
Biais dBiais dû à la non-réponseû à la non-réponse
Le biais est souvent le résultat de la non-réponse lors de Le biais est souvent le résultat de la non-réponse lors de sondages.sondages.
En effet supposons que la population est divisée en deux En effet supposons que la population est divisée en deux groupes : les répondants (60%) et les non répondants groupes : les répondants (60%) et les non répondants (40%). (40%).
Parmi les répondants 65% des personnes sont en faveur Parmi les répondants 65% des personnes sont en faveur d’un projet et parmi les non répondants 20% sont en d’un projet et parmi les non répondants 20% sont en faveur du projet. La vraie proportion de la population en faveur du projet. La vraie proportion de la population en faveur du projet est donc p = 47%. Un sondage nous faveur du projet est donc p = 47%. Un sondage nous donnera une estimation de p autour de 65 (n’égale pas donnera une estimation de p autour de 65 (n’égale pas 47%). Le biais est donc de 18%. 47%). Le biais est donc de 18%.
Comment faire un tirage aléatoire Comment faire un tirage aléatoire simple?simple?
Mettre les noms de tous les Mettre les noms de tous les NN individus de la individus de la population dans un chapeau et en tirer un population dans un chapeau et en tirer un échantillon de échantillon de nn au hasard. au hasard.
Numéroter les individus de la population de 1 à Numéroter les individus de la population de 1 à NN et utiliser une table de nombres aléatoires. et utiliser une table de nombres aléatoires.
Utiliser un logiciel qui génère des nombres Utiliser un logiciel qui génère des nombres aléatoires (ex: Excel, MINITAB, SAS).aléatoires (ex: Excel, MINITAB, SAS).
Ex: Une population est constituée de 400 hommes et 600 femmes. On étudie les habitudes de lecture de ces individus. Parmi les hommes, 80 préfèrent lire un livre, 200 préfèrent lire les journaux et 120 lire des revues. Chez les femmes, ces nombres sont de 240 pour les livres, 120 pour les journaux et 240 pour les revues. La distribution de ces individus peut être représentée dans le tableau suivant:
LIVRES JOURNAUX REVUES TOTAL
HOMMES 80 (0.080)
200 (0.200)
120 (0.120)
400 (0.400)
FEMMES 240 (0.240)
120 (0.120)
240 (0.240)
600 (0.600)
TOTAL 320 (0.320)
320 (0.320)
360 (0.360)
1000 (100%)
On supposera que les individus de la population sont ordonnés de la manière suivante, afin d ’obtenir les résultats pour divers échantillons que nous choisirons au hasard ultérieurement:
1 à 80 Homme Livre 81 à 280 Homme Journal 281 à 400 Homme Revue 401 à 640 Femme Livre 641 à 760 Femme Journal 761 à 1000 Femme Revue.
On choisit un échantillon de 30 personnes: (en partant de la colonne 6, ligne 6 en se déplaçant horizontalement dans la table de nombres aléatoires)
individu résultat individu résultat individu résultat
033 H L 924 F R 646 F J648 F J 707 F J 886 F R847 F R 054 H L 823 F R204 H J 329 H R 920 F R334 H R 776 F R 461 F L
639 F L 100 H J 893 F R193 H J 871 F R 829 F R639 F L 007 H L 380 H R411 F L 255 H J 900 F R095 H J 980 F R 796 F R
Exemple:Exemple:
Le tableau suivant résume la distribution des individus de l'échantillon:
LIVRES JOURNAUX REVUES TOTAL
HOMMES 3 (0.100)
5 (0.167)
3 (0.100)
11 (0.367)
FEMMES 4 (0.133)
3 (0.100)
12 (0.400)
19 (0.633)
TOTAL 7 (0.233)
8 (0.267)
15 (0.500)
30 (100%)
Dans l’exemple précédent, si on était parti de la colonne 1, ligne 1 en se déplaçant verticalement dans la table de nombres aléatoires, on aurait obtenu:
492 F L 829 F R 702 F J 618 F L 390 H R 851 F R 438 F L 557 F L 111 H J 629 F L 147 H J 368 H R 338 H R 321 H R 239 H J 973 F R 232 H J 793 F R 705 F J 457 F L 920 F R 893 F R 098 H J 068 H L 378 H R 543 F L 124 H J 604 F L 947 F R 571 F L Et le tableau de résultats aurait été différent du premier:
LIVRES JOURNAUX REVUES TOTAL
HOMMES 1 (0.033)
6 (0.200)
5 (0.167)
12 (0.400)
FEMMES 9 (0.300)
2 (0.067)
7 (0.233)
18 (0.600)
TOTAL 10 (0.333)
8 (0.267)
12 (0.400)
30 (100%)
Remarques :Remarques :
Les résultats obtenus dépendent de l ’échantillon Les résultats obtenus dépendent de l ’échantillon prélevé.prélevé.
Si les échantillons sont prélevés selon les règles de Si les échantillons sont prélevés selon les règles de l ’art, les résultats devraient se ressembler.l ’art, les résultats devraient se ressembler.
Pour un tirage aléatoire simple, chaque individu de Pour un tirage aléatoire simple, chaque individu de la population a la même chance d ’être sélectionné la population a la même chance d ’être sélectionné à chaque tirage.à chaque tirage.
Pour un tirage aléatoire simple, tous les échantillons Pour un tirage aléatoire simple, tous les échantillons possibles de possibles de même taillemême taille ont la même chance ont la même chance d ’être sélectionnés.d ’être sélectionnés.
Les sondages d’opinionLes sondages d’opinion Les résultats obtenus dans un échantillon Les résultats obtenus dans un échantillon
probabiliste serviront à généraliser à l’ensemble probabiliste serviront à généraliser à l’ensemble de la population.de la population.
Mais le fait d’utiliser un échantillon induit Mais le fait d’utiliser un échantillon induit nécessairement une marge d’erreur que nous nécessairement une marge d’erreur que nous essayerons de contrôler.essayerons de contrôler.
Nous distinguerons deux types de données: Nous distinguerons deux types de données: qualitatives et quantitatives.qualitatives et quantitatives.
Types de donnéesTypes de données Qualitatives Qualitatives (échelle de mesure: nominale ou ordinale) (échelle de mesure: nominale ou ordinale)
(paramètre: %)(paramètre: %)
exemples:exemples: sexe (F, M)sexe (F, M) parti politique (PLQ, PQ, ADQ)parti politique (PLQ, PQ, ADQ) marque préférée (Coke, Pepsi, Marque maison, …)marque préférée (Coke, Pepsi, Marque maison, …) niveau de satisfaction (échelle de Likert de 1 à 5)niveau de satisfaction (échelle de Likert de 1 à 5)
QuantitativesQuantitatives (échelle de mesure: intervalle ou rapport)(échelle de mesure: intervalle ou rapport)
(paramètre: moyenne)(paramètre: moyenne)
exemples:exemples: Âge, revenu, rendementÂge, revenu, rendement
Estimation par intervalle de Estimation par intervalle de confianceconfiance
Pour estimer la proportion Pour estimer la proportion pp d ’individus d ’individus possédant la caractéristique à l ’étude dans possédant la caractéristique à l ’étude dans
la population, ou la moyenne la population, ou la moyenne , on utilise , on utilise un intervalle de confiance au niveau (1- un intervalle de confiance au niveau (1- ).).
L ’estimation par intervalle de confiance consiste L ’estimation par intervalle de confiance consiste à établir un intervalle de valeurs qui nous permet à établir un intervalle de valeurs qui nous permet d ’affirmer, avec un certain niveau de confiance d ’affirmer, avec un certain niveau de confiance ou de certitude prédéterminé (en général: 90%, ou de certitude prédéterminé (en général: 90%, 95% ou 99%), que la vraie valeur du paramètre 95% ou 99%), que la vraie valeur du paramètre dans la population se trouve dans cet intervalle.dans la population se trouve dans cet intervalle.
Estimation par intervalle de Estimation par intervalle de confiance (suite)confiance (suite)
Intervalle de confiance pour Intervalle de confiance pour estimer une proportionestimer une proportion pp
ExempleExemple: Sur un échantillon de 125 étudiants : Sur un échantillon de 125 étudiants d ’un collège interrogés pour savoir s ’ils ont d ’un collège interrogés pour savoir s ’ils ont l ’intention de voter aux prochaines élections de l ’intention de voter aux prochaines élections de leur association, 45 ont répondu positivement.leur association, 45 ont répondu positivement.
Estimer, de façon ponctuelle, la proportion de Estimer, de façon ponctuelle, la proportion de l ’ensemble des étudiants de cette institution qui l ’ensemble des étudiants de cette institution qui ont l ’intention de voter aux prochaines élections.ont l ’intention de voter aux prochaines élections.
On estime la proportion On estime la proportion pp inconnue (de la population) par inconnue (de la population) par celle obtenue dans l’échantillon.celle obtenue dans l’échantillon.
Solution:
I.C. pour estimer une I.C. pour estimer une proportionproportion p p
PProgramme EXCEL: rogramme EXCEL: ICproportion.xlsICproportion.xls Si la taille de l’échantillon Si la taille de l’échantillon nn est assez grande, l ’intervalle de confiance est assez grande, l ’intervalle de confiance
au niveau (1 - au niveau (1 - ) pour estimer ) pour estimer la vraie proportion la vraie proportion pp du caractère à du caractère à l ’étude dans la population, est donnée par:l ’étude dans la population, est donnée par:
où est la proportion de succès dans où est la proportion de succès dans l’échantillon,l’échantillon,
Exemple Exemple (suite)(suite) : :
Par conséquent, un intervalle de confiance de 95% Par conséquent, un intervalle de confiance de 95% de certitude pour la proportion de l ’ensemble des de certitude pour la proportion de l ’ensemble des étudiants de cette institution qui ont l ’intention de étudiants de cette institution qui ont l ’intention de voter aux prochaines élections nous est donné par:voter aux prochaines élections nous est donné par:
Exemple Exemple (suite)(suite) : :
Comment rapporterait-on les résultats de ce Comment rapporterait-on les résultats de ce sondage dans le journal étudiant de ce collège?sondage dans le journal étudiant de ce collège?
36% des étudiants du collège ont l ’intention 36% des étudiants du collège ont l ’intention d ’exercer leur droit de vote aux prochaines d ’exercer leur droit de vote aux prochaines élections de l ’association étudiante. La marge élections de l ’association étudiante. La marge d ’erreur est de 8,4% avec un niveau de confiance d ’erreur est de 8,4% avec un niveau de confiance de 95% (ou avec un degré de certitude de 95% ou de 95% (ou avec un degré de certitude de 95% ou 19 fois sur 20).19 fois sur 20).
Remarques:Remarques: Cette formule est approximative et s ’applique Cette formule est approximative et s ’applique
uniquement pour les grands échantillons.uniquement pour les grands échantillons. Si je prends tous les échantillons aléatoires Si je prends tous les échantillons aléatoires
possibles de taille possibles de taille nn et que je calcule pour chacun un et que je calcule pour chacun un intervalle de confiance au niveau de 95%, 95% intervalle de confiance au niveau de 95%, 95% d’entre eux incluront la vraie proportion d’entre eux incluront la vraie proportion pp de la de la population, et donc 5% ne l ’incluront pas.population, et donc 5% ne l ’incluront pas.
La quantité est appelé marge La quantité est appelé marge
d ’erreur ou précision, au niveau de confiance 95% d ’erreur ou précision, au niveau de confiance 95% (19 fois sur 20).(19 fois sur 20).
Marge d ’erreur au niveau Marge d ’erreur au niveau 95%95%
p (%)
100 300 500 1000 3000 1000010 5,9 3,4 2,6 1,9 1,1 0,620 7,8 4,5 3,5 2,5 1,4 0,830 9,0 5,2 4,0 2,8 1,6 0,940 9,6 5,5 4,3 3,0 1,8 1,050 9,8 5,7 4,4 3,1 1,8 1,060 9,6 5,5 4,3 3,0 1,8 1,070 9,0 5,2 4,0 2,8 1,6 0,980 7,8 4,5 3,5 2,5 1,4 0,8
taille de l'échantillon n
Marge d'erreur ou précision (en %) selon la taille de l'échantillon n et la valeur de p au niveau 95%
Marge d ’erreur au niveau Marge d ’erreur au niveau 90%90%
p (%)
100 300 500 1000 3000 1000010 4,9 2,8 2,2 1,6 0,9 0,520 6,6 3,8 2,9 2,1 1,2 0,730 7,5 4,4 3,4 2,4 1,4 0,840 8,1 4,7 3,6 2,5 1,5 0,850 8,2 4,7 3,7 2,6 1,5 0,860 8,1 4,7 3,6 2,5 1,5 0,870 7,5 4,4 3,4 2,4 1,4 0,880 6,6 3,8 2,9 2,1 1,2 0,790 4,9 2,8 2,2 1,6 0,9 0,5
taille de l'échantillon n
Marge d'erreur ou précision (en %) selon la taille de l'échantillon n et la valeur de p au niveau 90%
Calcul de la taille Calcul de la taille nn pour assurer une pour assurer une marge d ’erreur maximalemarge d ’erreur maximale
Si nous voulons estimer la proportion Si nous voulons estimer la proportion pp au au niveau de confiance (1-niveau de confiance (1-) avec une marge ) avec une marge d ’erreur maximale notée d ’erreur maximale notée ee, alors nous , alors nous avons la relation suivante pour le calcul de la avons la relation suivante pour le calcul de la taille taille nn de l ’échantillon: de l ’échantillon:
I.C. pour estimer la moyenneI.C. pour estimer la moyenne Programme EXCEL: Programme EXCEL: ICmoyenne.xlsICmoyenne.xls De façon générale, si la taille de l’échantillon De façon générale, si la taille de l’échantillon nn est assez grande, est assez grande,
l ’intervalle de confiance au niveau (1 - l ’intervalle de confiance au niveau (1 - ) pour estimer ) pour estimer la vraie la vraie
moyenne moyenne de la population, est donnée par: de la population, est donnée par:
Remarques:Remarques:
Cette formule est approximative et s’applique Cette formule est approximative et s’applique uniquement pour les grands échantillons (sauf si uniquement pour les grands échantillons (sauf si la caractéristique a une distribution normale et la caractéristique a une distribution normale et que l ’écart type est connu que l ’écart type est connu la formule est la formule est exacte).exacte).
Lorsque l ’écart type Lorsque l ’écart type est inconnu, on utilise une est inconnu, on utilise une estimation de estimation de et on remplace la valeur de et on remplace la valeur de ZZ0,0250,025=1,96 pour une valeur légèrement supérieure =1,96 pour une valeur légèrement supérieure lu dans une table de la loi de Student qui dépend lu dans une table de la loi de Student qui dépend de la taille de l ’échantillon.de la taille de l ’échantillon.
Remarques: Remarques: (suite)(suite)
Interprétation d’un intervalle de confiance au Interprétation d’un intervalle de confiance au niveau 95% pour la moyenne niveau 95% pour la moyenne d ’une d ’une caractéristique dans la population:caractéristique dans la population:
Si je prends tous les échantillons aléatoires de Si je prends tous les échantillons aléatoires de taille taille nn et que je calcule pour chacun un intervalle et que je calcule pour chacun un intervalle de confiance de 95%, 95% d’entre eux incluront de confiance de 95%, 95% d’entre eux incluront la vraie moyenne la vraie moyenne de la population, et donc 5% de la population, et donc 5% ne l ’incluront pas.ne l ’incluront pas.
ExempleExemple
Afin de connaître le coût hebdomadaire moyen du Afin de connaître le coût hebdomadaire moyen du panier d ’épicerie pour une famille de 4 personnes panier d ’épicerie pour une famille de 4 personnes résidant à Sherbrooke, on prélève un échantillon résidant à Sherbrooke, on prélève un échantillon de 50 de ces familles et on note le montant de leur de 50 de ces familles et on note le montant de leur épicerie de cette semaine. On obtient un montant épicerie de cette semaine. On obtient un montant moyen de 155$. L’écart type de l’échantillon est de moyen de 155$. L’écart type de l’échantillon est de 15$. 15$.
EExemple xemple (suite) :(suite) :
Estimer le coût actuel moyen du panier d ’épicerie Estimer le coût actuel moyen du panier d ’épicerie d ’une famille de 4 personnes résidant à Sherbrooke à d ’une famille de 4 personnes résidant à Sherbrooke à l ’aide d ’un intervalle de confiance de 95% de certitude l ’aide d ’un intervalle de confiance de 95% de certitude (on suppose l ’écart type connu à 15$):(on suppose l ’écart type connu à 15$): = 155 ± 4.16= 155 ± 4.16
En affirmant que le coût actuel moyen du panier En affirmant que le coût actuel moyen du panier d ’épicerie d ’une famille de 4 personnes résidant à d ’épicerie d ’une famille de 4 personnes résidant à Sherbrooke est dans l ’intervalle [150.84$, 159.16$], je Sherbrooke est dans l ’intervalle [150.84$, 159.16$], je suis 95% certain d’avoir raison.suis 95% certain d’avoir raison.
Étude de casÉtude de cas
Les données du fichier Les données du fichier creditcredit..xls xls représentent le montant représentent le montant dû sur des cartes de crédit ainsi que le revenu total de dû sur des cartes de crédit ainsi que le revenu total de 100 familles québécoises choisies au hasard.100 familles québécoises choisies au hasard.
Quel est le montant dû moyen d’une famille québécoise? Quel est le montant dû moyen d’une famille québécoise? Quelle est la précision de votre estimation?Quelle est la précision de votre estimation?
Que peut-on dire pour une famille canadienne?Que peut-on dire pour une famille canadienne? En faisant l’hypothèse que 2 500 000 familles utilisent au En faisant l’hypothèse que 2 500 000 familles utilisent au
moins une carte de crédit régulièrement, quelle est la moins une carte de crédit régulièrement, quelle est la dette totale de ces familles québécoises? Quelle est la dette totale de ces familles québécoises? Quelle est la précision de votre estimation?précision de votre estimation?
ExempleExemple
Une compagnie désire mettre sur le marché un nouveau Une compagnie désire mettre sur le marché un nouveau logiciel permettant de ne plus recevoir de pourriels. Elle logiciel permettant de ne plus recevoir de pourriels. Elle vise un marché de 800 000 consommateurs potentiels. vise un marché de 800 000 consommateurs potentiels.
Avant de lancer le produit elle fait une enquête auprès de 40 Avant de lancer le produit elle fait une enquête auprès de 40 ménages et 6 se déclarent intéressés par le nouveau produit. ménages et 6 se déclarent intéressés par le nouveau produit.
Le profit par logiciel vendu est de 3$ et la compagnie doit Le profit par logiciel vendu est de 3$ et la compagnie doit absorber des coûts fixes de 50 000$. absorber des coûts fixes de 50 000$.
Quelle est la décision? Quelle est la décision?
Discussion: Est-ce la meilleure façon de répondre à la Discussion: Est-ce la meilleure façon de répondre à la question?question?