CORREG.xls

45
Classeur : "COREG" - Feuille "cours" Page 1 Régression et corrélation Plan 1 Description de 2 variables quantitatives 1 2 Régression simple 2 2.1 Rappels sur l'ajustement linéaire 2 2.2 Autres types d'ajustement 4 2.3 Mesure de la qualité de la régression 5 2.4 Jugement sur échantillon 6 3 Exemples 8 4 Régression multiple 14 Dans le chapitre sur le test du khi-deux, nous avons étudié les liaisons en deux caractères qualitatifs. Ici, nous nous intéresserons aux liaisons entre des caractères quantitatifs (d'abord 2 : c'est la régression simple ; puis plus de 2 : c'est la régress Tout d'abord, nous essaierons de décrire ces liaisons, puis nous proposeron modèles explicatifs. 1. Description de 2 variables quantitatives Exemple 1 Une companie pétrolière décide d'implanter de nouvelles stations-service. On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voi par heure) ainsi que le C.A. moyen réalisé en une heure (variable Y). Station Trafic CA 1 150 2200 2 55 750 3 220 2500 4 130 1450 5 95 1800 6 110 1500

Transcript of CORREG.xls

Page 1: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 1

Régression et corrélation

Plan

1 Description de 2 variables quantitatives 1

2 Régression simple 2

2.1 Rappels sur l'ajustement linéaire 2

2.2 Autres types d'ajustement 4

2.3 Mesure de la qualité de la régression 5

2.4 Jugement sur échantillon 6

3 Exemples 8

4 Régression multiple 14

Dans le chapitre sur le test du khi-deux, nous avons étudié les liaisons entre

deux caractères qualitatifs.

Ici, nous nous intéresserons aux liaisons entre des caractères quantitatifs :

(d'abord 2 : c'est la régression simple ; puis plus de 2 : c'est la régression multiple)

Tout d'abord, nous essaierons de décrire ces liaisons, puis nous proposerons des

modèles explicatifs.

1. Description de 2 variables quantitativesExemple 1

Une companie pétrolière décide d'implanter de nouvelles stations-service.

On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voitures

par heure) ainsi que le C.A. moyen réalisé en une heure (variable Y).

Station Trafic CA1 150 2200 2 55 750 3 220 2500 4 130 1450 5 95 1800 6 110 1500

Page 2: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 2

Nuage de points

2. Régression simple

2.1 Rappels sur l'ajustement linéaire

Lorsque l'allure du nuage de points le commande, on réalise un "ajustement linéaire"

On fait passer une droite "au mieux" dans un nuage de points.

Y = b0 + b1 X

Chaque point correspond à un couple (xi, yi) de valeurs des variables X et Y.

yci est la valeur calculée à l'aide de la droite à partir de xi

yci = b0 + b1 xi

L'écart entre yci et yi est appelé écart résiduel ou résidu , on le note : ei

La méthode des moindres carrés minimise la somme des ei2

40 60 80 100 120 140 160 180 200 220 240

0

500

1000

1500

2000

2500

3000

Description des C.A. en fonction du trafic

,

Page 3: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 3

On trouve

Exemple : Station Trafic CA CA calc résidu

1 150 2200 ### ###

2 55 750 ### ###

3 220 2500 ### ###

4 130 1450 ### ###

5 95 1800 ### ###

6 110 1500 ### ###

40 60 80 100 120 140 160 180 200 220 240 0

500

1000

1500

2000

2500

3000

f(x) = 9.80340063761956 x + 458.235919234856R² = 0.791219342800003

CA en fonction du trafic

CALinear ( CA)CA calc

Ces 2 graphiques sont des nuages de points. Dans les 2 cas, le trafic est en abscisse. Dans le premier cas, le CA est en or -donnée et on ne représente que les points, Dans le second, le CA calculé est en ordonnée et on représente aussi les lignes.

b1 = cov (X,Y )var (X )

=∑i=1

n

( x i - { x )( y i - { y )

∑i=1

n

( x i - { x )2¿ ¿b 0 = { y¿ -b1 x ¿ ¿ x est la moyenne des x i ¿ y est la moyenne des y i ¿¿

Page 4: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 4

Usage de la fonction matricielle : DROITEREG

La plage ci-dessous, (nommée : RESULT), contient certains résultats importants

fournis par EXCEL

La première cellule (en haut à gauche), correspond à la pente de la droite.

La deuxième (en haut, à droite), correspond au second membre.

### ### les autres cellules sont expliquées par des

### ### commentaires, nous y reviendrons par la suite.

### ###

### 4 ### ###

2.2Autres types d'ajustements

SAVOIR-FAIRE EXCELLa droite des moindres carrés peut être déterminée par EXCEL avec les fonctions matricielles : TENDANCE et DROITEREG

Le moyen le plus simple est cependant de "coller directement" la droite sur le graphique (sélectionner la série de données et choisir l'option "ajouter une courbe de tendance" dans le menu contextuel) et d'afficher l'équation et le coefficient de détermination (options).Il existe aussi un utilitaire d'analyse : Régression linéaire

SAVOIR-FAIRE EXCELIl existe aussi une fonction CROISSANCE qui est l'équivalent de TENDANCE pour l'ajustement exponentiel.L'équivalent de la fonction DROITEREG est dans ce cas : LOGREG.Mais là encore, le moyen le plus simple est de coller directement la fonction sur le graphique.

B126
La pente de la droite de régression
C126
Le second membre de la droite de régression
B127
Estimation de l'écart-type pour la pente
C127
Estimation de l'écart-type du second membre
B128
Le coefficient de détermination est le rapport entre variance expliquée et variance totale. C'est le carré du coefficient de corrélation et on le note r²
C128
Estimation de l'écat-type d'une prévision
B129
Le F de FISCHER est utilisé pour tester la qualité de la régression.
C129
Nombre de degrés de liberté
B130
n fois la Variance expliquée
C130
n fois la variance résiduelle
Page 5: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 5

2.3Mesure de la qualité de la régression

Variance totale = Variance expliquée + Variance résiduelle

Le coefficient de détermination

mesure la part de la variance totale qui est expliquée par la régression

Le coefficient de corrélation

est égale à la racine carrée du coefficient de corrélation.

Le coefficient de corrélation (tout comme le coefficient de détermination)

Plus il est proche de -1, plus l'intensité de la relation est négativement forte

Plus il est proche de 1, plus l'intensité de la relation est positivement forte

Plus il est proche de 0, plus l'intensité de la relation est faible.

Attention à l'utilisation et à l'interprétation !

permet de juger de l'intensité de la relation existant entre les variables.

Attention, il peut être négatif ! (il est du signe de b1).

Ve r² = ----- Vt

Ve r² = ----- Vt

Vt = ∑i

( y i− y )2

nVe = ∑

i

( y ci− y )2

nVr = ∑

i

( y i -y ci )2

n=∑

i

e i2

n

SAVOIR-FAIRE EXCEL utiliser les fonctions COEFFICIENT.CORRELATION COEFFICIENT.DETERMINATION Il existe aussi un utilitaire d'analyse : Analyse de corrélation

Page 6: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 6

2.4 Jugement sur échantillon

L'équation de régression est obtenue à partir d'un ensemble d'observations que

l'on doit considérer comme un échantillon à partir du moment où les résultats de

l'étude ont un objectif qui dépasse la simple description d'une liaison observable

sur un ensemble (par exemple : prévision).

Les hypothèses à respecter :

Ce modèle peut être testé de différentes manières :

nous en présenterons deux ici : le test de Student sur la pente et le test de

Fischer.

Echantillon

Y = b1 X + b0

yi = b1 xi + b0 + ei

Population

Y = b1 X + b0

yi = b1 xi + b0 + ei

Population

Y = b1 X + b0

yi = b1 xi + b0 + ei

Les ei doivent être des variables aléatoires indépendantes , normalement distribuées - de moyennes nulles (absence de biais) E(ei) = 0 - de variances égales (homoscédacité) V(ei) est estimé par S ei² /(n-2)

Page 7: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 7

2.4. Test sur la pente

calculs

###

###

seuil : 0.05 borne inf. ###

t = ### borne sup ###

décision

c'est à dire avec au plus 5.00% de risque d'erreur

Variante méthodologique

###

et en appliquant le fonction STUDENT, déterminer la p-valeur

p = ### pour un test bilatéral.

Décision: Puisque la p-valeur est inférieure au seuil de 5%,

on peur rejeter (H0)

test associé : on peut tester l'hypothèse (H0) : "b1 = 0"

b1 =

Sb1 =

0 n'est pas dans l'intervalle, donc on peut rejeter (H0) au seuil choisi.

On peut directement calculer le rapport b1 / Sb1 =

b1 ± t sb1

sb1 étant l'estimation de l'écart-type de b1

valeur donnée par EXCEL (lig.2, col.1)t correspond à la loi de Student à n-2 d.d.l

b1 ± t sb1

sb1 étant l'estimation de l'écart-type de b1

valeur donnée par EXCEL (lig.2, col.1)t correspond à la loi de Student à n-2 d.d.l

s b1 = √ ∑

i

e i2

(n-2 )∑i

( x i− x )2

Page 8: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 8

2.4. Test de FISCHER

La valeur du F de FISCHER est donnée dans le tableau RESULT (lig. 4, col. 1)

Remarque

Avec Excel, on peut également utiliser l'utilitaire d'analyse qui donne directement

tous les tests.

Outils / Utilitaire d'Analyse / Régression linéaire

RAPPORT DÉTAILLÉ

Statistiques de la régression

Coefficient de détermination multiple ###

Coefficient de détermination R^2 ###

Coefficient de détermination R^2 ###

Erreur-type ###

Observations 6

ANALYSE DE VARIANCE

F

Régre 1 ### ### ### ###

Résid 4 ### ###

Total 5 1905000

Coefficients Erreur-type Statistique t Probabilité

Consta ### ### ### ### ### ### ### ###

Trafic ### ### ### ### ### ### ### ###

Exemples

Exemple 2

Les coûts de crédit

Degré de liberté

Somme des carrés

Moyenne des carrés

Valeur critique de

F

Limite inférieure pour seuil de confiance = 95%

Limite supérieure pour seuil de confiance = 95%

Limite inférieure pour seuil de confiance = 95,0%

Limite supérieure pour seuil de confiance = 95,0%

Page 9: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 9

Lorsque vous contractez un emprunt auprès d'une banque, il y a différents types de coûts.

Nous considérons ici :

- le taux d'intérêt (un pourcentage)

- le coût d'entrée (un pourcentage du montant emprunté)

On désire étudier la relation entre ces deux pourcentages à partir d'un échantillon de 66 banques.

Taux d'intérêt frais

Alaska USA FCU 10.25 2

Amco Mortgage 10.125 1.95

American Builders 10.25 2

ARCS Mortgage 10.2 2

Bay Mortgage 10.25 2

Benjamin Franklin 10.25 1.5

Cambelco Motgage 10.125 2

Cascade Pacific Mort 10.125 2

Cascade S&L 10.25 1.5

Center Mortgage 10.125 2.5

Centrust Mortgage 10.5 1.125

Chase Manhattan 10.875 2

Citified Mortgage 10.25 2

Coast Exchange 10.25 2

Columbia Federal 10.5 2

r = -0.441

0 2 4 6 8 10 12

0

2

4

6

8

10

12

Comparaison de prêts

frais d'entrée

tau

x d

'inté

rêt

Page 10: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 10

Exemple 3

L'effet "mémoire" des marchés financiersOn souhaite savoir si un marché financier a une "mémoire", autrement dit s'il existe

une liaison entre les variations d'un jour et les variations de la veille.

Les données suivantes représente la variation (en relatif)

du Dow Jones sur une durée de 2 mois.

Aujourd'hui Hier

July 2 -0.29 1.12

0.83 -0.29

0.58 0.83

-0.52 0.58

0.2 -0.52

-0.12 0.2

1.16 -0.12

0.1 1.16

0.53 0.1

0.52 0.53

-0.89 0.52

-0.8 -0.89

0.09 -0.8

0.07 0.09

0.54 0.07

0.35 0.54

1.04 0.35

0.78 1.04

1.1 0.78

0.18 1.1

-0.58 0.18

-0.41 -0.58

r = 0.043

0 2 4 6 8 10 12

0

2

4

6

8

10

12

L'effet mémoire d'un marché financier

Hier

Au

jou

rd'h

ui

Page 11: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 11

Exemple 4

Les options

Acheter une option revient à acquérir un droit d'acheter (par exemple une action),

à un certain prix appelé prix d'exercice. Ce droit peut être exercé à toute date

antérieure à la date d'expiration de l'option.

Les données suivantes correspondent à un échantillon de 10 options.

230 34

245 19.25

250 15.875

255 11.625

260 8.125

265 5.25

270 3.25

275 1.8125

280 0.9375

285 0.5

Les données sont issues de

The Wall Street Journal, November 9, 1988, p.C15. r = -0.962

Prix d'exercic

ePrix de l'option

220 270 320 370 420 470

0

2

4

6

8

10

12

Les options

Prix d'exercice

Pri

x d

e l

'op

tio

n

Page 12: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 12

Exemple 5

Température et rendement d'un process industriel

Les données suivantes correspondent à une expérience destinée à trouver la température

donnant le meilleur rendement pour un process industriel.

Rendement

600 127

625 139

650 147

675 147

700 155

725 154

750 153

775 148

800 146

825 136

850 129

r = ###

Températur

e

580 680 780 880 980 1080 1180

120

140

160

180

200

220

240

Rendement et température

Page 13: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 13

Exemple 6

Quantité produite et coût

On souhaite étudier la liaison entre le nombre de pièces produites chaque semaine

dans une usine, et le coût total de la production.

Coût

22 3.47

30 3.783

26 3.856

31 3.91

36 4.489

30 3.876

22 3.221

45 4.579

38 4.325

3 14.131

30 3.589 r = ###38 3.999

41 4.158

27 3.666

28 3.885

31 3.574

37 4.495

Quantité

0 2 4 6 8 10 12

0

2

4

6

8

10

12

Quantité produite et coût

0 2 4 6 8 10 12

0

2

4

6

8

10

12

Même graphique sans le "point aberrant"

Page 14: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 14

32 3.814

41 4.43

r = ###

0 2 4 6 8 10 12

0

2

4

6

8

10

12

Même graphique sans le "point aberrant"

Page 15: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 15

Exemple 7

Location d'appartements

Voici un ensemble de données qui semble contredire tous les principes économiques !

Airport 4.80% 378

Auburn 5.30% 368

Ballard 1.30% 348

Beacon Hill 4.90% 391

Bellevue-East 4.20% 463

Bellevue-West 3.60% 581

Bothel/juanita 4.40% 483

Burien 3.50% 363

Capitol Hill/Eastlake 5.00% 395

Central 10.10% 301

Des Moines 4.80% 406

Downtown Seattle 8.30% 449

Federal Way 4.50% 403

First Hill 6.30% 400

Greenlake/Wall 2.30% 429

Kent 4.40% 424

Kirkland 1.50% 561

Madison/leschi 0.40% 572

Magnolia 1.40% 443

Mercer Island 6.40% 472 r = ###North King Co. 3.70% 433

North Seattle 3.20% 423

Queen Anne 3.30% 428

Rainnier Valley 15.70% 341

Redmond 3.90% 501

Renton 6.00% 416

Riverton/tukwila 4.70% 381

Universty 4.30% 430

West Seattle 3.90% 355

White Center 6.10% 381

King Country 4.70% 428

Pourcentage de non-

occupationLoyer

mensuel

300 350 400 450 500 550 600

0

2

4

6

8

10

12

Les appartements

loyer mensuel en dollars

taux de non-occupation

Page 16: CORREG.xls

Classeur : "COREG" - Feuille "cours" Page 16

4. Régression multiple

Lorsqu'un phénomène quantifiable s'explique en faisant appel à plus d'un facteur

explicatif, on peut utiliser la régression multiple.

Exemple 8

Une entreprise a organisé une campagne promotionnelle sur un territoire divisé

en 8 secteurs.

Le directeur, voulant tester l'efficacité du mix promotionnel, se fait communiquer

le volume des ventes et le budget de publicité de chacun des 8 secteurs.

Il obtient le tableau suivant :

VENTES PUB VISITES

1 75 110 26

2 76 95 28

3 82 75 34

4 82 90 31

5 76 85 29

6 83 80 36

7 76 105 25

8 74 120 23

Utilisation de DROITEREG

### ### ###

### ### ###

### ### #N/A

### 5 #N/A

### ### #N/A

L'équation du "plan de régression est :

Ventes = 1,02 Visites + 0,082 Pub + 40,67

Page 17: CORREG.xls

Exemple 1

Page 17

Exemple 1Une companie pétrolière décide d'implanter de nouvelles stations-service.On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voiture par heure)ainsi que le C.A. moyen réalisé en une heure (variable Y).

Station Trafic CA1 150 2200 2 55 750 3 220 2500 4 130 1450 5 95 1800 6 110 1500

Page 18: CORREG.xls

Exemple 1

Page 18

Une companie pétrolière décide d'implanter de nouvelles stations-service.On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voiture par heure)

Page 19: CORREG.xls

Exemple 2

Page 19

Exemple 2Les coûts de créditLorsque vous contractez un emprunt auprès d'une banque, il y a différents types de coûts.Nous considérons ici :- le taux d'intérêt (un pourcentage)- le coût d'entrée (un pourcentage du montant emprunté)On désire étudier la relation entre ces deux pourcentages à partir d'un échantillon de 66 banques.

Taux d'intérêt fraisAlaska USA FCU 10.25 2Amco Mortgage 10.125 1.95American Builders 10.25 2ARCS Mortgage 10.2 2Bay Mortgage 10.25 2Benjamin Franklin 10.25 1.5Cambelco Motgage 10.125 2Cascade Pacific Mortgage 10.125 2Cascade S&L 10.25 1.5Center Mortgage 10.125 2.5Centrust Mortgage 10.5 1.125Chase Manhattan 10.875 2Citified Mortgage 10.25 2Coast Exchange 10.25 2Columbia Federal 10.5 2Columbia Services 10.5 2Commonwealth Mortgage 10.25 1.5Continental Motgage 10.25 2Crossland Mortgage 10.25 2.75Direct Mortgage Services 10.25 2Family Savings 10.375 2Far West Mortgage 10.125 2First Fed Savings of WA 10.375 1.5First Interstate 10.375 2Fireman's Fund Mortgage 10.125 2.25First Mutual 10.25 2First Union Mortgage 10.25 2.25Fleet Mortgage Corp 10.375 2.5GMAC Mortgage 10.125 2.5Goldome Rainier 9.875 3.375Great American Bank 10.5 1.5Great NW Federal S&L 10.25 2Great Pacific Mortgage 10.25 2Great Western Bank 10.7 2Hallmark Mortgage 10.25 2Hoover Mortgage 10.125 2ICA Mortgage 10.25 2

Page 20: CORREG.xls

Exemple 2

Page 20

Key Pacific Mortgage 10.25 2Metropolitan Federal 10.125 2

Mornet of WA 10.25 2

Mortgage Brokers 10.25 2Mt. Baker Bank 10.375 2Norwest Mortgage 10.25 2.5Old Stone Bank 10 3.5Olympic Savings bank 10.25 2Pacific First Mortgage 10.25 2.5Pacific R.E. Mortgage 10.375 2Pioneer Federal Savings 10.375 2Principal Financial 10.25 2Pacific West Mortgage 10.125 2.25Rainier Bank 10.5 2Seafirst Home Loans 10.375 2Sears Mortgage 10.25 2Summit Savings 10.5 2Security Pacific N.B. 10.5 2Shearson Lehman 10.375 1.5Standard Green Mortgage 10.25 1.625Sterling Mortgage 10.125 2U.S. Bankcorp Mortgage 10.375 1.875United Pacific Mortgage 10.125 2.25University Fed Savings 10.25 2University Mortgage 10.25 2Valley Mortgage 10.25 2Washington Mutual 10.5 2Weyerhaeuser 10.25 2Willamette Financial 10.375 2

Les données sont issues de "How the Summer rates" Seattle Times, July 3 1988, p. D1.Sources : Scotsman Publishing's Electronic Bulletin et Western Wahington Bulletin.

Page 21: CORREG.xls

Exemple 2

Page 21

Lorsque vous contractez un emprunt auprès d'une banque, il y a différents types de coûts.

On désire étudier la relation entre ces deux pourcentages à partir d'un échantillon de 66 banques.

Page 22: CORREG.xls

Exemple 3

Page 22

Exemple 3L'effet "mémoire" des marchés financiersOn souhaite savoir si un marché financier a une "mémoire", autrement dit s'il existeune liaison entre les variations d'un jour et les variations de la veille.Les données suivantes représente la variation (en relatif)du Dow Jones sur une durée de 2 mois.

Aujourd'hui HierJuly 2, 1987 -0.29 1.12

0.83 -0.290.58 0.83

-0.52 0.580.2 -0.52

-0.12 0.21.16 -0.12

0.1 1.160.53 0.10.52 0.53

-0.89 0.52-0.8 -0.890.09 -0.80.07 0.090.54 0.070.35 0.541.04 0.350.78 1.04

1.1 0.780.18 1.1

-0.58 0.18-0.41 -0.580.78 -0.411.07 0.78

-0.09 1.071.69 -0.091.69 1.69

-0.42 1.690.83 -0.42

-0.23 0.830.56 -0.23-1.7 0.560.42 -1.71.54 0.42

0.1 1.54-0.46 0.10.94 -0.46

-0.76 0.94-0.99 -0.76-1.33 -0.99

August 31, 198 0.89 -1.33

Page 23: CORREG.xls

Exemple 4

Page 23

Exemple 4Les optionsAcheter une option revient à acquérir un droit d'acheter (par exemple une action),à un certain prix appelé prix d'exercice. Ce droit peut être exercé à toute dateantérieure à la date d'expiration de l'option.Les données suivantes correspondent à un échantillon de 10 options.

Prix d'exercice Prix de l'option230 34245 19.25250 15.875255 11.625260 8.125265 5.25270 3.25275 1.8125280 0.9375285 0.5

Les données sont issues de The Wall Street Journal, November 9, 1988, p.C15.

Page 24: CORREG.xls

Exemple 5

Page 24

Exemple 5Température et rendement d'un process industrielLes données suivantes correspondent à une expérience destinée à trouver la températuredonnant le meilleur rendement pour un process industriel.

Température Rendement600 127625 139650 147675 147700 155725 154750 153775 148800 146825 136850 129

Page 25: CORREG.xls

Exemple 5

Page 25

Les données suivantes correspondent à une expérience destinée à trouver la température

Page 26: CORREG.xls

Exemple 6

Page 26

Exemple 6Quantité produite et coûtOn souhaite étudier la liaison entre le nombre de pièces produites chaque semainedans une usine, et le coût total de la production.

Production hebdomadaire

Quantité Coût

22 3.47

30 3.783

26 3.856

31 3.91

36 4.489

30 3.876

22 3.221

45 4.579

38 4.325

30 3.589

38 3.999

41 4.158

27 3.666

28 3.885

31 3.574

37 4.495

32 3.81441 4.43

x

Page 27: CORREG.xls

Exemple 7

Page 27

Exemple 7Les locations d'appartement le taux d'occupation

Loyer mensuelAirport 4.80% 378Auburn 5.30% 368Ballard 1.30% 348Beacon Hill 4.90% 391Bellevue-East 4.20% 463Bellevue-West 3.60% 581Bothel/juanita 4.40% 483Burien 3.50% 363Capitol Hill/Eas 5.00% 395Central 10.10% 301Des Moines 4.80% 406Downtown Seatt 8.30% 449Federal Way 4.50% 403First Hill 6.30% 400Greenlake/Wall 2.30% 429Kent 4.40% 424Kirkland 1.50% 561Madison/leschi 0.40% 572Magnolia 1.40% 443Mercer Island 6.40% 472North King Co. 3.70% 433North Seattle 3.20% 423Queen Anne 3.30% 428Rainnier Valley 15.70% 341Redmond 3.90% 501Renton 6.00% 416Riverton/tukwil 4.70% 381Universty 4.30% 430West Seattle 3.90% 355White Center 6.10% 381King Country 4.70% 428

Pourcentage de non-

occupation

Page 28: CORREG.xls

Exemple 8

Page 28

Exemple 8Une entreprise a organisé une campagne promotionnelle sur un territoire diviséen 8 secteurs.Le directeur, voulant tester l'efficacité du mix promotionnel, se fait communiquerle volume des ventes et le budget de publicité de chacun des 8 secteurs.Il obtient le tableau suivant :

VENTES PUB VISITES

1 75 110 26 2 76 95 28 3 82 75 34 4 82 90 31 5 76 85 29 6 83 80 36 7 76 105 25 8 74 120 23

Page 29: CORREG.xls

RAPPORT DÉTAILLÉ

Statistiques de la régressionCoefficient de ###Coefficient d ###Coefficient d ###Erreur-type ###Observations 34

ANALYSE DE VARIANCEDegré de libertéSomme des carrésMoyenne des carrés F Valeur critique de F

Régression 2 ### ### ### ###Résidus 31 ### ###Total 33 ###

Coefficients Erreur-type Statistique t ProbabilitéLimite inférieure pour seuil de confiance = 95%Constante ### ### ### ### ###Price ### ### ### ### ###Promotion ### ### ### ### ###

ANALYSE DES RÉSIDUS RÉPARTITION DES PROBABILITÉS

ObservationPrévisions Sales Résidus Résidus normalisés Centile1 ### ### ### ###2 ### ### ### ###3 ### ### ### ###4 ### ### ### ###5 ### ### ### ###6 ### ### ### ###7 ### ### ### ###8 ### ### ### ###9 ### ### ### 25

10 ### ### ### ###11 ### ### ### ###12 ### ### ### ###13 ### ### ### ###14 ### ### ### ###15 ### ### ### ###16 ### ### ### ###17 ### ### ### ###18 ### ### ### ###19 ### ### ### ###20 ### ### ### ###21 ### ### ### ###22 ### ### ### ###23 ### ### ### ###24 ### ### ### ###25 ### ### ### ###26 ### ### ### 75 27 ### ### ### ###28 ### ### ### ###29 ### ### ### ###

55 60 65 70 75 80 85 90 95 100 105

-2000

-1500

-1000

-500

0

500

1000

1500

2000

Price Graphique des résidus

PriceR

és

idu

s

Page 30: CORREG.xls

30 ### ### ### ###31 ### ### ### ###32 ### ### ### ###33 ### ### ### ###34 ### ### ### ###

Page 31: CORREG.xls

Valeur critique de F

Limite supérieure pour seuil de confiance = 95%Limite inférieure pour seuil de confiance = 95,0%Limite supérieure pour seuil de confiance = 95,0%### ### ###### ### ###### ### ###

RÉPARTITION DES PROBABILITÉS

Sales675 761 820

1096 1602 1882 1916 2088 2114 2159 2295 2618 2730 2927 3056 3224 3354 3507 3519 3532 3636 3746 3754 3825 3842 4011 4113 4141 4226

55 60 65 70 75 80 85 90 95 100 105

-2000

-1500

-1000

-500

0

500

1000

1500

2000

Price Graphique des résidus

Price

sid

us

150 200 250 300 350 400 450 500 550 600 650

-2000

-1000

0

1000

2000

Promotion Graphique des résidus

Promotion

Rés

idu

s

55 60 65 70 75 80 85 90 95 100 105 0

2000

4000

6000

Price Courbe de régression

Sales

Prévisions Sales

Price

Sal

es

150 200 250 300 350 400 450 500 550 600 650 0

2000

4000

6000

Promotion Courbe de régression

Sales

Prévisions Sales

Promotion

Sal

es

Page 32: CORREG.xls

4421 4630 5000 5015 5120

Page 33: CORREG.xls

150 200 250 300 350 400 450 500 550 600 650

-2000

-1000

0

1000

2000

Promotion Graphique des résidus

Promotion

Rés

idu

s

55 60 65 70 75 80 85 90 95 100 105 0

2000

4000

6000

Price Courbe de régression

Sales

Prévisions Sales

Price

Sal

es

150 200 250 300 350 400 450 500 550 600 650 0

2000

4000

6000

Promotion Courbe de régression

Sales

Prévisions Sales

Promotion

Sal

es

0 20 40 60 80 100 120 0

2000

4000

6000

Répartition des probabilités

Centile

Sal

es

Page 34: CORREG.xls

150 200 250 300 350 400 450 500 550 600 650 0

2000

4000

6000

Promotion Courbe de régression

Sales

Prévisions Sales

Promotion

Sal

es

0 20 40 60 80 100 120 0

2000

4000

6000

Répartition des probabilités

Centile

Sal

es

Page 35: CORREG.xls

Sales Price Promotion Constante4141 59 200 ### ### Price3842 59 200 ### ### Promotion3056 59 200 ### ###3519 59 200 ### ###4226 59 400 ### ###4630 59 400 ### ###3507 59 400 ### ###3754 59 400 ### ###5000 59 600 ### ###5120 59 600 ### ###4011 59 600 ### ###5015 59 600 ### ###1916 79 200 ### ###

675 79 200 ### ###3636 79 200 ### ###3224 79 200 ### ###2295 79 400 ### ###2730 79 400 ### ###2618 79 400 ### ###4421 79 400 ### ###4113 79 600 ### ###3746 79 600 ### ###3532 79 600 ### ###3825 79 600 ### ###1096 99 200 ### ###

761 99 200 ### ###2088 99 200 ### ###

820 99 200 ### ###2114 99 400 ### ###1882 99 400 ### ###2159 99 400 ### ###1602 99 400 ### ###3354 99 600 ### ###2927 99 600 ### ###

55 60 65 70 75 80 85 90 95 100 105

-1500

-1000

-500

0

500

1000

1500

2000

Column E

Page 36: CORREG.xls

#########

55 60 65 70 75 80 85 90 95 100 105

-2000

-1500

-1000

-500

0

500

1000

1500

2000

Price Graphique des résidus

Price

sid

us

55 60 65 70 75 80 85 90 95 100 105

-1500

-1000

-500

0

500

1000

1500

2000

Column E

Page 37: CORREG.xls

55 60 65 70 75 80 85 90 95 100 105

-2000

-1500

-1000

-500

0

500

1000

1500

2000

Price Graphique des résidus

Price

sid

us

Page 38: CORREG.xls

Exercice

Page 38

Exercice

On a pris un échantillon de 24 voitures de même modèle, mais d'âges différents, qui on été vendues récemment. Les données suivantes correspondent aux âges des 24 véhicules,et à leurs prix de vente.

Age Prix1 119,4003 73,2005 51,0002 91,8008 36,6002 102,0003 73,8001 120,6006 42,6007 39,6004 61,8008 31,2005 48,6001 126,0005 52,8003 70,2006 43,2006 53,4007 40,8004 63,4007 36,0008 33,0004 64,8002 93,000

1 Décrire ces données

2 Proposez un ajustement linéaire

Testez l'hypothèse d'absence de liaison

Page 39: CORREG.xls

Exercice

Page 39

3 Proposez un ajustement exponentiel

Comparez ces deux ajustements