1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire...

Post on 04-Apr-2015

105 views 2 download

Transcript of 1 Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire...

1

Chapitre 8: La gestion des donnéesConsulte les pages 366 et 367 pour

les concepts et vocabulaire clés

2

Chapitre 8: Prépare-toi Avant de commencer le chapitre 8, il faut

réviser ces concepts:

1. Représenter des données

2. Les diagrammes à boîte et à moustaches

3. Les mesures de tendance centrale

4. Interpoler et Extrapoler des valeurs

3

8.1: Les diagrammes de dispersion Statistique Canada collectionne et organise

des données pour aider les Canadiens à mieux comprendre leur pays: sa population, ses ressources, son économie, sa société et sa culture.

4

Les diagrammes de dispersion Un diagramme de dispersion est un

diagramme qui permet de représenter graphiquement des couples de données numériques.

Il sert à voir des relations entre deux variables.

5

La droite la mieux ajustée La droite la mieux ajustée est la droite qui

passe par les points représentés dans un diagramme de dispersion ou qui passe le plus près possible de ces points.

6

Une valeur aberrante Une valeur aberrante est une donnée qui

ne suit pas la régularité qui se dégage des autres données.

Cette donnée semble très à l’écart de la plupart des données.

7

Interpoler des valeurs Interpoler des valeurs veut dire

l’estimer des valeurs qui se trouvent entre des données connues.

8

Extrapoler des valeurs Extrapoler des valeurs veut dire

l’estimer des valeurs qui se trouvent à l’extérieur des données connues.

9

Les variables indépendantes Dans une relation, la variable indépendante est

la variable qui détermine la valeur de la variable dépendante.

Par exemple, avec la vitesse, distance/temps, le temps est la variable indépendante parce que la distance le dépend.

D’habitude, la variable indépendante est x

10

Les variables dépendantes Dans une relation, la variable dépendante est la

variable dont la valeur est déterminée par la variable indépendante

Par exemple, avec la vitesse, distance/temps, la distance est la variable dépendante parce que la distance dépend sur le temps pour sa valeur.

D’habitude, la variable dépendante est y

11

Les types des données Il y a deux types: 1. des données

continus

2. des données discrètes

12

Des données continues Si une variable peut représenter n’importe

quel nombre réel, les données sont des données continus.

Quand les données sont rattachées ensemble pour former une droite, cela représente des données continues.

Un exemple des données continus est la température.

13

Des données discrètes Si la variable ne peut pas être n’importe

quel nombre réel (i.e. un nombre décimal), les données sont des données discrètes.

Quand les données ne sont pas rattachées ensemble, cela représente des données discrètes.

Un exemple des données discrètes sont comme le nombre des pages dans un livre.

14

Une corrélation #1 Pour mieux comprendre et mieux organiser

les données, Statistique Canada trace des diagrammes de dispersion pour déterminer une corrélation entre deux variables.

15

Une corrélation #2 Une corrélation est la mesure de la

dispersion des points autour d’une droite dans un diagramme de dispersion (le degré de relation entre deux variables)

16

Les adjectifs d’une corrélation La corrélation entre 2

variables peuvent être:

Forte Faible Positive Négative N’est pas apparente

17

Une corrélation forte Si la plupart des points sont groupés

autour d’une droite, la corrélation est forte.

18

Une corrélation faible Si les points sont dispersés, mais

montrent une tendance générale, la corrélation est faible.

19

La corrélation positive

Une corrélation positive veut dire que la relation entre les variables est positive.

Par exemple, quand la variable indépendante augmente, la variable dépendante augmente alors la pente est positive (elle monte de gauche à droite)

20

La corrélation négative Une corrélation négative veut dire que

la relation entre les variables est négative.

Par exemple, quand la variable indépendante augmente, la variable dépendante diminue alors la pente est négative (elle descend de gauche à droite)

21

Une corrélation n’est pas apparente Si les points sont dispersés et ils ne

montrent pas de tendance générale, il n’y a pas de corrélation ou la corrélation n’est pas apparente.

22

Une relation

Une relation est une régularité entre deux ensembles de nombres.

Une relation = « a relationship »

23

Les types des relations Avec la gestion des

données, il y a 2 types de relations:

Une relation linéaire (elle forme une ligne droite)

Une relation non linéaire (elle ne forme pas de ligne droite)

24

8.2: Analyser des données et faire des prévisions

Pour analyser les données, il est utile à représenter les données à l’aide d’un diagramme de dispersion.

Puis, trace, à vue, la droite la mieux ajustée.

25

La qualité de l’ajustement de la droite

Une grille de corrélation est un guide pour indiquer de la qualité de l’ajustement de ta droite.

26

Une grille de corrélation Corrélation La qualité de l’ajustement

+1 L’ajustement parfait sur une droite de pente positive.

Forte et positive La plupart des points sont groupés autour d’une droite de pente positive.

Faible et positive Les points sont dispersés, mais montrent une tendance générale positive.

0 Aucune relation apparente.

Faible et négative Les points sont dispersés, mais montrent une tendance générale négative.

Forte et négative La plupart des points sont groupés autour d’une droite de pente négative.

-1 L’ajustement parfait sur une droite de pente négative.

27

8.3: Représenter des données Voici 6 types de

représenter des données: (9ième année)

1. Un diagramme de dispersion

2. Un histogramme3. Un diagramme circulaire4. Un diagramme à tiges et

à feuilles5. Un diagramme à boîte et

à moustaches6. Un diagrammes à

bandes

28

Un diagramme à bandes Un diagramme à bandes est un

diagramme qui représente des données à l’aide de bandes horizontales ou verticales.

Il sert à comparer des catégories.

29

Un diagramme circulaire Un diagramme circulaire est un

diagramme qui représente un ensemble de données par un cercle divisé en secteurs.

Il sert à comparer des catégories entre elles et à comparer chaque catégorie à l’ensemble complet.

30

Un diagramme à tiges et à feuilles Un diagramme à tiges et à feuilles

est une façon d’organiser des données numériques qui représente une partie de chaque nombre par une tige et l’autre partie par une feuille.

31

Un histogramme Un histogramme est un diagramme à

bandes juxtaposés qui représente des données groupées par intervalles.

32

Un diagramme à boîte et à moustaches

Un diagramme à boîte et à moustaches est un diagramme qui indique la médiane et l’étendue d’un ensemble de données numériques.

33

Le fonction des diagrammes à boîte et à moustaches

Un diagramme à boîte et à moustaches illustre la dispersion des données autour de la médiane d’un ensemble de données.

34

Le vocabulaire des diagrammes à boîtes et à moustaches La boîte contient ou représente au moins

50% des données. La plus petite valeur et la plus grande se

nomment la valeur minimum et la valeur maximum respectivement.

Le quartile inférieur est la médiane de la moitié inférieure des données.

Le quartile supérieur est la médiane de la moitié supérieure des données.

35

Comment choisir la représentation la plus appropriée

Le diagramme le plus approprié dépend du type de données que tu veux communiquer.

36

Les indices pour choisir la représentation correcte #1

1. Les diagrammes à ligne brisée et les diagrammes de dispersion servent à analyser des tendances.

2. Les histogrammes, les diagrammes à boîte et à moustaches et les diagrammes à tiges et à feuilles servent à analyser l’étendue des données.

37

Les indices pour choisir la représentation correcte #2

3. Les diagrammes à bandes et les diagrammes circulaire servent à comparer des catégories.

38

Les mesures de tendance centrale

Le mesure de tendance centrale est la valeur qui représente le centre d’un ensemble de données.

39

Les types de mesure de tendance centrale

Il y a trois types de mesure de tendance centrale:

1. La moyenne

2. La médiane

3. Le mode

40

La moyenne La moyenne est la somme des valeurs d’un

ensemble divisé par le nombre de valeurs dans l’ensemble.

L’avantage de la moyenne: elle donne des renseignements sur la somme des valeurs.

Le désavantage de la moyenne: les valeur aberrantes ont une incidence sur elle.

41

Le médiane La médiane est la valeur du milieu quand

les données d’un ensemble sont placées par ordre croissant.

L’avantage de la médiane: les valeurs aberrantes ont peu d’incidence sur elle.

Le désavantage de la médiane: elle ne fournit aucun renseignements sur la somme des valeurs.

42

Le mode Le mode est la valeur la plus courante dans

un ensemble de données. L’avantage du mode: il est facile à trouver

dans des tableaux de fréquence, des diagrammes, des diagrammes à bandes ou des histogrammes.

Le désavantage du mode: il peut changer énormément quand il y a ajout de nouvelles données.