Post on 03-Apr-2015
Statistique Descriptive
chapitre 0 : Introduction
Pr. Abdelkrim EL MOUATASIM
EST de Guelmim
Maroc
Site internet : http://el-mouatasim.webs.com
Objectif
Connaître les grands aspects de la
statistique ainsi que son utilité dans
le domaine de la finance …
Introduction Les tableaux et représentations
graphiques Paramètres de tendance centrale
Paramètres de dispersion
Plan :
Bibliographie
Fabrice Mazerolle, Statistique descriptive, 2006
Marie-Helene de Sede-Marceau, Introduction à la statistique descriptive, 2011
Philippe Cinquin, Introduction & statistiques descriptives, 2010
Historique Dénombrement de populations humaines pour les besoins de la
guerre et de l'impôt. Véritable début : 18ième siècle :
Arithmétique politique : connaissance d'un état Calcul des probabilités en France (Pascal, Bernouilli, Laplace,
Gauss, Poisson) Statistiques mathématiques modernes 19ième siècle 1853 premier
congrès Première moitié du 20ième siècle
Statistiques biologiques et psychologiques Biométrie et Psychométrie
1930 Econométrie, Contrôle de qualité industriel 1940 Recherche opérationnelle
Deuxième moitié du 20ième siècle Développement de l'informatique Test de rang, test « exact » Analyses multi variées ou multidimensionnelles Analyse des données Méthodes bayesiennes
Statistique
« C ’est un ensemble de méthodes permettant de décrire et d ’analyser, de façon quantifiée, des phénomènes repérés par des éléments nombreux, de même nature, susceptibles d ’être dénombrés et classés. »
1. Statistique descriptive
2. Statistique mathématique ou inférentielle
QU’EST CE QUE LA STATISTIQUE DESCRIPTIVE?
8
Statistiques descriptives
Définition: ensemble de techniques permettant d’obtenir de l’information à partir d’observations nombreuses Permet de se renseigner sur des faits pour prendre les
meilleurs décisions
Utilisation: Comptabilité, finance
Séries chronologiques sur des bilans ou comptes de résultats, gestion du capital, trésorerie, opérations avec les banques
Production Gestion des stocks, du matériel, contrôle de la qualité
Achats, ventes Statistiques des ventes, études de marché.
La statistique descriptiveLa statistique descriptive
Définition Définition
La statistique descriptive est un traitement de
données qui offre des outils appropriés (Tableau,
graphiques et mesures numériques) permettant de
dégager l’information essentielle qui se
dissimule dans un grand nombre de données
brutes.
La Statistique Descriptive est l'ensemble des
méthodes et techniques permettant de
présenter, de décrire et de résumer des
données numériques nombreuses et
variées.
La statistique descriptive … La statistique descriptive …
Il existe trois types de traitements que nous pouvons effectuer sur une série statistique : 1) La synthèse de la série à l’aide d’un tableau
statistique
2) Les représentations graphiques du caractère étudié
3) Le calcul des mesures caractéristiques.
12
Vocabulaire (1)
Population : ensemble des individus (ou unités statistiques) présentant un caractère commun.
Exemples: l’ensemble des entreprises aux Maroc Le parc automobile marocain: ensemble des automobiles
immatriculées sur le territoire marocain. Le parc de logements de Guelmim: ensemble des
logements de la ville de Guelmim. Unité statistique (ou individu): élément de base constitutif de la
population à laquelle il appartient. Exemples: une automobile, un logement, une ville, etc.
Échantillon: sous-ensemble construit et représentatif d’une population donnée. Ex: les entreprises recensées dans une base de données
13
Vocabulaire (2)
Caractère(s) : caractéristique(s) de l’individu intégrant la population étudiée. Qualitatifs
Ex: destination des voyages Quantitatifs
Discrets Ex: nombre de jours d’absence des employés pendant une période
Continus Ex: taille ou poids des individus dans une population
Variable: une variable est une caractéristique pouvant prendre plusieurs des valeurs d’un ensemble d’observations possibles auquel une mesure ou une qualité peut être appliquée.
Exemples: La couleur, le sexe.. La marque.. Le poids, la taille, le prix, la surface..
Sous quelle forme se présentent les données statistiques ?
Exemple 1 : Pour étudier la répartition des terres agricoles d'une région, on peut faire l'inventaire des exploitations agricoles (soit n leur nombre), et noter pour chacune d'elle sa taille (en hectares).
L'ensemble des n exploitations s'appelle la population statistique étudiée; chacune des exploitations est un individu, ou une unité statistique. La taille (en ha) est la variable statistique (ou caractère) étudiée.
Le but de l'étude est de voir comment cette variable varie sur la population : les tailles des exploitations sont elles comparables ou très différentes, et dans quelle mesure ?
Le résultat de la mesure de la variable "taille" sur les individus "exploitations" est un ensemble de n nombres, appelé série statistique brute.
Sur la même population, on aurait pu s'intéresser à d'autres variables telles l'âge du chef d'exploitation, la culture dominante, etc.. On remarquera que le résultat de l'observation peut être exprimé sous forme littérale (blé, etc...) ou numérique.
On présente alors souvent les résultats sous forme d'un tableau 'individus x variables'.
N° Exploitation Taille (ha) Age du chef
d'exploitation (années) Culture dominante
Nombre de personnes employées
1 50 50 blé 2
2 50.5 45 vigne 4
3 35 38 orge 3
4 62.1 25 blé 6
5 20 65 vigne 1
6 10 57 vigne 1
. . . . .
. . . . .
630 56 45 blé 2
Dans le tableau présenté ci-dessus, il y a :
combien d'individus ?
combien de variables ?
Exemple 2 : Un contrôleur doit vérifier le bon fonctionnement d'une chaîne d'embouteillage.
On considère que le remplissage est correct si le contenu des bouteilles se situe entre 74 cl et 76 cl.
Il note exactement le contenu de 100 bouteilles testées (en cl) :74.3 75.2 73 75 75.6 ....
Il s'agit d'une série statistique brute résultant de la mesure de la variable (ou caractère) ……..sur les individus (ou unités statistiques)…..… ?
La population étudiée comporte
….. individus.
D'autre part, si on s'intéresse uniquement à l'aspect "correct" ou non du remplissage (c'est-à-dire au contenu compris entre 74 et 76 cl ou pas), on peut définir comme ci-dessous une variable "qualité".
Contenu Qualité
1 74.3 Bonne
2 75.2 Bonne
3 73 Mauvaise
4 75 Bonne
5 75.6 Bonne
... ... ...
98 76.1 Mauvaise
99 74.2
100 72
Le tableau de données brutes ci-dessus comporte :
individus ?
variables ?
Notons que la statistique descriptive traite des propriétés des populations, plus que de celles d'individus particuliers.
Ainsi pour la population de 100 bouteilles, on s'intéressera à la proportion de
bouteilles trop ou pas assez remplies, et non au fait que la 10ème bouteille testée
était ou non bien remplie.
En résumé la statistique descriptive s'applique au cas où l'on dispose des valeurs prises par une ou plusieurs
variables statistiques sur un ensemble d'individus, la population statistique.
Les différents aspects de la statistique
descriptive
1. Quantitative : ses valeurs sont des nombres exprimant une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens.
La variable peut alors être discrète ou continue selon la nature de l'ensemble des valeurs qu'elle est susceptible de prendre (valeurs isolées ou intervalle).
27
Statistiques à 1 caractère quantitatif
Nombre de jours d’absence
Nombre d’employés concernés
Fréquence: fi
0 5 19
1 8 30
2 6 22
3 3 11
4 2 7
5 1 4
6 2 7
Classes Effectifs %%
cumulés
Moins de 5000 30 30 30
5000 - 6000 32 16 46
6000 – 8000 22 22 68
8000 - 10000 11 11 79
10000 - 16000 5 15 94
Plus de 16000 3 6 100
Les valeurs du caractère étudié sont quantitatives. On peut les ordonner, cumuler les fréquences, calculer des moyennes, etc.
Exemples: Discret: Nombre de jours d’absence dans le service « Achats » Continu: Les salaires des employés dans une entreprise
ExemplesTailleChiffre d’affaireNombre d’enfants
2. Qualitative : ses valeurs sont des modalités, ou catégories, exprimées sous forme littérale ou par un codage numérique.
30
Statistiques à 1 caractère qualitatif Les valeurs du caractère étudié (modalités) sont
qualitatives. On ne peut pas les mesurer ou les ordonner. Ex: caractère étudié : destination des voyages Présentation des données: tableau par catégorie avec effectifs
Destination Effectifs Fréquences Pourcentages
Europe 2300 0,22 22%
Afrique 1200 0,11 11%
Asie 850 0,08 8%
Amérique du Nord 4800 0,46 46%
Amérique du Sud 1100 0,11 11%
Total 10250 1 100%
Exemple : taille de vêtement :
XS < S < M < L < XL < XXL
Il faudra, notamment pour les représentations graphiques, présenter toujours les modalités dans l'ordre.
Répartition d'une population en fonction de sa taille vestimentaire
Exemples de caractère qualitatif:
qualité d’une facture (correcte, erroné)
culture dominante d'une exploitation Dans le cas particulier où il n'y a que deux
modalités, on dit que la variable est dichotomique.
( Sexe (M ou F, 1 ou 0), qualité (bonne ou mauvaise), etc..)
Les variables seront ensuite analysées différemment selon
leur nature (quantitative, qualitative, etc.), au moyen de tableaux, graphiques, calcul
de paramètres-clé.