INFORMATIONS pédagogiques :
|
Cours
Niveau IV |
STATISTIQUES
La
statistique est l'étude des données relatives à un groupe d'individus.
I.
VOCABULAIRE, DEFINITIONS
¶ Population : la
population est l'ensemble des unités statistiques(ou individus) sur lequel vont
porter les observations
· Echantillon
:
c'est une partie de la population.
¸ Caractère : Un
caractère statistique est une propriété
étudié de la population.
Un
caractère peut-être :
v
Quantitatif : si on peut lui attribuer une
valeur numérique.
v
Qualitatif : s'il n'est pas représenté par un
nombre
v
Discret : s'il ne prend que certaines valeurs
v
Continu : s'il peut prendre toutes les
valeurs dans un intervalle donné.
Exemple :
Dans
un magasin de chaussures on a relevé durant une semaine les pointures des
chaussures vendues dans celui-ci :
38 38 39 42 43 43 41 44 41 37 36 35 41 42 45 38 43 42 41 42 38 37 39 40 36 35 40 35 37 40 41 36 37 36 39 45 36 36 38 39 37 39 42 44 42 39 37 43
37 41 40 40 38 36 37 41 42 38 39 41
Dans
cet exemple : la
population est "l'ensemble de chaussures"
Le caractère étudié est la pointure,
il est quantitatif et discret.
¹ Classe : Une classe
est un sous-ensemble de la population correspondant à des valeurs du caractère
comprises dans un intervalle [a ; b[.
L'amplitude
d'une classe [a ; b[ est la différence entre ses deux
bornes : b-a
Le
centre de la clase est :
º Effectif : L'effectif
d'une classe ou d'une valeur est le nombre d'éléments qui correspondent à cette
classe ou à cette valeur. On le note en général ni.
+Exercice n°1
Dans
l'exemple n°1, on peut regrouper les pointures par classe d'amplitude 2 dans un
tableau statistique :
Valeurs de
la pointure |
Effectif( à compléter
) |
[ 35 ; 37 [ |
n1
= ….. |
[ 37 ; 39 [ |
n2 = …… |
[ 39 ; 41 [ |
n3
=…... |
[ 41 ; 43 [ |
n4 =…... |
[ 43 ; 45 ] |
n5
=…... |
|
N = n1
+ n2 + n3 + n4 +n5 = 60 |
» Fréquence
Définition
: On appelle fréquence fi
d'une propriété d'un caractère le
rapport de l'effectif ni de
cette propriété par l'effectif total N.
Ainsi
: ( la
somme des fréquences fi vaut 1)
Ces
différentes fréquences peuvent être exprimées
sous forme de pourcentage.
( la somme des fréquences fi
vaut 100 % )
+Exercice
n°2
Calculer
les fréquences de chaque classes dans l'exemple n°1
Valeurs de
la pointure |
Fréquence(en
%)( à compléter ) |
[ 35 ; 37 [ |
f1
= ….. |
[ 37 ; 39 [ |
f2 = …… |
[ 39 ; 41 [ |
f3
=…... |
[ 41 ; 43 [ |
f4 =…... |
[ 43 ; 45 ] |
f5
=…... |
¼ Effectifs
et fréquences cumulés
L'effectif
cumulé croissant (la fréquence cumulée
croissante) de la valeur de rang i est la somme de tous les effectifs
(de toutes les fréquences) jusqu'au rang i compris.
L'effectif
cumulé décroissant (la fréquence cumulée
décroissante) de la valeur de rang i est la somme de tous les effectifs
(de toutes les fréquences) à partir de la dernière valeur jusqu'au rang i
compris.
Exemple : Voici
regroupés les salaires de 85 employés d'une entreprise, les deux dernières
colonnes représentent les effectifs cumulés croissants et décroissants :
Montant
( €) |
Nombre
de salariés |
Effectif
cumulé croissant (ECC) |
Effectif
cumulé décroissant (ECD) |
[
0
; 200 [ |
9 |
9 |
85 |
[
200
; 400 [ |
28 |
37 |
76 |
[
400
; 600 [ |
25 |
62 |
48 |
[
600
; 800 [ |
16 |
78 |
23 |
[
800
; 1 000 [ |
7 |
85 |
7 |
Total |
85 |
|
Voici
la même situation mais avec les fréquences cumulées croissantes et
décroissantes
Montant
en € |
Nombres
de salariés. |
Fréquences |
Fréquence
cumulée croissante. (FCC) |
Fréquence
cumulée décroissante. (FCD) |
[
0
; 200 [ |
9 |
0,106 |
0,106 |
1 |
[
200
; 400 [ |
28 |
0,
329 |
0,435 |
0,894 |
[
400
; 600 [ |
25 |
0,
294 |
0,729 |
0,
565 |
[
600
; 800 [ |
16 |
0,
188 |
0,
917 |
0,271 |
[
800
; 1000 [ |
7 |
0,083 |
1 |
0,083 |
Total
: |
85 |
1 |
|
|
+Exercice n°3
Lors
d'une élection présidentielle on a relevé le nombres
de voix obtenus par les cinq candidats au premier tour :
Candidats
n°1 |
Candidat n°2 |
Candidat n°3 |
Candidat n°4 |
Candidat n°5 |
2 555 832 |
1 200 132 |
3 132 450 |
1 458 325 |
2 128 441 |
Nombre total
de votants :
1°) Quel est
le caractère étudié ?
2°) Calculer
la fréquence f1 en % des
votes pour le candidats n°1
3°) Calculer
la fréquence f2 en % des votes pour le
candidats n°2
4°) Calculer
la fréquence f3 en % des
votes pour le candidats n°3
5°) Calculer
la fréquence f4 en % des
votes pour le candidats n°4
6°) Calculer
la fréquence f5 en % des
votes pour le candidats n°5
7°) Y-a t-il un candidat élu au premier tour ?
II.
REPRESENTATIONS
GRAPHIQUES
II.1.
GRAPHIQUES
DES EFFECTIFS ET FREQUENCES
¶ Le
diagramme circulaire (ou à secteurs)
Il
est souvent utilisé pour représenter de séries statistiques à caractère qualitatif.
L'aire du secteur angulaire est proportionnelle à l'effectif ou à la fréquence.
La valeur de l'angle (en degré) correspondant
à l'effectif ni se calcule à l'aide de la formule (N est l'effectif
total) : , à partir de la fréquence fi ( en % ) la
formule devient : .
Couleur
des yeux |
Nombre
de personnes |
Calcul
de l'angle en degré |
Marron |
788 |
|
Bleu |
300 |
|
Vert |
225 |
|
Gris |
577 |
|
|
Total
: 1890 |
360 |
Exemple : Dans le
tableau statistique suivant on a regroupé le nombre de personnes en fonction de
la couleur de leurs yeux sur un échantillon de 1890 on représente ces résultats
par un diagramme circulaire.
|
|
|
· Le diagramme à bâtons
On
peut représenter des effectifs ou des fréquences d'une variable discrète à
l'aide de ce diagramme.
Exemple : On étudie la répartition de voitures
en fonction du pays d'origine :
Pays |
F |
D |
E |
I |
S |
GB |
Effectifs |
17 |
6 |
4 |
4 |
3 |
3 |
|
¸ L'histogramme
On
représente à l'aide de ce graphique des séries à variable continue.
Un
histogramme des effectifs (ou fréquences) est constitué de rectangle ayant pour
base l'amplitude des classe et dont les aires sont proportionnelles aux effectifs
( ou fréquences).
Exemple :
v
Dans
le cas de classes de même amplitude :
|
|
v
Dans
le cas de classes d'amplitude différentes :
Montant en Francs |
Effectifs |
Hauteur |
[ 0 ; 20 [ |
14 |
0,7 |
[ 20 ; 30 [ |
20 |
2 |
[ 30 ; 40 [ |
44 |
4,4 |
[ 40 ; 50 [ |
50 |
5 |
[ 50; 60 [ |
32 |
3,2 |
[ 60 ; 80[ |
28 |
1,4 |
[ 80 ; 100[ |
12 |
0,6 |
ATTENTION : Dans ce cas, l'effectif est
représenté par la valeur de la surface du rectangle qui dépend des unités
graphiques choisies.
II.2.
Polygone des effectifs cumulés et des fréquences
cumulées
Il
est formé des segments de droites joignant les points :
-
d'abscisses,
la borne supérieure d'une classe.
-
d'ordonnées
: l'effectif cumulé de cette classe.
Exemple :
Dans
le tableau suivant, on a regroupé par classe d'amplitude 5 (
sauf pour la dernière dont amplitude 25) les distances séparant le lycée
de l'entreprise pour 90 élèves en stage.)
|
Pour les
deux graphiques, le premier point a pour coordonnées ( 0
; 0 ) pour l'ECC et ( 0 ; 90) pour l'ECD. |
Distance en
km |
Nombre d'entreprises |
ECC |
ECD |
[0
; 5 [ |
8 |
8 |
90 |
[ 5 ; 10 [ |
22 |
30 |
82 |
[ 10 ; 15 [ |
32 |
62 |
60 |
[ 15 ; 20 [ |
18 |
80 |
28 |
[ 20 ; 25 [ |
5 |
85 |
10 |
[ 25 ; 50 [ |
5 |
90 |
5 |
[Total |
90 |
|
|
III.
CARACTERISTIQUES
DE POSITION
III.1.
MODE,CLASSE MODALE
Le
mode est la valeur de la variable qui correspond à l'effectif ou à la fréquence
maximale. Dans le cas de série à variable continue, on parle de classe modale ( les classes ayant même amplitude).
Dans
l'exemple précédent, la classe modale est [ 10 ; 15 ]
III.2.
MOYENNE
ARITHMETIQUE
Si
x1, x2….,xp
sont les valeurs du caractère étudié et n1, n2,….., np les effectifs, la moyenne arithmétique de la
série statistique est :
|
|
où N est
l'effectif total. |
Avec
les fréquences, la formule devient :
|
|
|
REMARQUE
: Pour les séries statistiques continues, xi représente la valeur du
centre de la classe.
III.3. MEDIANE
La
médiane est la valeur de la variable qui partage l'effectif total en deux
parties de même effectif
Pour
un caractère discret : Si l'effectif
total est impair, la médiane est la valeur du caractère situé au milieu de la
série
Si
l'effectif est pair la médiane est la demi somme des
deux valeurs centrales du caractère.
Pour
un caractère continu : La médiane peut être recherchée par lecture sur le
graphique de la courbe des effectifs cumulés, de l'abscisse correspondant à
l'ordonnée N/2
Dans
l'exemple précédent, le caractère étudié est continu ( nombre
de km), la médiane est 12,5. elle correspond au point
dont l'ordonnée est 90/2 = 45.
On
remarque aussi que la médiane est la valeur de l'abscisse du point
d'intersection des courbes ECD et ECC.
IV.
STATISTIQUE A UNE VARIABLE
Pour
comparer les résultats de séries statistiques, les paramètres de position
(mode, médiane , moyenne) sont parfois insuffisants,
en particulier pour caractériser la répartition des valeurs autour de la
moyenne. Pour cela, on utilise des paramètres dits de dispersion : l'étendue de
la série et l'écart type.
¶ Calcul
de l'étendue
L'étendue
de la série est la différence entre la plus grande valeur observée du caractère
et la valeur la plus petite.
· Calcul
de l'écart type
L'écart
type permet de connaître la répartition des valeurs du caractère par rapport à
la valeur moyenne du caractère
Une
petite valeur de l'écart type traduit une forte concentration des valeurs
autour de la moyenne.
|
On
appelle variance V d'une série statistique le nombre : xi
: Valeurs du caractère ou centre des classes ni
: effectif de xi ou de la classe de centre xi N
: effectif total |
L'écart type
se calcule à l'aide la formule suivante :
ATTENTION
: Pour des valeurs du caractère regroupées en classe, on prend pour valeur du caractère
le centre de chaque classe et l'effectif correspondant à cette classe.
Pour
calculer cette grandeur, il faut utiliser les fonctions statistiques de votre
calculatrice.
V.
STATISTIQUE A DEUX VARIABLES
Une
série statistique à deux variables est une série pour laquelle deux caractères
mesurables sont relevés pour chaque individu.
Exemple : L'étude
prote sur la répartition des masses et des tailles d'enfants à leur naissance.
On
a relevé la masse et la taille de 10 nouveaux-nés :
Enfant |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Masse
en kg |
2,4 |
2,6 |
2,7 |
3,0 |
3,2 |
3,3 |
3,5 |
3,6 |
3,8 |
4 |
Taille
en cm |
45 |
47 |
48 |
50 |
51 |
52 |
53 |
54 |
54 |
56 |
¶ Représentation
graphique d'une série statistique à deux variables
A
chaque individu est associé un couple de valeurs. Nous allons représenter ces
deux grandeurs dans un repère, l'une des variable sera
mis en abscisse, l'autre en ordonnée.
Dans
l'exemple on choisi: Abscisse : masse en Kg ;Ordonnée : taille en cm.
Cette
série sera donc représentée par le nuage de points suivant :
|
|
Ces
points semblent être alignés. Pour pouvoir faire des prévisions, on va
modéliser le lien existant entre ces deux variables par une fonction affine ( de la forme ax + b ) dont la
représentation graphique est une droite d'équation y = ax
+ b
Pour
cela :
Le
nuage de points est séparés en deux parties contenant
le même nombre de points.
On
calcule les coordonnées des points moyens A et B(voir
graphique) de ces deux parties :
|
|
|
On
calcule l'équation de la droite passant par ces deux points. L'équation de
cette droite est :
y=6,51x+30,1
A
l'aide de cette équation, on peut estimer la taille d'un bébé de
Y = 6,51 ´ 2 + 30,1 =
43,12
La taille d'un
enfant de
Remarque : Plus le
nombre de données sera important, plus le modèle sera précis.
La
modélisation affine est la plus simple, on peut également, à l'aide
d'ordinateur modéliser des situation par des hyperboles, des exponentielles,
des paraboles pour des situations qui s'y prêtent et ceci toujours en vue
d'établir un lien entre deux variables et ainsi de pouvoir faire des prévisions
à l'aide du modèle déterminé.
VI.
SERIES CHRONOLOGIQUES
¶ Définition
Une série chronologique, est une série
statistique pour laquelle les valeurs du caractère sont fonctions du temps.
· Tendance
générale et variations saisonnières
L'examen
de la représentation graphique ou d'un tableau d'une série chronologique montre
que celle-ci peut être constituée de deux composantes :
-
La
tendance générale est une évolution de longue durée marquée par la décroissance
ou la croissance
-
Les
variations saisonnières représentent les ressemblances entre différentes
périodes
La
mise en évidence de ces deux composantes, permet par la suite de faire des
prévisions pour les saisons à venir.
¸ Exemple de
recherche de tendance générale et de variations saisonnières
Recherche
d'une tendance générale par le procédé des moyennes mobiles.
Pour
illustrer cette méthode, nous allons étudier un exemple.
Le
chiffre d'affaire d'une entreprise au cours des sept dernières années est donné
par le tableau suivant :
Année
(x) |
Chiffre
d'affaires en
millions d'Euros(y) |
1 |
110 |
2 |
100 |
3 |
130 |
4 |
160 |
5 |
160 |
6 |
180 |
7 |
200 |
|
|
La
représentation graphique de ces deux variables donne le nuage de points suivant
:
Le
principe consiste ensuite à remplacer 3 points consécutifs, obtenus par
décalage successifs par leur point moyen :
Points à
remplacer |
Calcul des
coordonnées du point moyen |
(1 ; 110) (2
; 100 ) ( 3 ; 130) |
|
(2 ; 100) (3
; 130 ) ( 4 ; 160 ) |
( 3 ; 130 ) |
(3 ; 130) (
4 ; 160 ) ( 5 ; 160 ) |
(4 ; 150) |
(4 ; 160 ) (
5 ; 160 ) ( 6 ; 180 ) |
(5 ; 166) |
( 5 ; 160 )
( 6 ; 180 ) ( 7 ; 200 ) |
(6 ; 180) |
Le
graphique constitué de ces points moyens et appelé "courbe des moyennes
mobiles".
|
|
Le
nuage initial des 7 points est remplacé par un nuage de 5 points dont les
fluctuations ont été amorties.
On
peut ensuite faire un ajustement linéaire sur ces 5 points, afin d'obtenir une
équation permettant de faire des prévisions sur le chiffre d'affaires de cette
entreprise dans les années futures.
Correction des variations saisonnières
Le
coefficient de variations saisonnières C.V.S est défini par le rapport de la
moyenne des valeurs d'une période sur la moyenne des valeurs.
|
|
|
Exemple : Dans un
magasin de grande distribution, on demande au chef de rayon de prévor les commandes mensuelles au plus juste pour l'année
suivante en vus d'éviter les invendus.
Le
tableau suivant représente les chiffres d'affaires mensuels ainsi que la
moyenne de ces CA pour une même période.
Mois |
J |
F |
M |
A |
M |
J |
J |
A |
S |
O |
N |
D |
CA en 2000
en milliers d'Euros |
1500 |
2200 |
3500 |
4000 |
4500 |
4200 |
4100 |
2500 |
2800 |
3000 |
2000 |
1800 |
CA en 2001
en milliers d'Euros |
1600 |
2300 |
4000 |
5000 |
6000 |
5300 |
4400 |
2600 |
3200 |
3500 |
2400 |
1900 |
Moyenne des
C.A. mi |
1550 |
2250 |
3750 |
4500 |
5250 |
4750 |
4250 |
2550 |
3000 |
3250 |
2200 |
1850 |
:
La
moyenne de l'ensemble des moyenne mi des CA est : |
|
Calculons
maintenant le CVS pour chaque mois :
Mois |
J |
F |
M |
A |
M |
J |
J |
A |
S |
O |
N |
D |
Moyenne des
C.A. mi |
1550 |
2250 |
3750 |
4500 |
5250 |
4750 |
4250 |
2550 |
3000 |
3250 |
2200 |
1850 |
CVS |
@ 0,48 |
0,69 |
1,15 |
1,38 |
1,61 |
1,45 |
1,30 |
0,69 |
0,92 |
1,00 |
0,67 |
0,57 |
Le
service statistique de l'entreprise prévoit un chiffre d'affaires de 48 530 €
pour l'année 2002, le CVS permet de calculer chaque CA pour chaque mois de
l'année 2002.
Le
chiffre d'affaires moyen mensuel prévisionnel est :
Si
on tient compte des variations saisonnières, on peut calculer chaque CA pour
chaque mois de l'année 2002 en multipliant le CVS par le CA moyen mensuel calculé avant :
Mois |
J |
F |
M |
A |
M |
J |
J |
A |
S |
O |
N |
D |
CVS |
0,48 |
0,69 |
1,15 |
1,38 |
1,61 |
1,45 |
1,30 |
0,69 |
0,92 |
1,00 |
0,67 |
0,57 |
CA
prévisionnel mensuel pour 2002 en milliers d'Euros |
0,48´4044,17@ 1941 |
2790 |
4651 |
5581 |
6511 |
5864 |
5257 |
2790 |
3721 |
4044 |
2710 |
2305 |