LES STATISTIQUES au bac

INFORMATIONS  pédagogiques :

Pré requis niveau V :

 

Module des cours niveau 5

Cours Niveau IV

EXERCICES et Problèmes

Corrigés

 

STATISTIQUES

 

 

La statistique est l'étude des données relatives à un groupe d'individus.

 

 

I.                VOCABULAIRE, DEFINITIONS

 

Population : la population est l'ensemble des unités statistiques(ou individus) sur lequel vont porter les observations

 

· Echantillon : c'est une partie de la population.

 

¸ Caractère : Un caractère  statistique est une propriété étudié de la population.

 

Un caractère peut-être :

 

v Quantitatif : si on peut lui attribuer une valeur numérique.

v Qualitatif : s'il n'est pas représenté par un nombre

v Discret : s'il ne prend que certaines valeurs

v Continu : s'il peut prendre toutes les valeurs dans un intervalle donné.

 

 

Exemple :

 

Dans un magasin de chaussures on a relevé durant une semaine les pointures des chaussures vendues dans celui-ci :

38       38       39       42       43       43       41       44       41       37       36       35            41       42       45       38       43       42       41       42       38       37       39       40            36       35       40       35       37       40       41       36       37       36       39       45            36       36       38       39       37       39       42       44       42       39       37       43

            37       41       40       40       38       36       37       41       42       38       39       41

 

Dans cet exemple :                          la population est "l'ensemble de chaussures"

Le caractère étudié est la pointure, il est quantitatif et discret.

 

¹ Classe : Une classe est un sous-ensemble de la population correspondant à des valeurs du caractère comprises dans un intervalle [a ; b[.

 

L'amplitude d'une classe [a ; b[ est la différence entre ses deux bornes : b-a

Le centre de la clase est :

 

º Effectif : L'effectif d'une classe ou d'une valeur est le nombre d'éléments qui correspondent à cette classe ou à cette valeur. On le note en général ni.

 


+Exercice n°1

 

Dans l'exemple n°1, on peut regrouper les pointures par classe d'amplitude 2 dans un tableau statistique :

 

Valeurs de la pointure

Effectif( à compléter )

[ 35 ; 37 [

n1 = …..

[ 37 ; 39 [

 n2 = ……

[ 39 ; 41 [

n3 =…...

[ 41 ; 43 [

n4 =…...

[ 43 ; 45 ]

n5 =…...

 

N = n1 + n2 + n3 + n4 +n5 = 60

 

 

 

»  Fréquence

 

Définition  : On appelle fréquence fi d'une propriété d'un caractère  le rapport de l'effectif  ni de cette propriété par l'effectif total N.

 

Ainsi :  ( la somme des fréquences fi vaut 1)

Ces différentes fréquences peuvent être exprimées  sous forme de pourcentage.

 

 

( la somme des fréquences fi vaut 100 % )

 

+Exercice n°2

 

Calculer les fréquences de chaque classes dans l'exemple n°1

 

Valeurs de la pointure

Fréquence(en %)( à compléter )

[ 35 ; 37 [

f1 = …..

[ 37 ; 39 [

 f2 = ……

[ 39 ; 41 [

f3 =…...

[ 41 ; 43 [

f4 =…...

[ 43 ; 45 ]

f5 =…...

 

¼ Effectifs et fréquences cumulés

 

L'effectif cumulé croissant (la  fréquence cumulée croissante) de la valeur de rang i est la somme de tous les effectifs (de toutes les fréquences) jusqu'au rang i compris.

 

L'effectif cumulé décroissant (la  fréquence cumulée décroissante) de la valeur de rang i est la somme de tous les effectifs (de toutes les fréquences) à partir de la dernière valeur jusqu'au rang i compris.

 


Exemple : Voici regroupés les salaires de 85 employés d'une entreprise, les deux dernières colonnes représentent les effectifs cumulés croissants et décroissants :

                                              

Montant ( €)

Nombre de  salariés

Effectif cumulé croissant  (ECC)

Effectif cumulé décroissant (ECD)

[ 0 ; 200 [

9

9

85

[ 200 ; 400 [

28

37

76

[ 400 ; 600 [

25

62

48

[ 600 ; 800 [

16

78

23

[ 800 ; 1 000 [

7

85

7

Total

85

 

 

Voici la même situation mais avec les fréquences cumulées croissantes et décroissantes                       

 

Montant en €

Nombres de salariés.

Fréquences

Fréquence cumulée croissante.

(FCC)

Fréquence cumulée décroissante.

(FCD)

[ 0 ; 200 [

9

0,106

0,106

1

[ 200 ; 400 [

28

0, 329

0,435

0,894

[ 400 ; 600 [

25

0, 294

0,729

0, 565

[ 600 ; 800 [

16

0, 188

0, 917

0,271

[ 800 ; 1000 [

7

 0,083

1

0,083

Total :

85

1

 

 

 

+Exercice n°3                   

Lors d'une élection présidentielle on a relevé le nombres de voix obtenus par les cinq candidats au premier tour :

 

Candidats n°1

Candidat n°2

Candidat n°3

Candidat n°4

Candidat n°5

2 555 832

1 200 132

3 132 450

1 458 325

2 128 441

 

Nombre total de votants :

 

1°) Quel est le caractère étudié ?

Zone de Texte: Arrondir les résultats au dixième.2°) Calculer la fréquence f1  en % des votes pour le candidats n°1

3°) Calculer la fréquence f2   en % des votes pour le candidats n°2

4°) Calculer la fréquence f3  en % des votes pour le candidats n°3 

5°) Calculer la fréquence f4  en % des votes pour le candidats n°4 

6°) Calculer la fréquence f5  en % des votes pour le candidats n°5 

7°) Y-a t-il un candidat élu au premier tour ?

 

 


II. REPRESENTATIONS GRAPHIQUES

 

II.1. GRAPHIQUES DES EFFECTIFS ET FREQUENCES

 

 

Le diagramme circulaire (ou à secteurs)

 

 

Il est souvent utilisé pour représenter de séries statistiques à caractère qualitatif. L'aire du secteur angulaire est proportionnelle à l'effectif ou à la fréquence.

 

 La valeur de l'angle (en degré) correspondant à l'effectif ni se calcule à l'aide de la formule (N est l'effectif total)  : , à partir de la fréquence fi ( en % ) la formule devient : .

 

 

Couleur des yeux

Nombre de personnes

Calcul de l'angle en degré

Marron

788

Bleu

300

Vert

225

Gris

577

 

Total : 1890

360

Exemple : Dans le tableau statistique suivant on a regroupé le nombre de personnes en fonction de la couleur de leurs yeux sur un échantillon de 1890 on représente ces résultats par un diagramme circulaire.

 

 

 

 


 

 

· Le diagramme à bâtons

 

On peut représenter des effectifs ou des fréquences d'une variable discrète à l'aide de ce diagramme.

 

Exemple  : On étudie la répartition de voitures en fonction du pays d'origine :

 

Pays

F

D

E

I

S

GB

Effectifs

17

6

4

4

3

3

 

 

 

msotw9_temp0

 

 

 

¸ L'histogramme

 

On représente à l'aide de ce graphique des séries à variable continue.

Un histogramme des effectifs (ou fréquences) est constitué de rectangle ayant pour base l'amplitude des classe et dont les aires sont proportionnelles aux effectifs ( ou fréquences).

 

Exemple :

 

v Dans le cas de classes de même amplitude :

Montant en Francs

Effectifs

[ 0 ; 10 [

[ 10 ; 20 [

[ 20 ; 30 [

[ 30 ; 40 [

[ 40 ; 50 [

[ 50 ; 60 [

[ 60 ; 70 [

[ 70 ; 80 [

[ 80 ; 90 [

[ 90 ; 100 [

4

10

20

44

50

32

16

12

10

2

 

 

classe1

 

v Dans le cas de classes d'amplitude différentes :

classe2

Montant

en Francs

Effectifs

Hauteur

[ 0 ; 20 [

14

0,7

[ 20 ; 30 [

20

2

[ 30 ; 40 [

44

4,4

[ 40 ; 50 [

50

5

[ 50; 60 [

32

3,2

[ 60 ; 80[

28

1,4

[ 80 ; 100[

12

0,6

     

      ATTENTION : Dans ce cas, l'effectif est représenté par la valeur de la surface du rectangle qui dépend des unités graphiques choisies.

 

 

 

 

 

 

 

 

II.2. Polygone des effectifs cumulés et des fréquences cumulées

 

Il est formé des segments de droites joignant les points :

 

-        d'abscisses, la borne supérieure d'une classe.

-        d'ordonnées : l'effectif cumulé de cette classe.

 

Exemple :

Dans le tableau suivant, on a regroupé par classe d'amplitude 5 ( sauf pour la dernière dont amplitude 25) les distances séparant le lycée de l'entreprise pour 90 élèves en stage.)

 

Pour les deux graphiques, le premier point a pour coordonnées ( 0 ; 0 ) pour l'ECC et ( 0 ; 90) pour l'ECD.

 

 

 

 

 

 

 

 

 

 

Distance

en km

Nombre

d'entreprises

ECC

ECD

[0 ; 5 [

8

8

90

[ 5 ; 10 [

22

30

82

[ 10 ; 15 [

32

62

60

[ 15 ; 20 [

18

80

28

[ 20 ; 25 [

5

85

10

[ 25 ; 50 [

5

90

5

[Total

90

 

 

 

 

 

 

 

 

 

 

 

 

 

III. CARACTERISTIQUES DE POSITION

 

III.1. MODE,CLASSE MODALE

 

Le mode est la valeur de la variable qui correspond à l'effectif ou à la fréquence maximale. Dans le cas de série à variable continue, on parle de classe modale ( les classes ayant même amplitude).

 

Dans l'exemple précédent, la classe modale est [ 10 ; 15 ]

 

 

III.2. MOYENNE ARITHMETIQUE

 

Si x1, x2….,xp sont les valeurs du caractère étudié et n1, n2,….., np les effectifs, la moyenne arithmétique de la série statistique est :

 

 

 

où N est l'effectif total.

 

 

Avec les fréquences, la formule devient :

 

 

 

 

REMARQUE : Pour les séries statistiques continues, xi représente la valeur du centre de la classe.

 

III.3. MEDIANE

 

La médiane est la valeur de la variable qui partage l'effectif total en deux parties de même effectif

 

Pour un  caractère discret : Si l'effectif total est impair, la médiane est la valeur du caractère situé au milieu de la série

                                               Si l'effectif est pair la médiane est la demi somme des deux valeurs centrales du caractère.

 

Pour un caractère continu : La médiane peut être recherchée par lecture sur le graphique de la courbe des effectifs cumulés, de l'abscisse correspondant à l'ordonnée  N/2

 

 

Dans l'exemple précédent, le caractère étudié est continu ( nombre de km), la médiane est 12,5. elle correspond au point dont l'ordonnée est 90/2 = 45.

On remarque aussi que la médiane est la valeur de l'abscisse du point d'intersection des courbes ECD et ECC.

 

IV. STATISTIQUE A UNE VARIABLE

 

Pour comparer les résultats de séries statistiques, les paramètres de position (mode, médiane , moyenne) sont parfois insuffisants, en particulier pour caractériser la répartition des valeurs autour de la moyenne. Pour cela, on utilise des paramètres dits de dispersion : l'étendue de la série et l'écart type.

 

 

Calcul de l'étendue

 

L'étendue de la série est la différence entre la plus grande valeur observée du caractère et la valeur la plus petite.

 

· Calcul de l'écart type

 

L'écart type permet de connaître la répartition des valeurs du caractère par rapport à la valeur moyenne du caractère

Une petite valeur de l'écart type traduit une forte concentration des valeurs autour de la moyenne.

On appelle variance V d'une série statistique le nombre :

xi : Valeurs du caractère ou centre des classes

ni : effectif de xi ou de la classe de centre xi

N : effectif total

 

                                   L'écart type se calcule à l'aide la formule suivante :

 

ATTENTION : Pour des valeurs du caractère regroupées en classe, on prend pour valeur du caractère le centre de chaque classe et l'effectif correspondant à cette classe.

 

Pour calculer cette grandeur, il faut utiliser les fonctions statistiques de votre calculatrice.

 


V. STATISTIQUE A DEUX VARIABLES

 

Une série statistique à deux variables est une série pour laquelle deux caractères mesurables sont relevés pour chaque individu.

 

Exemple : L'étude prote sur la répartition des masses et des tailles d'enfants à leur naissance.

On a relevé la masse et la taille de 10 nouveaux-nés :

 

Enfant

1

2

3

4

5

6

7

8

9

10

Masse en kg

2,4

2,6

2,7

3,0

3,2

3,3

3,5

3,6

3,8

4

Taille en cm

45

47

48

50

51

52

53

54

54

56

 

 

Représentation graphique d'une série statistique à deux variables

 

A chaque individu est associé un couple de valeurs. Nous allons représenter ces deux grandeurs dans un repère, l'une des variable sera mis en abscisse, l'autre en ordonnée.

 

Dans l'exemple on choisi:    Abscisse : masse en Kg ;Ordonnée : taille en cm.

Cette série sera donc représentée par le nuage de points suivant :

 

 


Les 5 premiers points, à partir de la gauche : (1er nuage) ; les 5 autres points ( 2ème  nuage)  

 

 

Ces points semblent être alignés. Pour pouvoir faire des prévisions, on va modéliser le lien existant entre ces deux variables par une fonction affine ( de la forme ax + b ) dont la représentation graphique est une droite d'équation y = ax + b


Pour cela :

 

Le nuage de points est séparés en deux parties contenant le même nombre de points.

On calcule les coordonnées des points moyens A et B(voir graphique) de ces deux parties :

 

 

 

 

 

On calcule l'équation de la droite passant par ces deux points. L'équation de cette droite est :

 

y=6,51x+30,1

 

A l'aide de cette équation, on peut estimer la taille d'un bébé de 2 kg par exemple :

Y = 6,51 ´ 2 + 30,1 = 43,12

La taille d'un enfant de 2 Kg peut être estimée à 43,12 cm.

 

Remarque : Plus le nombre de données sera important, plus le modèle sera précis.

 

La modélisation affine est la plus simple, on peut également, à l'aide d'ordinateur modéliser des situation par des hyperboles, des exponentielles, des paraboles pour des situations qui s'y prêtent et ceci toujours en vue d'établir un lien entre deux variables et ainsi de pouvoir faire des prévisions à l'aide du modèle déterminé.

 

 

VI. SERIES CHRONOLOGIQUES

 

Définition

 

 Une série chronologique, est une série statistique pour laquelle les valeurs du caractère sont fonctions du temps.

 

· Tendance générale et variations saisonnières

 

L'examen de la représentation graphique ou d'un tableau d'une série chronologique montre que celle-ci peut être constituée de deux composantes :

-        La tendance générale est une évolution de longue durée marquée par la décroissance ou la croissance

-        Les variations saisonnières représentent les ressemblances entre différentes périodes

La mise en évidence de ces deux composantes, permet par la suite de faire des prévisions pour les saisons à venir.

¸ Exemple de recherche de tendance générale et de variations saisonnières

 

Recherche d'une tendance générale par le procédé des moyennes mobiles.

 

Pour illustrer cette méthode, nous allons étudier un exemple.

Le chiffre d'affaire d'une entreprise au cours des sept dernières années est donné par le tableau suivant :

Année (x)

Chiffre d'affaires

en millions d'Euros(y)

 1

110

2

100

3

130

4

160

5

160

6

180

7

200

 

 

 


 

La représentation graphique de ces deux variables donne le nuage de points suivant :

Le principe consiste ensuite à remplacer 3 points consécutifs, obtenus par décalage successifs par leur point moyen :

 

Points à remplacer

Calcul des coordonnées du point moyen

(1 ; 110) (2 ; 100 ) ( 3 ; 130)

(2 ; 100) (3 ; 130 ) ( 4 ; 160 )

( 3 ; 130 )

(3 ; 130) ( 4 ; 160 ) ( 5 ; 160 )

(4 ; 150)

(4 ; 160 ) ( 5 ; 160 ) ( 6 ; 180 )

(5 ; 166)

( 5 ; 160 ) ( 6 ; 180 ) ( 7 ; 200 )

(6 ; 180)

 

Le graphique constitué de ces points moyens et appelé "courbe des moyennes mobiles".

 

 

Le nuage initial des 7 points est remplacé par un nuage de 5 points dont les fluctuations ont été amorties.

On peut ensuite faire un ajustement linéaire sur ces 5 points, afin d'obtenir une équation permettant de faire des prévisions sur le chiffre d'affaires de cette entreprise dans les années futures.

 

Correction des variations saisonnières

 

Le coefficient de variations saisonnières C.V.S est défini par le rapport de la moyenne des valeurs d'une période sur la moyenne des valeurs.

 

 

 

 

 

Exemple : Dans un magasin de grande distribution, on demande au chef de rayon de prévor les commandes mensuelles au plus juste pour l'année suivante en vus d'éviter les invendus.

Le tableau suivant représente les chiffres d'affaires mensuels ainsi que la moyenne de ces CA pour une même période.

 

Mois

J

F

M

A

M

J

J

A

S

O

N

D

CA en 2000 en milliers d'Euros

1500

2200

3500

4000

4500

4200

4100

2500

2800

3000

2000

1800

CA en 2001 en milliers d'Euros

1600

2300

4000

5000

6000

5300

4400

2600

3200

3500

2400

1900

Moyenne des C.A. mi

1550

2250

3750

4500

5250

4750

4250

2550

3000

3250

2200

1850

 

:

La moyenne de l'ensemble des moyenne mi des CA est :

                    

 

Calculons maintenant le CVS pour chaque mois :

 

Mois

J

F

M

A

M

J

J

A

S

O

N

D

Moyenne des C.A. mi

1550

2250

3750

4500

5250

4750

4250

2550

3000

3250

2200

1850

CVS

@ 0,48

0,69

1,15

1,38

1,61

1,45

1,30

0,69

0,92

1,00

0,67

0,57

 

Le service statistique de l'entreprise prévoit un chiffre d'affaires de 48 530 € pour l'année 2002, le CVS permet de calculer chaque CA pour chaque mois de l'année 2002.

Le chiffre d'affaires moyen mensuel prévisionnel est :

Si on tient compte des variations saisonnières, on peut calculer chaque CA pour chaque mois de l'année 2002 en multipliant le CVS par le CA moyen  mensuel calculé avant :

 

Mois

J

F

M

A

M

J

J

A

S

O

N

D

CVS

 0,48

0,69

1,15

1,38

1,61

1,45

1,30

0,69

0,92

1,00

0,67

0,57

CA prévisionnel mensuel pour 2002 en milliers d'Euros

0,48´4044,17@

1941

2790

4651

5581

6511

5864

5257

2790

3721

4044

2710

2305