Pré
requis: |
|
|||||||||||
Lecture : Les
Statistiques info |
||||||||||||
Les
intervalles |
||||||||||||
ENVIRONNEMENT
du dossier: |
|
|||||||||||
Objectif
précédent : |
Objectif
suivant : «info complément : la classe » |
|
Doc.
2 |
|||||||||
|
|
|
|
|
||||||||
DOSSIER 2/2 ( vocabulaire ) : NOMENCLATURE ( définitions du vocabulaire de base
) en statistiques A ) LA SAISIE de données : le
sondage et l’enquête. B ) l' OBERVATION des faits ( exemple de dépouillement ). C ) « CLASSE » : constitution
d’une classe , « mode » et « classe modale »,
, « valeur centrale d’une classe », « classes et
amplitude ». D) Statistique descriptive et
l’ « événement » . |
||||||||||||
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|||||
TEST |
COURS |
Interdisciplinarité |
|
|||||||||
|
|
|
|
A) LA
SAISIE de données : le sondage
et l’enquête. |
|
La statistique est une science ancienne .
Elle est utilisée de nos jours en médecine , science
sociale et science de l’Education ,en psychologie , en fiscalité , en
physique ; …..etc. et bien entendu en économie et notamment en gestion
des entreprises. Il est commun de dire que « gouverner et gérer c’est
prévoir » , cela implique qu’avant de faire des
prévisions, il est nécessaire de savoir. La statistique permet d’avoir une meilleure connaissance
des faits et habitus et de faciliter la prise de décisions. Les sources d’informations nécessaires pour faire l’étude statistique
d’une population constituent des éléments de base fondamentaux
. Donc , la
saisie de données pour étude s’effectue à partir de deux types d’enquête : L’enquête exhaustive ( recensement ) , et l’enquête
partielle ( sondage) ; Enquête exhaustive .( recensement ) On effectue une enquête exhaustive si on enregistre les renseignements
concernant tous les membres d’une population. On dit aussi qu’on effectue un
recensement : c’est le cas du recensement du nombre de naissances d’une
ville pendant une période donnée. Ce procédé est très précis
, simple et sûr . L’ enquête
partielle ( SONDAGE ): Lorsque la population statistique est
trop nombreuse on étudie un sous ensemble de la population ,
appelé « échantillon » , sur lequel on détermine l’observation des
faits . Ce procédé est moins précis et la statistique mathématique
cherche dans quelles conditions on
peut étendre à la totalité de la
population les résultats obtenus sur l’échantillon. On dit qu’on a procédé
par « sondage » C’est le cas des sondages d’opinion sur les intentions de vote . L’enquête par
sondage consiste à poser un certain
nombre de questions à un certain
nombre de personnes. Pour recueillir les
informations données par la personne interrogée ,
plusieurs moyens sont possibles : -
les
contacts direct par enquêteur
. -
la
voie postale . -
le
contact par téléphone . Quel que soit le moyen utilisé , une attention
toute particulière à la rédaction du questionnaire . |
||
B) L' observation des faits ( exemple de dépouillement ). Info :On
passe des observations des faits , au dépouillement et suivant le cas l’établissement d’une série statistique.(
on dénombre : 3 cas de séries statistique) |
||
ENREGISTREMENT DES OBSERVATIONS et Exploitation et dépouillement
des données : Nous savons que Les observations portent soit sur des « caractères » (variables) s’exprimant numériquement
, soit sur des « caractères » (variables) non numériques. Ces observations (en quantité plus ou poins importante ) parviennent à la personne chargée du
dépouillement sous la forme d’une quantité de données, en vrac
(désordre ; non classées). L’ensemble des signes ou nombres représentant les valeurs observées du
caractère (variable) choisie se définit
comme étant « une série statistique ». Suivant le caractère
observé on obtient : · Une
série statistique portant sur des variables (caractères) qualitatives ; · Une
série statistique portant sur des variables (caractères) quantitatives ; · Une
série statistique dite « série chronologique » . Exemple :
Exploitation et dépouillement des données : Supposons que l’on doive définir une statistique
portant sur les notes de cent élèves,
à la suite d’un examen Les notes
figurent dans le tableau ci – dessous et ont été distribuées au fur et à
mesure de la correction. La liste de ces notes attribuées à chaque élève s’appelle
« série statistique » |
Après avoir collecté les informations ; on passe au « dépouillement » des données. |
Passage de l’enquête (inventaire ou recensement) au tableau : « inventaire
et dépouillement des données collectées. » Méthode : · Dans
un tableau à deux colonnes on place la valeur des notes ( x i
) ; devant chaque note obtenue (
xi) on place un bâton (dans
la colonne des « ni)
,appelé « effectif »)
(pratiquement : on barre la première note « 6 » et dans le tableau : on place un
bâton dans la colonne « ni) devant « 6 » ; on passe à la note suivante « 10 » ,en
trace un bâton ; ensuite « 12 » (un bâton) Ce travail consiste à compter
combien d’élèves ont eu
« 1 » ; de « 2 » ,
de ……. »6 » ; …….de « 10 » ;…………. Jusque
« 20 » · Ensuite
on compte le nombre de bâtons par case……… · Ce
qui nous donne un premier bilan , que l’on peut
« commenter » : (
exemple : 13 élèves ont 10/20…) Certaines caractéristiques apparaissent facilement : peu de notes
inférieures à 3 et supérieures à 17 , il est difficile de tirer des indications
générales de ces données présentées sans ordre . On commencera donc par « classer »
suivant le tableau qui représente le
nombre d’élèves ( « effectif » :
noté : ni ) ayant obtenu la note ( notée : xi ) |
notes: xi |
ni |
|
notes : xi |
ni |
1 |
I I
= 2 |
11 |
10 |
|
2 |
I = 1 |
12 |
8 |
|
3 |
0 |
13 |
8 |
|
4 |
2 |
14 |
4 |
|
5 |
IIII = 4 |
15 |
6 |
|
6 |
I IIII
I = 6 |
16 |
3 |
|
7 |
IIIII II =
7 |
17 |
3 |
|
8 |
IIIII IIII =
9 |
18 |
3 |
|
9 |
IIIII IIIII =
10 |
19 |
1 |
|
10 |
IIIII IIIII III = 13 |
20 |
0 |
Ce tableau présente l’inconvénient
d’être volumineux .On peut choisir d’effectuer un regroupement des valeurs de
la variable (note) suivant 5 classes . Pour cela on partage l’intervalle [ 0 ;
20] en 5 intervalles partiels comprenant chacun 4 notes sauf le dernier qui
en contient cinq . On obtient les classes suivantes :
Ici : SOS écriture
normalisée |
|
|
[ 0 ; 4 [ groupant les xi tels que 0
£ xi
< 4 [ 4 ; 8 [ groupant les xi tels que 4
£ xi
< 8 [ 8 ; 12 [ groupant les xi tels que 8
£ xi
< 12 [ 12 ; 16 [ groupant les xi tels que
12 £ xi
< 16 [ 16 ; 20 ] groupant les xi tels que
16 £ xi
£ 20 .Les valeurs
2 ; 6 ; 10 ; 14 ; 18 , sont appelées « valeurs centrales » des classes . Dans ces conditions , le
dépouillement se présente suivant le nouveau tableau suivant : |
Classes des notes |
Nombres d’élèves |
[ 0 ; 4 [ [ 4 ; 8 [ [ 8 ; 12 [ [ 12 ; 16 [ [ 16 ; 20 [* *remarquez que le crochet exclu
la valeur 20 |
3 19 42 26 10 |
|
|
C ) CLASSE :
constitution d’une classe ,
« classe modale », , « valeur centrale d’une
classe », « classes et amplitude ». |
|
l'effectif total des
éléments pris en compte sont regroupés par catégorie ou "classe". (les
classes (intervalles) sont imposées par le statisticien ) ; les classes n'ont pas obligatoirement la
même amplitude ( existence des
valeurs entre les bornes peuvent être
différentes ; mais attention , lors de la représentation graphique "histogramme"
de respecter l'aire de référence . Constitution d’une classe : Lorsque les "caractères" sont mesurables ; on organise les
"réponses" en classe de nombres ,C'est à dire : |
On prend l'ensemble des réponses: exemple les mesures
des tailles des 30 individus recensés dans le désordre sont rangées
(classées) par groupe (classe) ;et on les regroupe par "Classe" (les classes sont représentées par des "intervalles" ,un intervalle est un segment de droite bornée en géométrie ) |
||||||||||||
Exemple les individus mesurant entre 158 et 162 constituent la classe 1 |
Exemple les individus mesurant entre 163 et 167 constituent la classe 2 |
Exemple les individus mesurant entre 168 et 172 constituent la classe 3 |
Exemple les individus mesurant entre 173 et 177 constituent la classe 4 |
Exemple les individus mesurant entre 178 et 182 constituent la classe 5 |
Exemple les individus mesurant entre 183 et 187 constituent la classe 6 |
Exemple les individus mesurant entre 188 et 192 constituent la classe 7 |
||||||
CLASSE : Se souvenir · dans un tableau on donne L' effectif par « classe » (qui est
un "sous- effectif" ) ou un effectif par
« caractère » . cet effectif par classe ou caractère est noté par
le petit " n
" avec un indice d'ordre : les (n i ) · On calculera
L' effectif total est
la somme des éléments (n i )
qui sont inventoriés . Le symbole désignant l'effectif total est " N " |
||||||||||||
L'effectif de la
classe 2 est noté :n2 |
L'effectif de la
classe 3 est noté : n3 |
L'effectif de la
classe 4 est noté : n4 |
L'effectif de la
classe 5 est noté : n5 |
L'effectif de la
classe 6 est noté :n6 |
L'effectif de la
classe 7 est noté : n7 |
|||||||
D'où l' égalité :
N = n1+ n2+ n3+ n4+ n5+
n6+ n7 D'où la formule
: N = On dira que
l'effectif total est égal à la somme des effectifs des classes données (
"i" désigne le nombre de classes") |
||||||||||||
C.A. en milliers d’euros )
x i |
Effectifs
( n i
) |
L’effectif
« n 3 » de la classe « x 3 »
étant le plus grand . La classe « x 3 » est la classe « modale » ; |
|||||||
x 1 =300 à moins
500
|
22
|
||||||||
x 2 = 500 à moins
800
|
25
|
||||||||
x 3 = 800 à moins
1 000
|
n 3 = 90
|
||||||||
x 4 = 1 000 à moins 1400
|
33
|
||||||||
x 5 = 1 400 à moins
1500
|
24
|
||||||||
x 6 = 1500 et +
|
6
|
||||||||
|
|
||||||||
Remarques :
► pour tracer le polygone des effectifs ou fréquences, il faudra rechercher pour
chaque classe observée : « son centre de classe » .appelé
aussi : « moyenne
de centre de classe » ou « valeur centrale d’une classe ».
► Dans le
calcul de l’écart type
, on prendra la valeur centrale de chaque classe comme « x
i » |
|||||||||
« valeur
centrale » d’une classe.
|
|||||||||
exemple
|
|||||||||
C.A. .(milliers
d’euros )
x i |
C.A. .(milliers
d’euros ) x i
Peut s’écrire |
C.A. .(milliers
d’euros ) x i
Peut s’écrire |
Centre de
classe : x
i
|
||||||
300 à moins 500
|
301 à 600
|
[ 300 ; 500[
|
|
||||||
500 à moins 800
|
501 à 800
|
[ 500 ; 800[
|
( 500 + 800) /2
= 650
|
||||||
800 à moins 1 000
|
801 à 1000
|
[ 800 ; 1000[
|
(800 +
1000) / 2 = 900
|
||||||
1 000 à moins 1400
|
1001 à 1400
|
[ 1000 ; 1400[
|
( 1000 + 1400 )
/2 = 1200
|
||||||
1 400 à moins 1500
|
1401 à 1500
|
[ 1400 ; 1500[
|
(1400 +
1500) / 2 = 1450
|
||||||
1500 et +
|
1501
à ????
|
????
|
Il faudra
connaître le C.A. maxi
|
||||||
On se
souviendra que dans les calculs de l’écart type on « admet que les
valeurs observées sont celles du centre de la classe ».
|
|||||||||
« Classe » et « amplitude »
|
|||||||||
La
représentation graphique des effectifs d’une variable continue ( organisation de « classe » pour ranger ces
effectifs)peut s’effectuer sous la forme d’un histogramme.
Pour
respecter le principe de construction de l’histogramme, on devra veiller à
vérifier que les intervalles de toutes
les classes sont égaux.
, On dit que les clases doivent
avoir la même amplitude. |
|||||||||
Exemples :
|
|||||||||
Classes
d’amplitudes inégales
|
|
Classe
d’amplitudes égales
|
|||||||
[ 300 ; 500[
|
Cette
série ne sera pas exploitable pour tracer un histogramme. Il faudra repenser
la distribution. Voir
« l’informaticien ».
|
[ 300 ; 500[
|
Cette
série est exploitable pour tracer un histogramme.
|
||||||
[ 500 ; 800[
|
[ 500 ; 700[
|
||||||||
[ 800 ; 1000[
|
[ 700 ; 900[
|
||||||||
[ 1000 ; 1400[
|
[ 900 ; 1100[
|
||||||||
[ 1400 ; 1500[
|
[ 1100 ; 1300[
|
||||||||
????
|
[ 1300 ; 1500[
|
||||||||
|
|||||||||
D) Statistique
descriptive et l’ « événement »
. Elle commence là où la
donnée d'un tableau de nombres exprime des grandeurs liées au phénomène
étudié : le nombre de naissances annuelles dans les dix dernières années , la répartition de ces naissances en sexes , la
catégorie socioprofessionnelle des parents , etc .. On pourrait étudier un
caractère de cette population dont les unités statistiques sont les nouveaux
nés au cours de ces dix dernières années , par exemple le poids de ces nouveaux nés.
A chaque nouveau né correspond un poids.
Cela est un événement. Nous relevons les tailles en cm de 30
individus adultes , pris au hasard. A chaque individu correspondra une taille. Je dispose d'une distribution de la
taille en fonction des individus. Je peux dire que la taille varie en
fonction des individus. La taille , cette
caractéristique de chaque individu est une variable , et l' événement
est ce couple taille-individu . Après
recensement des variables
, nous obtenons le tableau de données suivant: |
|||||||||
Tailles en cm |
158 |
159 |
160 |
161 |
162 |
163 |
164 |
165 |
166 |
167 |
168 |
nombre |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
2 |
0 |
0 |
0 |
Tailles en cm |
169 |
170 |
171 |
172 |
173 |
174 |
175 |
176 |
177 |
178 |
179 |
nombre |
1 |
0 |
2 |
2 |
3 |
0 |
3 |
1 |
2 |
2 |
2 |
Tailles en cm |
180 |
181 |
182 |
183 |
184 |
185 |
186 |
187 |
188 |
189 |
190 |
nombre |
1 |
0 |
1 |
2 |
1 |
0 |
0 |
0 |
0 |
1 |
0 |
Nous constatons que
certains événement se produisent 3 fois , deux fois
, d'autres une fois et d'autres pas du tout . Nous
pouvons également faire un tableau de la distribution des mesures. Nous pouvons aussi
faire une représentation graphique , il
s'agit là d’un diagramme
en bâtons. |
|
Nombre d’individus ayant
la taille correspondante
|
|
Nous pouvons prolonger notre analyse : A partir de ce diagramme
,on pourrait dire que plusieurs groupes peuvent être repérés, celui
des grands ,celui des petits et celui des moyens .Mais je peut
être plus rigoureux en regroupant , en un certains
nombre de classes les tailles des individus par exemple de Nous « distribuons » des effectifs après regroupement des
individus .que nous appellerons
« classe ». |
158-162 |
163-167 |
168-172 |
173-177 |
178-182 |
183-187 |
188-190 |
|
Valeurs
centrales |
160 |
165 |
170 |
175 |
180 |
185 |
190 |
effectifs |
2 |
4 |
5 |
9 |
6 |
3 |
1 |
Commentaire : En opérant le regroupement en intervalles , nous
avons constitué 7 classes. Dans chaque classe , les effectifs montrent le
nombre d'événements produits (l'
événement est : taille - individu). Si nous divisons par classe , la somme des valeurs extrêmes , nous trouvons une valeur que nous
appelons « valeur centrale »
. |
||
|
||
Le choix des intervalles d'égale valeur sera effectué cas par cas en
tenant compte de la précision recherchée ou demandée pour l' étude
statistique , (et du coût projeté pour l'étude :il y a un organisme financeur
de cette étude) Un conseil sur les bornes de
chaque intervalle : il ne faut pas reprendre la valeur précédente dans la
classe suivante ( 158-162 ; 163-167 ; 168
etc.…) Pour l'étude des nouveaux nés , des intervalles de 150 en |
||
Les
mesures sont des observations qui informent Reprenons
les tailles : |
||
|
|
|
Limites des classes |
effectifs |
Fréquences (par classe) |
|
158-162 |
160 |
2 |
( 2 : 30 = ) 0,07 (à 0,01près) |
163-167 |
165 |
4 |
( 4 : 30 = ) 0,13 |
168-172 |
170 |
5 |
0,17 |
173-177 |
175 |
9 |
0,3 |
178-182 |
180 |
6 |
0,2 |
183-187 |
185 |
3 |
0,1 |
188-190 |
190 |
1 |
0,03 |
total |
|
N = 30 |
Somme des
fréquences = 1 |
Commentaire : En opérant le regroupement en intervalles ,
nous avons constitué 7 classes. Dans chaque classe , les effectifs montrent
le nombre d'événements produits (l'
événement est : taille - individu). Si nous divisons l'effectif de chaque classe par le nombre de mesures
(30), nous obtenons la
" Fréquence" de chaque classe
. Si
nous observons le résultat du calcul
de chaque classe, nous constatons que les 7 événements possibles n'ont pas la
même fréquence. Si nous faisons la somme des fréquences , nous obtenons "1 "
: la somme des fréquences est l' événement
certain : chaque individu a une mesure . Un autre échantillon tiré de la même population "parente"
aurait sensiblement la même distribution. On peut estimer que la distribution
des fréquences dans la population parente aurait la forme théorique présentée
ci-dessous. |
|||
|
Courbe des fréquences |
|
|
|
|||
Il y
a les données de rang : Il y
a deux cas : Ou bien les données sont collectées en termes de rang , ou bien les données collectées
n'atteignent pas le niveau de
l'échelle d'intervalle , elles peuvent être remplacées par leurs rangs si
l'on peut vérifier qu'elles atteignent
ce niveau de mesure . exemple
: une course d'éducation sportive :
l'histogramme est plat ;chaque élément occupe un rang . |
|||
Résumé
des observations : Nous remarquons que les observations recueillies nous permettent de
repérer deux catégories d'indices pour décrire nos ensembles de données.
(nous ne nous situons que par rapport aux données de score). Cliquer ici pour plus d'informations sur ces indices : |
|||
|
|
||
|
|
|
|
|
|
Exemple de résolution de PROBLEME : |
Nous
relevons les tailles en cm de 30 individus adultes , pris au hasard. A
chaque individu correspondra une
taille. Nous
disposons d'une distribution de la
taille en fonction des individus. Nous
dirons que la taille varie en fonction des individus. La
taille , cette caractéristique de chaque individu est la variable ,( caractère ) et l'
événement est le couple « taille individu » . Après
« recensement _
sondage » (barrer un des mots
) des variables
( appelées aussi : ……caractère
……) , nous obtenons le tableau de
données suivant: On nous donne le tableau suivant à remplir : |
Tailles en cm |
158 |
159 |
160 |
161 |
162 |
163 |
164 |
165 |
166 |
167 |
168 |
nombre |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
2 |
0 |
0 |
0 |
Tailles en cm |
169 |
170 |
171 |
172 |
173 |
174 |
175 |
176 |
177 |
178 |
179 |
nombre |
1 |
0 |
2 |
2 |
3 |
0 |
3 |
1 |
2 |
2 |
2 |
Tailles en cm |
180 |
181 |
182 |
183 |
184 |
185 |
186 |
187 |
188 |
189 |
190 |
nombre |
1 |
0 |
1 |
2 |
1 |
0 |
0 |
0 |
0 |
1 |
0 |
Nous constatons
que certains événement se produisent 3 fois , deux fois , d'autres une fois et
d'autres pas du tout.
A partir de
ces donnée nous décidons de regrouper ces tailles par classe . On
décide de regrouper la taille des individus « en classe » de
Dans 1ère classe on regroupe les tailles comprise entre
158 et
Ensuite,
nous « distribuons » les effectifs .
Nous
obtenons le tableau intermédiaire
ci-dessous :
Valeurs extrêmes |
158-162 |
163-167 |
168-172 |
173-177 |
178-182 |
183-187 |
188-190 |
Calcul, des Valeurs centrales |
(158 + 162) : 2 |
(163 + 167 ) : 2 |
(168 + 172) : 2 |
(173 + 177 ) : 2 |
(178 + 182) : 2 |
(183 + 187 ) : 2 |
(188 + 190) : 2 |
effectifs |
1 + 1 |
1+1+2 |
1 + 2 + 2 |
3 + 3 + 1 +2 |
2 + 2 + 1 + 1 |
2+1 |
1 |
Soit
le tableau final :
Classe |
[158-162[ |
[ 163-167 [ |
[ 168-172 [ |
[173-177 [ |
[ 178-182 [ |
[ 183-187[ |
[ 188-190[ |
Valeurs centrales |
160 |
165 |
170 |
175 |
180 |
185 |
190 |
effectifs |
2 |
4 |
5 |
9 |
6 |
3 |
1 |
Questions :
1°) Quelle est la valeur d’une classe . ? 5 cm
2°) Comment a-t-on calculer les valeurs
centrales ? somme des valeurs extrêmes
divisée par 2
3°) Q’appelle t- on
« effectif » ? le nombre de tailles
par classe.
4°) Combien y a – t- il de classes ? 7 classes