DOSSIER
: NOMENCLATURE A )
LA SAISIE de données : le sondage et l’enquête. B )
l' OBERVATION des faits (
exemple de dépouillement ). C )
« CLASSE » : constitution
d’une classe , « classe modale », , « valeur centrale
d’une classe », « classes et amplitude ». D) Statistique descriptive et
l’ « événement » . |
|||||||
|
|
|
|
|
|
|
|
|
|
TRAVAUX AUTO FORMATIFS. |
|
|
|
|
|
TEST |
COURS |
Interdisciplinarité |
|
|
TRAVAUX AUTO
FORMATIFS : (le questionnaire
reste à faire ) |
|
|
A) LA SAISIE de données :
le sondage et l’enquête. |
|
La statistique est une science ancienne . Elle est
utilisée de nos jours en médecine , science sociale et science de l’Education
,en psychologie , en fiscalité , en physique ; …..etc. et bien entendu
en économie et notamment en gestion des entreprises. Il est commun de dire que « gouverner et
gérer c’est prévoir » , cela implique qu’avant de faire des prévisions,
il est nécessaire de savoir. La statistique
permet d’avoir une meilleure connaissance des faits et habitus et de
faciliter la prise de décisions. Les sources d’informations nécessaires pour faire
l’étude statistique d’une population constituent des éléments de base
fondamentaux . Donc , la saisie de données pour étude
s’effectue à partir de deux
types d’enquête : L’enquête exhaustive ( recensement ) , et
l’enquête partielle ( sondage) ; Enquête exhaustive . On effectue une enquête exhaustive si on
enregistre les renseignements concernant tous les membres d’une population.
On dit aussi qu’on effectue un recensement : c’est le cas du recensement
du nombre de naissances d’une ville pendant une période donnée. Ce procédé
est très précis , simple et sûr . L’ enquête partielle ( SONDAGE ): Lorsque la population statistique est trop nombreuse on étudie un sous
ensemble de la population , appelé
« échantillon » , sur lequel on détermine l’observation des faits .
Ce procédé est moins précis et la statistique mathématique cherche dans quelles conditions on peut étendre à la totalité de la population les
résultats obtenus sur l’échantillon. On dit qu’on a procédé par
« sondage » C’est le cas des sondages d’opinion sur les
intentions de vote .
L’enquête par sondage consiste
à poser un certain nombre de questions à un certain nombre de personnes. Pour
recueillir les informations données par la personne interrogée , plusieurs
moyens sont possibles : -
les contacts direct par
enquêteur . -
la voie postale . -
le contact par téléphone . Quel que soit le moyen utilisé , une
attention toute particulière à
la rédaction du questionnaire . |
||
B) l' observation des faits ( exemple de
dépouillement ). |
||
ENREGISTREMENT DES OBSERVATIONS et
Exploitation et dépouillement des données : Exploitation et dépouillement des
données : : Supposons qu’on doive définir une statistique portant
sur les notes de cent élèves à la
suite d’un examen ;Les notes figurent dans le tableau ci – dessous et
ont été distribuées au fur et à mesure de la correction. La liste de ces
notes attribuées à chaque élève s’appelle
« série statistique » |
|
Passage de l’enquête (inventaire ou recensement)
au tableau : Certaines caractéristiques apparaissent
facilement : peu de notes inférieures à 3 et supérieures à 17 , il est difficile de tirer des indications générales
de ces données présentées sans ordre . On commencera dons par « classer »
suivant le tableau qui représente le
nombre d’élèves ( noté : ni ) ayant obtenu la note ( notée : xi ) |
notes:
xi |
ni |
|
notes :
xi |
ni |
1 |
2 |
11 |
10 |
|
2 |
1 |
12 |
8 |
|
3 |
0 |
13 |
8 |
|
4 |
2 |
14 |
4 |
|
5 |
4 |
15 |
6 |
|
6 |
6 |
16 |
3 |
|
7 |
7 |
17 |
3 |
|
8 |
9 |
18 |
3 |
|
9 |
10 |
19 |
1 |
|
10 |
13 |
20 |
0 |
Ce tableau présente l’inconvénient
d’être volumineux .On peut choisir d’effectuer un regroupement des valeurs de
la variable (note) suivant 5 classes . Pour cela on partage l’intervalle [ 0 ; 20]
en 5 intervalles partiels comprenant chacun 4 notes sauf le dernier qui en
contient cinq . On obtient les classes suivantes : |
|
Ici :
SOS écriture
normalisée |
[ 0 ; 4
[ groupant les xi tels que 0
£ xi
< 4 [ 4 ; 8
[ groupant les xi tels que 4
£ xi
< 8 [ 8 ; 12 [ groupant les xi tels que 8
£ xi
< 12 [ 12 ; 16 [ groupant les xi tels que
12 £ xi
< 16 [ 16 ; 20 ] groupant les xi tels que
16 £ xi
£ 20 .Les valeurs
2 ; 6 ; 10 ; 14 ; 18 , sont appelées « valeurs centrales » des classes . Dans ces conditions , le dépouillement se
présente suivant le nouveau tableau suivant : |
Classes
des notes |
Nombres
d’élèves |
[ 0 ; 4 [ [ 4 ; 8 [ [ 8 ;
12 [ [ 12 ; 16 [ [ 16 ; 20 [* *remarquez que le crochet exclu la valeur
20 |
3 19 42 26 10 |
|
|
C ) CLASSE :
constitution d’une classe ,
« classe modale », , « valeur centrale d’une
classe », « classes et amplitude ». |
|
l'effectif
total des éléments pris en compte sont regroupés par catégorie ou
"classe".
(les classes (intervalles) sont imposées par le statisticien
) ; les classes n'ont pas obligatoirement la même amplitude ( existence des valeurs entre les bornes peuvent être différentes ; mais
attention , lors de la représentation graphique "histogramme"
de respecter l'aire de référence . Constitution d’une classe : Lorsque les "caractères" sont
mesurables ; on organise les
"réponses" en classe de nombres ,C'est à dire : |
On prend l'ensemble des réponses: exemple
les mesures des tailles des 30
individus recensés dans le désordre sont rangées (classées) par groupe
(classe) ;et on les regroupe par
"Classe" (les classes sont représentées par des
"intervalles" ,un intervalle est un
segment de droite bornée en
géométrie ) |
||||||||||||
Exemple les individus mesurant entre 158 et 162 constituent la classe 1 |
Exemple les individus mesurant entre 163 et 167 constituent la classe 2 |
Exemple les individus mesurant entre 168 et 172 constituent la classe 3 |
Exemple les individus mesurant entre 173 et 177 constituent la classe 4 |
Exemple les individus mesurant entre 178 et 182 constituent la classe 5 |
Exemple les individus mesurant entre 183 et 187 constituent la classe 6 |
Exemple les individus mesurant entre 188 et 192 constituent la classe 7 |
||||||
CLASSE : Se souvenir · dans un tableau on donne L'
effectif par « classe »
(qui est un "sous- effectif" ) ou un effectif par « caractère »
. cet effectif par classe ou caractère est noté par le petit
" n " avec un indice d'ordre : les
(n i )
· On calculera L' effectif total est
la somme des éléments (n i )
qui sont inventoriés . Le symbole désignant l'effectif total est " N " |
||||||||||||
L'effectif de la
classe 2 est noté :n2 |
L'effectif de la
classe 3 est noté : n3 |
L'effectif de la
classe 4 est noté : n4 |
L'effectif de la
classe 5 est noté : n5 |
L'effectif de la
classe 6 est noté :n6 |
L'effectif de la
classe 7 est noté : n7 |
|||||||
D'où l' égalité
: N = n1+ n2+
n3+ n4+ n5+ n6+ n7 D'où la formule
: N = On dira que
l'effectif total est égal à la somme des effectifs des classes données (
"i" désigne le nombre de classes") |
||||||||||||
C.A.
en
milliers d’euros )
x
i |
Effectifs
( n i ) |
L’effectif «
n 3 » de la classe « x 3 » étant le
plus grand . La classe « x 3 » est la classe « modale » ; |
||||||
x 1 =300 à moins 500
|
22
|
|||||||
x 2 = 500 à moins 800
|
25
|
|||||||
x 3 = 800 à moins 1 000
|
n 3
= 90
|
|||||||
x 4 = 1 000 à moins 1400
|
33
|
|||||||
x 5 = 1 400 à moins 1500
|
24
|
|||||||
x 6 = 1500 et +
|
6
|
|||||||
|
|
|||||||
Remarques :
► pour tracer le
polygone des effectifs ou fréquences,
il faudra rechercher pour chaque classe observée : « son centre de
classe » .appelé aussi : « moyenne
de centre de classe » ou « valeur
centrale d’une classe ».
► Dans le calcul de l’écart type
, on prendra la valeur centrale de chaque classe comme « x i » |
||||||||
« valeur centrale » d’une classe.
|
||||||||
exemple
|
||||||||
C.A. .(milliers d’euros )
x i |
|
C.A. .(milliers d’euros ) x i
Peut s’écrire |
Centre de
classe : x i
|
|||||
300 à moins 500
|
|
[ 300 ; 500[
|
|
|||||
500 à moins 800
|
|
[ 500 ; 800[
|
( 500 + 800) /2 = 650
|
|||||
800 à moins 1 000
|
|
[ 800 ; 1000[
|
(800 + 1000) / 2 = 900
|
|||||
1 000 à moins 1400
|
|
[ 1000 ; 1400[
|
( 1000 + 1400 ) /2 =
1200
|
|||||
1 400 à moins 1500
|
|
[ 1400 ; 1500[
|
(1400 + 1500) / 2 =
1450
|
|||||
1500 et +
|
|
????
|
Il faudra connaître le
C.A. maxi
|
|||||
On se souviendra que dans les calculs de l’écart
type on « admet que les valeurs observées sont celles du centre de la
classe ».
|
||||||||
« Classe » et
« amplitude »
|
||||||||
La représentation graphique des effectifs d’une
variable continue ( organisation de « classe » pour ranger ces effectifs)peut
s’effectuer sous la forme d’un histogramme.
Pour respecter le principe de construction de
l’histogramme, on devra veiller à vérifier que les intervalles de toutes les classes sont égaux.
, On dit que les clases
doivent avoir la même amplitude. |
||||||||
Exemples :
|
||||||||
Classes
d’amplitudes inégales
|
|
Classe
d’amplitudes égales
|
||||||
[ 300 ; 500[
|
Cette série ne sera pas exploitable pour tracer un
histogramme. Il faudra repenser la distribution. Voir « l’informaticien ».
|
[ 300 ; 500[
|
Cette série est exploitable pour tracer un
histogramme.
|
|||||
[ 500 ; 800[
|
[ 500 ; 700[
|
|||||||
[ 800 ; 1000[
|
[ 700 ; 900[
|
|||||||
[ 1000 ; 1400[
|
[ 900 ; 1100[
|
|||||||
[ 1400 ; 1500[
|
[ 1100 ; 1300[
|
|||||||
????
|
[ 1300 ; 1500[
|
|||||||
|
||||||||
D) Statistique
descriptive et l’ « événement » .
Elle commence là où la donnée d'un tableau de nombres exprime des grandeurs
liées au phénomène étudié : le nombre de naissances annuelles dans les dix
dernières années , la répartition de ces naissances en sexes , la catégorie
socioprofessionnelle des parents , etc .. On
pourrait étudier un caractère de cette population dont les unités
statistiques sont les nouveaux nés au cours de ces dix dernières années , par exemple le poids de ces nouveaux nés. A
chaque nouveau né correspond un poids. Cela est un événement. Nous relevons les tailles en cm de 30
individus adultes , pris au hasard. A chaque
individu correspondra une taille. Je dispose d'une distribution de la
taille en fonction des individus. Je peux dire que la taille varie en
fonction des individus. La taille , cette caractéristique de chaque individu
est une variable , et l' événement est ce couple
taille-individu . Après
recensement des variables , nous
obtenons le tableau de données suivant: |
||||||||
Tailles
en cm |
158 |
159 |
160 |
161 |
162 |
163 |
164 |
165 |
166 |
167 |
168 |
nombre |
1 |
0 |
0 |
1 |
0 |
1 |
1 |
2 |
0 |
0 |
0 |
Tailles
en cm |
169 |
170 |
171 |
172 |
173 |
174 |
175 |
176 |
177 |
178 |
179 |
nombre |
1 |
0 |
2 |
2 |
3 |
0 |
3 |
1 |
2 |
2 |
2 |
Tailles
en cm |
180 |
181 |
182 |
183 |
184 |
185 |
186 |
187 |
188 |
189 |
190 |
nombre |
1 |
0 |
1 |
2 |
1 |
0 |
0 |
0 |
0 |
1 |
0 |
Nous constatons que certains
événement se produisent 3 fois , deux fois , d'autres une fois et d'autres pas
du tout . Nous
pouvons également faire un tableau de la distribution des mesures. Nous pouvons aussi
faire une représentation graphique , il s'agit là d’un diagramme en bâtons. |
|
Nombre
d’individus ayant la taille
correspondante
|
|
Nous pouvons prolonger notre analyse : A partir de ce diagramme
,on pourrait dire que plusieurs groupes peuvent être repérés, celui des
grands ,celui des petits et celui des moyens .Mais je peut être plus rigoureux
en regroupant , en un certains nombre de classes les tailles des individus
par exemple de Nous « distribuons » des effectifs
après regroupement des individus .que
nous appellerons « classe ». |
158-162 |
163-167 |
168-172 |
173-177 |
178-182 |
183-187 |
188-190 |
|
Valeurs centrales |
160 |
165 |
170 |
175 |
180 |
185 |
190 |
effectifs |
2 |
4 |
5 |
9 |
6 |
3 |
1 |
Commentaire : En opérant le regroupement en
intervalles , nous avons constitué 7 classes. Dans chaque classe , les effectifs
montrent le nombre d'événements produits
(l' événement est : taille - individu). Si nous divisons par classe , la
somme des valeurs extrêmes , nous trouvons une valeur que nous
appelons « valeur centrale »
. |
||
|
||
Le choix des intervalles d'égale valeur sera
effectué cas par cas en tenant compte de la précision recherchée ou demandée
pour l' étude statistique , (et du coût projeté pour l'étude :il y a un
organisme financeur de cette étude) Un conseil
sur les bornes de chaque intervalle : il ne faut pas reprendre la
valeur précédente dans la classe suivante ( 158-162 ; 163-167 ; 168 etc.…) Pour l'étude des nouveaux nés , des intervalles
de 150 en |
||
Les
mesures sont des observations qui informent Reprenons
les tailles : |
||
|
|
|
Limites des classes |
effectifs |
Fréquences
(par classe) |
|
158-162 |
160 |
2 |
( 2 : 30 = ) 0,07 (à 0,01près) |
163-167 |
165 |
4 |
( 4 : 30 = ) 0,13 |
168-172 |
170 |
5 |
0,17 |
173-177 |
175 |
9 |
0,3 |
178-182 |
180 |
6 |
0,2 |
183-187 |
185 |
3 |
0,1 |
188-190 |
190 |
1 |
0,03 |
total |
|
N = 30 |
Somme des
fréquences = 1 |
Commentaire : En opérant le regroupement en intervalles , nous
avons constitué 7 classes. Dans chaque classe , les effectifs montrent le
nombre d'événements produits (l' événement
est : taille - individu). Si nous divisons l'effectif de chaque classe par
le nombre de mesures (30), nous obtenons la " Fréquence" de chaque classe . Si nous observons le résultat du
calcul de chaque classe, nous constatons que les 7 événements
possibles n'ont pas la même fréquence. Si nous faisons la somme des fréquences , nous
obtenons "1 " : la somme des fréquences est l' événement certain : chaque individu a une mesure . Un autre échantillon tiré de la même population
"parente" aurait sensiblement la même distribution. On peut estimer
que la distribution des fréquences dans la population parente aurait la forme
théorique présentée ci-dessous. |
|||
|
Courbe
des fréquences |
|
|
|
|||
Il
y a les données de rang : Il
y a deux cas : Ou bien les données sont collectées en termes de
rang , ou bien les données collectées n'atteignent pas le niveau de l'échelle d'intervalle , elles
peuvent être remplacées par leurs rangs si l'on peut vérifier qu'elles
atteignent ce niveau de mesure . exemple
: une course d'éducation sportive :
l'histogramme est plat ;chaque élément occupe un rang . |
|||
Résumé
des observations : Nous remarquons que les observations recueillies
nous permettent de repérer deux catégories d'indices pour décrire nos
ensembles de données. (nous ne nous
situons que par rapport aux données de
score) Cliquer ici pour plus d'informations sur ces
indices : |
|||
|
|
||
|
|
|
|
|
Voir les travaux auto formatifs. |
|