nomenclature en statistique

 

DOSSIER :  NOMENCLATURE

 A )  LA SAISIE  de données : le sondage  et l’enquête.

 B )  l' OBERVATION   des faits ( exemple de dépouillement ).

 C )  « CLASSE » :  constitution d’une classe , « classe modale », , « valeur centrale d’une classe », « classes et amplitude ».

D)   Statistique descriptive   et  l’ « événement » .

 

 

 

 

 

 

 

 

 

 

 

TRAVAUX AUTO FORMATIFS.

 

 

 

 

TEST

           

COURS

               

Devoir  Contrôle

Devoir évaluation

Interdisciplinarité

                       

 

Corrigé Contrôle 

Corrigé évaluation 

 

 

 

 

TRAVAUX AUTO FORMATIFS :   (le questionnaire reste à faire )

 

 

 

A)  LA SAISIE  de données : le sondage  et l’enquête.

 

La statistique est une science ancienne . Elle est utilisée de nos jours en médecine , science sociale et science de l’Education ,en psychologie , en fiscalité , en physique ; …..etc. et bien entendu en économie et notamment en gestion des entreprises.

Il est commun de dire que « gouverner et gérer c’est prévoir » , cela implique qu’avant de faire des prévisions, il est nécessaire de savoir. La statistique  permet d’avoir une meilleure connaissance des faits et habitus et de faciliter la prise de décisions. 

OBSERVATION : 

Les sources d’informations nécessaires pour faire l’étude statistique d’une population constituent des éléments de base fondamentaux .

Donc , la saisie de données  pour étude   s’effectue à partir de  deux types d’enquête :

L’enquête exhaustive ( recensement ) , et l’enquête partielle  ( sondage) ;

 

Enquête exhaustive .

On effectue une enquête exhaustive si on enregistre les renseignements concernant tous les membres d’une population. On dit aussi qu’on effectue un recensement : c’est le cas du recensement du nombre de naissances d’une ville pendant une période donnée. Ce procédé est très précis , simple et sûr .

L’ enquête partielle ( SONDAGE ):

Lorsque la population statistique est  trop nombreuse on étudie un sous ensemble  de la population , appelé « échantillon » , sur lequel on détermine l’observation des faits . Ce procédé est moins précis et la statistique mathématique cherche  dans quelles conditions on peut étendre  à la totalité de la population les résultats obtenus sur l’échantillon. On dit qu’on a procédé par « sondage »

 

C’est le cas des sondages d’opinion sur les intentions de vote .

 

        L’enquête par sondage  consiste à poser un certain nombre de questions à un certain  nombre de personnes.

 Pour recueillir les informations données par la personne interrogée , plusieurs moyens sont possibles :

-         les contacts  direct par enquêteur .

-         la voie postale .

-         le contact par téléphone .

Quel que soit le moyen utilisé  , une   attention  toute particulière à la rédaction du questionnaire .

 

B)  l' observation des faits ( exemple de dépouillement ).

ENREGISTREMENT DES OBSERVATIONS et Exploitation et dépouillement des données : 

Exploitation et dépouillement des données : 

:

Supposons  qu’on doive définir une statistique portant sur les notes  de cent élèves à la suite d’un examen ;Les notes figurent dans le tableau ci – dessous et ont été distribuées au fur et à mesure de la correction.

La liste de ces notes   attribuées à chaque élève s’appelle « série statistique »

 

 

6

10

12

14

1

8

9

10

15

14

12

12

13

2

4

6

5

1

9

11

7

4

12

8

13

10

12

12

18

10

9

6

9

5

10

6

5

11

12

13

14

8

11

7

15

8

5

13

8

6

11

10

18

12

14

16

6

13

15

11

18

8

19

17

8

15

10

7

9

11

9

9

13

10

15

16

9

13

15

17

13

9

9

10

11

7

8

11

16

7

17

10

7

10

10

8

10

11

11

 

 

 

 

 

 

Passage de l’enquête (inventaire ou recensement) au tableau :

Certaines caractéristiques apparaissent facilement : peu de notes inférieures à 3 et supérieures à 17 ,  il est difficile de tirer des indications générales de ces données présentées sans ordre . On commencera dons par « classer » suivant le tableau qui représente  le nombre d’élèves ( noté : ni  ) ayant obtenu la note ( notée : xi  )

 

notes: xi

ni

 

notes : xi

ni

1

2

11

10

2

1

12

8

3

0

13

8

4

2

14

4

5

4

15

6

6

6

16

3

7

7

17

3

8

9

18

3

9

10

19

1

10

13

20

0

Ce tableau présente l’inconvénient d’être volumineux .On peut choisir d’effectuer un regroupement des valeurs de la variable (note) suivant 5 classes .

Pour cela on partage l’intervalle [ 0 ; 20] en 5 intervalles partiels comprenant chacun 4 notes sauf le dernier qui en contient cinq .

On obtient les classes suivantes :

 

Ici :  SOS écriture normalisée

[  0 ; 4  [    groupant les  xi   tels que      0  £  xi  < 4

[  4 ; 8   [    groupant les  xi   tels que       4  £  xi  <  8

[  8 ; 12 [  groupant les  xi   tels que       8  £  xi  <  12

[  12  ; 16 [  groupant les  xi   tels que    12  £  xi  <  16

[  16  ; 20 ]  groupant les  xi   tels que   16  £  xi  £  20

 

 .Les valeurs  2 ; 6 ; 10 ; 14 ; 18 ,  sont appelées « valeurs centrales » des classes .

Dans ces conditions , le dépouillement se présente suivant le nouveau tableau suivant :

Classes des notes

Nombres d’élèves

 [  0  ; 4    [

  [  4 ; 8     [

   [  8  ;  12 [

    [  12  ; 16 [

     [  16  ; 20 [*

*remarquez que le crochet exclu la valeur 20

3

19

42

26

10

 

 

 

C ) CLASSE :  constitution  d’une classe , « classe modale », , « valeur centrale d’une classe », « classes et amplitude ».

      

  l'effectif total des éléments pris en compte sont regroupés par catégorie ou "classe".

                (les classes  (intervalles) sont imposées par le statisticien ) ; les classes n'ont pas obligatoirement la même amplitude ( existence des valeurs entre  les bornes peuvent être différentes ; mais attention , lors de la représentation graphique "histogramme" de respecter l'aire de référence .

Constitution d’une classe :

Lorsque les "caractères" sont mesurables  ; on organise les "réponses" en classe de nombres ,C'est à dire :

On prend l'ensemble des réponses: exemple  les mesures des tailles des 30 individus recensés dans le désordre sont rangées (classées) par groupe (classe) ;et on les  regroupe par "Classe"

(les classes sont représentées par des "intervalles" ,un intervalle est un  segment de droite bornée  en géométrie )

Exemple les individus mesurant entre

158 et 162

constituent la classe 1

Exemple les individus mesurant entre

163 et 167

constituent la classe 2

Exemple les individus mesurant entre

168 et 172

constituent la classe 3

Exemple les individus mesurant entre

173 et 177

constituent la classe 4

Exemple les individus mesurant entre

178 et 182

constituent la classe 5

Exemple les individus mesurant entre

183 et 187

constituent la classe 6

Exemple les individus mesurant entre

188 et 192

constituent la classe 7

CLASSE :

Se souvenir · dans un tableau on donne  L'  effectif par « classe »  (qui est un "sous- effectif" )  ou un effectif par « caractère » . cet effectif par classe ou caractère est noté par le  petit  " n " avec un indice d'ordre  : les   (n i ) 

 

· On calculera  L' effectif total est la somme des éléments (n i )  qui sont inventoriés . Le symbole désignant l'effectif total est  " N "

L'effectif de la classe 1 est noté : n1

L'effectif de la classe 2 est noté :n2

L'effectif de la classe 3 est noté : n3

L'effectif de la classe 4 est noté : n4

L'effectif de la classe 5 est noté : n5

L'effectif de la classe 6 est noté :n6

L'effectif de la classe 7 est noté : n7

D'où l' égalité :                N = n1+ n2+ n3+ n4+ n5+ n6+ n7 

D'où la formule :                              N  =

On dira que l'effectif total est égal à la somme des effectifs des classes données ( "i" désigne le nombre de classes")

C.A.   en milliers d’euros )

x i

Effectifs

(  n i )

 

 

L’effectif «  n 3 » de la classe «  x 3 » étant le plus grand .

 

 

La classe « x 3 »  est la classe « modale » ;

    x 1 =300 à moins  500

22

    x 2 = 500 à moins  800

25

    x 3 = 800 à moins  1 000

 n 3  =  90

    x 4 = 1 000 à moins 1400

33

    x 5 = 1 400 à moins  1500

24

     x 6 = 1500 et +

  6

 

 

Remarques :

pour tracer le polygone des effectifs  ou fréquences, il faudra rechercher pour chaque classe observée : « son centre de classe » .appelé aussi : « moyenne de centre de classe » ou « valeur centrale d’une classe ».

Dans le calcul de l’écart type  , on prendra la valeur centrale de chaque classe comme « x i »

« valeur centrale » d’une classe.

exemple

C.A.   .(milliers d’euros )

x i

 

C.A.   .(milliers d’euros )    x i

Peut s’écrire

Centre de classe :  x i

 

300 à moins  500

 

[ 300 ; 500[

 

500 à moins  800

 

[ 500 ; 800[

( 500 + 800) /2 = 650

800 à moins  1 000

 

[ 800 ; 1000[

(800 + 1000) / 2 = 900

1 000 à moins 1400

 

[ 1000 ; 1400[

( 1000 + 1400 ) /2 = 1200

1 400 à moins  1500

 

[ 1400 ; 1500[

(1400 + 1500) / 2 = 1450

1500 et +

 

????

Il faudra connaître le C.A. maxi

On se souviendra que dans les calculs de l’écart type on « admet que les valeurs observées sont celles du centre de la classe ».

« Classe » et « amplitude »

 

La représentation graphique des effectifs d’une variable continue ( organisation de « classe » pour ranger ces effectifs)peut s’effectuer sous la forme d’un histogramme.

Pour respecter le principe de construction de l’histogramme, on devra veiller à vérifier que les intervalles  de toutes les classes sont égaux.

, On dit que les clases doivent avoir la même amplitude.

 

Exemples :

Classes d’amplitudes inégales

 

Classe d’amplitudes égales

[ 300 ; 500[

Cette série ne sera pas exploitable pour tracer un histogramme. Il faudra repenser la distribution.    Voir « l’informaticien ».

[ 300 ; 500[

Cette série est exploitable pour tracer un histogramme.

[ 500 ; 800[

[ 500 ; 700[

[ 800 ; 1000[

[ 700 ; 900[

[ 1000 ; 1400[

[ 900 ; 1100[

[ 1400 ; 1500[

[ 1100 ; 1300[

????

[ 1300 ; 1500[

 

D) Statistique descriptive   et  l’ « événement » .

        Elle commence là où la donnée d'un tableau de nombres exprime des grandeurs liées au phénomène étudié : le nombre de naissances annuelles dans les dix dernières années , la répartition de ces naissances en sexes , la catégorie socioprofessionnelle des parents , etc ..

 

       On pourrait étudier un caractère de cette population dont les unités statistiques sont les nouveaux nés au cours de ces dix dernières années , par exemple le poids de ces nouveaux nés. A chaque nouveau né correspond un poids. Cela est un événement.

 

Autre exemple:

 Nous relevons les tailles en cm de 30 individus adultes , pris au hasard. A chaque  individu correspondra une taille.

 

        Je dispose d'une distribution de la taille en fonction des individus. Je peux dire que la taille varie en fonction des individus. La taille , cette caractéristique de chaque individu est une variable , et l' événement est ce couple taille-individu .

Après recensement des  variables , nous obtenons le tableau de données suivant:

 

Tailles en  cm

158

159

160

161

162

163

164

165

166

167

168

nombre

1

0

0

1

0

1

1

2

0

0

0

Tailles en  cm

169

170

171

172

173

174

175

176

177

178

179

nombre

1

0

2

2

3

0

3

1

2

2

2

Tailles en  cm

180

181

182

183

184

185

186

187

188

189

190

nombre

1

0

1

2

1

0

0

0

0

1

0

Nous constatons que certains événement se produisent 3 fois , deux fois , d'autres une fois et d'autres pas du tout .

 Nous pouvons également faire un tableau de la distribution des mesures. Nous pouvons  aussi   faire une représentation graphique , il s'agit là d’un diagramme en bâtons.

 

 

Nombre d’individus ayant la  taille correspondante

 

Nous pouvons prolonger notre analyse :

A partir de ce diagramme ,on pourrait dire que plusieurs groupes peuvent être repérés, celui des grands ,celui des petits et celui des moyens .Mais je peut être plus rigoureux en regroupant , en un certains nombre de classes les tailles des individus par exemple de 5 cm en 5 cm .J'aurai la classe des individus dont la taille et comprise entre 158 et 162 cm , puis celle des individus ayant entre 163 et 167 cm  , etc ; …nous obtenons le tableau suivant:

Nous « distribuons » des effectifs après regroupement des individus .que nous appellerons « classe ».

Valeurs extrêmes

158-162

163-167

168-172

173-177

178-182

183-187

188-190

Valeurs  centrales

160

165

170

175

180

185

190

effectifs

2

4

5

9

6

3

1

Commentaire :

En opérant le regroupement en intervalles , nous avons constitué 7 classes.

Dans chaque classe , les effectifs montrent le nombre d'événements produits  (l' événement est : taille - individu).

Si nous divisons par classe , la somme des  valeurs extrêmes  , nous trouvons une valeur que nous appelons «  valeur centrale »  .

Pour pouvons obtenir un autre diagramme « bâtons ».

 

Le choix des intervalles d'égale valeur sera effectué cas par cas en tenant compte de la précision recherchée ou demandée pour l' étude statistique , (et du coût projeté pour l'étude :il y a un organisme financeur de cette étude)

 

Un conseil  sur les bornes de chaque intervalle : il ne faut pas reprendre la valeur précédente dans la classe suivante ( 158-162 ; 163-167 ; 168  etc.…)

 

Pour l'étude des nouveaux nés , des intervalles de 150 en 150 g auraient convenu ,en supposant que les poids soient répartis entre 3,5 kg et 4,5kg  , nous aurions 7 « classes ». 

Les mesures sont des observations qui informent

Reprenons les tailles :

 

 

 

Limites des classes

Valeurs centrales

effectifs

Fréquences  (par classe)

158-162

160

2

( 2 : 30 = )  0,07  (à 0,01près)

163-167

165

4

( 4 : 30 = )  0,13

168-172

170

5

0,17

173-177

175

9

0,3

178-182

180

6

0,2

183-187

185

3

0,1

188-190

190

1

0,03

total

 

N =  30

  Somme des fréquences =                              1

Commentaire :

En opérant le regroupement en intervalles , nous avons constitué 7 classes. Dans chaque classe , les effectifs montrent le nombre d'événements produits  (l' événement est : taille - individu).

Si nous divisons l'effectif de chaque classe par le nombre de mesures (30),      

nous obtenons la           " Fréquence" de chaque classe .

Si nous observons le résultat du  calcul de chaque classe, nous constatons que les 7 événements possibles n'ont pas la même fréquence.

Si nous faisons la somme des fréquences , nous obtenons "1 " : la somme des fréquences est l' événement certain : chaque individu a une mesure .

Un autre échantillon tiré de la même population "parente" aurait sensiblement la même distribution. On peut estimer que la distribution des fréquences dans la population parente aurait la forme théorique présentée ci-dessous.

 

 

Courbe des fréquences

 

Il y a les données de rang :      Il y a deux cas :

Ou bien les données sont collectées en termes de rang ,

ou bien les données  collectées n'atteignent  pas le niveau de l'échelle d'intervalle , elles peuvent être remplacées par leurs rangs si l'on peut vérifier qu'elles atteignent  ce niveau de mesure .

exemple :  une course d'éducation sportive : l'histogramme est plat ;chaque élément occupe un rang .

Résumé des observations :

Nous remarquons que les observations recueillies nous permettent de repérer deux catégories d'indices pour décrire nos ensembles de données. (nous ne  nous situons que  par rapport aux données de score)

Cliquer ici pour plus d'informations sur ces indices :

 

Suite : les indice de position et de dispersion :

 

 

 

A )  Les indices de position

 

 

Voir les travaux auto formatifs.

B)  Les indices de dispersion