Les ajustements en statistique: étude en niveau 4

 

Pré requis :

 

Les Statistiques  info

3D Diamond

La fonction linéaire

3D Diamond

Les pourcentages

3D Diamond

 Tendance centrale

 

Dispersion

 

 

 

ENVIRONNEMENT du dossier:

 

Index   : warmaths

Objectif précédent   Sphère metallique

  1. A deux variables……
  2. Cours sur les ajustements.

Objectif suivant :

1°) Exemples de « résolution type »

 

tableau    Sphère metallique

 Liste des objectifs –cours en statistiques

 

 

 

 

 

 

 

 

 

 

DOSSIER   STATISTIQUES _ Niveau 4 _ dont :  terminal S

 les ajustements .

1.  introduction. « le nuage de points »

2.  l’ajustement linéaire (dit aussi : affine)  par la méthode des moindres carrés. (les paramètres « a » et « b » de la  droite des moindres carrés,procédés de calcul ; représentation graphique de la droite, intérêt de ce calcul) ,représentation graphique de la droite dit « droite de régression de « y » en « x »  »

  3.  Ajustement se ramenant à un ajustement affine.

 

TEST

           FilesOfficeverte

COURS

                FilesOfficeverte

Devoir  Contrôle FilesOfficeverte

Devoir évaluation FilesOfficeverte

Interdisciplinarité

                        Filescrosoft Officeverte

 

Corrigé Contrôle  FilesOfficeverte

Corrigé évaluation  FilesOfficeverte

 

 

 

 

COURS

 

 

Au lieu de traiter une seule variable (les ventes par exemple), nous analyserons les deux caractères simultanément. Nous sommes en présence de distributions statistiques à deux variables (xp y).

Précédemment : Nous  avons vu que  l'étude des paramètres de tendance centrale et de dispersion permettent de caractériser une distribution.

 

 

 

1

Le nuage de points.

 

 

Nous allons analyser ces deux caractères simultanément . Nous allons donc essayer de les mettre en relation .

Dans ce cas nous sommes en présence de « distributions statistiques à deux variables ;  (  x i ; y i ) 

 

 

Exemple :

Analyse des ventes par mois de la tablette tactile « XC 3 »   ( y i )      et des dépenses mensuelles de publicité  (  x i  )  .

 

 

 

 

Dépenses de publicité (  x i  ) 

Ventes correspondantes ( y i )

 

 

 

100

8

 

 

110

9

 

 

110

9

 

 

120

9

 

 

120

9

 

 

120

9

 

 

130

10

 

 

130

10

 

 

140

10

 

 

140

11

 

 

140

11

 

 

150

12

 

 

  Lorsque l’on lit le tableau ci-dessus , nous avons « l’intuition » que les deux phénomènes sont dépendants l’un de l’autre .

Cette intuition est renforcée par la construction du graphique sur lequel sont portées , sur l’axe des abscisses , les valeurs   (  x i  )  et , sur l’axe des ordonnées , les valeurs de ( y i ).

 

 

aj18

 

 

Ces points constituent un nuage  statistique  .

Expression qui traduit bien le fait qu’il s’agit simplement d’une image faisant apparaître visuellement la « dépendance » des deux caractères .

« lorsque les dépenses de publicité augmentent les ventes progressent »

Ce nuage de points représente  une liaison  parce que les deux variables concernent deux phénomènes .

 

 

 

 

 

Exemple de situation problème n°2  : Evolution du chiffre d’affaires de l’entreprise « Y » au cours des dix dernières années.

 

 

 

 

Années  (  x i  )

Chiffres d’affaires ( en milliers d’ €) ( y i ).

 

 

 

1

600

 

 

2

710

 

 

3

880

 

 

4

990

 

 

5

1220

 

 

6

1300

 

 

7

1400

 

 

8

1750

 

 

9

2100

 

 

10

2300

 

 

 

Si l’on représente ces deux variables on obtient aussi un nuage statistique ; celui-ci représente une évolution …( à vous de tracer ce nuage de points)

 

 

 

Calcul de   :

 ( 1 +2+3+4+5+6+7+8+9+10)  /  10 

=   55 / 5 

= 5,5

Calcul de  :=   ( 600+710+880+990+1220+1300+1400+1750+2100+2300) / 10

=  13250 / 10

=  1325

 

 

Remarque :     et   sont les coordonnées du « point moyen » ,. Point  par lequel passe  le droite de régression…….

 

 

 

 

 

 

 

 

 

 

 

Un  nuage de point   représente :

-          soit une liaison , si les deux variables concernent deux phénomènes .

-          Soit  une évolution si l’une des deux variables est le temps.

 

 

 

 

 

Résumé : On retiendra :

 

 

·      Une série statistique à deux variables ( dit aussi : série statistique double ») est  un ensemble des (  x i ; y i ) avec () , résultats de l’étude de deux caractères quantitatifs pour chacun des « n » individus d’une population. 

 

 

·      Lorsqu’on représente une série statistique double (  x i ; y i ) avec () ,, dans un repère orthogonal, par les points de coordonnées (  x i ; y i ) , on obtient un nuage de points.

 

 

·      Le point moyen du nuage est le point dont les coordonnées sont ( ; ) moyennes respectives des (  x i ; y i )

 

 

 

 

2

L’ajustement affine  ( dit aussi : linéaire) par la méthode des moindres carrés.

 

 

1°) Méthode et principe.

 

 

La méthode est basée sur le principe qu’il faut réduire « au maximum » les écarts verticaux entre les valeurs observées et les valeurs théoriques fournies par la droite d’ajustement.

 

 

aj16

 

 

Le but étant de minimiser les écarts :   ( Ecart 1  + Ecart 2 + …….+ Ecart n ) que nous écrivons : Min

 

 

L’écart se définit comme mesurant algébriquement la différence entre la valeur observée et la valeur ajustée.

 

 

«  écart 1  = y 1 – y ’ 1 »

 

 

«  écart 2  = y 2 – y ’ 2 »

 

 

Cette différence peut être positive «  écart 2  = y 2 – y ’ 2 » , négative  «  écart 1  = y 1 – y ’ 1 » , ou nulle ( si les valeurs théoriques et observée sont confondues) .

Pour éliminer ce problème de signe et faire en sorte que la sommation de ces écarts ne se traduise pas par une compensation quand ils sont de signes contraires on les élèves au  carré , ce qui les rend tous positifs.

Nous cherchons donc à : Min

L’expression d’un écart quelconque peut s’écrire «  écart i  = y i – y ’ i » ; donc la droite la plus représentative est celle pour laquelle la somme des carrés des écarts est minimale, d’où le nom de «  méthode des moindres  carrés ». 

 

 

2°)  Autrement dit : ajustement affine par moindre carrés

 

 

    Un nuage de points « n »  ,  ou  A1 ( x1 ; y 1) ;  A2 ( x2 ; y 2) ; …….. An ( xn ; y n)  et une droite  ( D )  d’équation «  y =  a x + b » étant donnés , on peut calculer la somme des carrés des distances «  A i A ‘ i » , où « A ‘ i » est le projeté de   «  A i  » sur ( D  ), parallèlement à l’axe des ordonnées.

carre_ts001

 

 

La droite qui minimise la somme des carrés des distances «  A i A ‘ i » est appelée « droite de régression de « y » en « x » ou plus simplement « droite des moindres carrés. »

Cette droite passe par le point moyen du nuage et son coefficient directeur est :

 

 

                                                                                                                                    

 

 

 

Cette droite à pour équation : 

 

 

 

  y -    =  a ( x -  ) 

 

 

 

A partir de l’équation de la droite des moindre carrés , on peut estimer « y » pour une valeur donnée « x »  ou « x » pour une valeur de « y » donnée.

 

 

 

 

 

 

 

 

 

 

Exemple de calcul manuel  :  calculons terme à termes , remplaçons ensuite dans la formule…….

 

.

 

Colonne ( 1)

Colonne ( 2 )

Colonne ( 3 )

Colonne ( 4 )

Colonne ( 5  )

Colonne ( 6)

 

x i

y i

1

6

6 + 8+ 18+32+50+60+84=

7 x 4x 8 =

1+4+9+16+25+36+49 =

7 x  4² =

2

4

 

 

 

 

3

6

 

 

 

 

4

8

=  258

= 224

= 140

= 112

5

10

 

 

 

 

6

10

 

 

 

 

7

12

 

 

 

 

 

 

 

    ;      = d’ où        

 

 

 

 

 

 

Ajustement se ramenant à un ajustement affine.

 

 

Dans le cas où le nuage de points d’une série statistique double n’a pas une forme allongée à laquelle une droite pourrait s’ ajuster, il peut être intéressant  d’effectuer une transformation sur une des deux variables pour examiner si le nuage de la nouvelle série double obtenue est formé de point se répartissant mieux selon une ligne droite.

Une fois trouvée la relation entre les variables de la série transformée , on revient aux variables de la série initiale en utilisant la transformation réciproque .

Ainsi , si une série (  x i ; y i ) est transformée en posant «  t i = ln (  y i ), on obtient une équation de droite des moindres carrés de la forme «  t = a x + b » et on revient à une équation entre « x » et « y » en remplaçant « t » par « ln y », ce qui conduit à :

ln y  =  a x + b

 

 

Puis    «  y = e ax+b »

Ou     «  y =  e ax x e b »

Soit , en posant  « e b = B  »,………………..             «  y = B e ax  »

 

 

 

 

 

 

Fin du résumé.

 

 

Voir la résolution d’exercices et situations types.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

TRAVAUX AUTO FORMATIFS.

 

CONTROLE :

 

1°) 

 

EVALUATION

 

La correction est dans le cours.

 

 

 

TRAVAUX AUTO FORMATIFS.

 

CONTROLE :

 

1°) 

 

EVALUATION

 

La correction est dans le cours.

 

 

:p>