variance 1ère S
Bonjour,
je ne suis pas satisfait de la façon dont on peut introduire la variance en statistique en 1ère S...la formule tombant comme un cheveu dans la soupe.
Pourquoi ne pas se contenter de la moyenne des valeurs absolues des écarts ? Pourquoi on met au carré ?
Merci pour vos aides et conseils !
je ne suis pas satisfait de la façon dont on peut introduire la variance en statistique en 1ère S...la formule tombant comme un cheveu dans la soupe.
Pourquoi ne pas se contenter de la moyenne des valeurs absolues des écarts ? Pourquoi on met au carré ?
Merci pour vos aides et conseils !
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Voici comment on me l'avait expliqué au lycée :
Soit $x_i$ des nombres avec $i \in I$ un indice.
On sait calculer la moyenne $\bar{x}$ de ces nombres. Mais on peut avoir différents nombres qui ont la même moyenne tout en étant différents. On cherche alors une autre caratéristique de la distribution de $x_i$ par rapport à leur moyenne $\bar{x}.$
On considère les écarts à la moyenne $x_i - \bar{x}$ et on cherche à caractériser cette quantité.
Si on prend une moyenne $\bar{x-\bar{x}}$ on trouve $0$, ça ne convient pas.
Pourquoi ? Parce que les contributions positives compensent exactement les contributions négatives.
(Bien sûr, tout ceci avec un exemple avec les distributions des notes de mathématiques de la classe au dernier contrôle...)
Une solution est alors d'enlever le signe : on peut rendre tous ces écarts positifs en prenant leur valeur absolue ou en élevant au carré (par exemples). Ces deux caractérisques existent. L'élévation au carré est très pratique et souvent utilisée. On définit donc la variance par...
Je reprends ton exemple : distribution des notes à un contrôle. On trouve un écart-type de 2,4. Comment l'interpréter ? (j'ai bien compris que si on faisait cet écart type pour deux séries, celle qui a le plus petit écart-type a les notes les plus resserrées autour de la moyenne). Mais pour une seule série ? on peut rien en tirer ?
On peut montrer que la fonction $t \mapsto \frac{1}{n}\sum_{k=1}^n |t-x_i|$ admet un minimum en $t=$ la médiane de l'échantillon.
La variance donne une sorte de norme au carré, ce n'est pas la distance moyenne à cause de cela. On calcule la racine carrée pour obtenir un écart moyen qui est dans l'unité des données (la variance est dans l'unité du carré des données).
On considère les notes du dernier contrôle de mathématiques et une classe de $15$ élèves (c'était le cas dans ma classe en première). On veut caractériser la distribution des notes. On trace un graphique avec les élèves en abscisse (un numéro de $1$ à $15$) et les notes. Puis on construit un histogramme : le nombre des notes entre $0$ et $2$ est $0$ ; entre $2$ et $4$ est $0$; entre $4$ et $6$ est $2$ ; entre $6$ et $8$ est $4$; entre $8$ et $10$ est $5$ ; ...
On voit se dessiner une courbe avec une moyenne et un écart à la moyenne.
On calcule la moyenne. On trouve $10,2.$ On calcule l'écart type on trouve $2,4.$
Comment interpréter ?
Pour le $10,2$, le contrôle n'est ni trop dur, ni trop facile. En moyenne, les élèves arrivent à obtenir la moyenne... Certains ont mieux réussi et obtenu une note plus élevée, d'autres ont obtenu une note mois élevée. Si toute la classe avait $4$ de moyenne, de façon répétée contrôle après contrôle, alors le niveau du contrôle n'est pas adapté. Si toute la classe avait $19$ de moyenne, de façon répétée contrôle après contrôle, alors le niveau du contrôle n'est pas adapté.
Pour le $2,4$, on pourrait dire : le contrôle comportait 5 exercices notés sur $4$ points chacun. Puisque l'écart moyen est de $2.4$, cela veut dire que, en moyenne et approximativement, la moitié des élèves a réussi un exercice de plus que l'autre moitié : cette moitié a reçu environ $4$ points de plus et donc l'écart est $4/2 \sim 2$...
Autrement dit : si vous êtes dans la moitié inférieure, vous n'êtes qu'à un exercice d'écart par rapport à l'autre moitié.
Lorsqu'on cherche à résumer une série de données statistiques par un ou plusieurs chiffres, on a de nombreux choix possibles. Si on résume une série de données par un chiffre, on peut choisir un mode de la série (la ou les valeurs qui correspondent au plus grand nombre de données), une médiane (avec les problèmes posées par la définition de la médiane pour une série contenant un nombre pair de données...) ou la moyenne. Le choix de l'un ou l'autre des indicateurs n'est pas neutre : ainsi la médiane des salaires mensuels en 2013 en france est de l'ordre de 1 800 euros par mois, alors que le salaire moyen est de l'ordre de 2 200 euros (le mode correspond sans doute au smic, soit 1 120 € par mois, mais je n'ai pas trouvé de référence à ce sujet). Personnellement, il me semble que la médiane est un indicateur plus pertinent que la moyenne. Pour les moyennes, médianes des salaires et la valeur du smic en 2013 voir http://www.capital.fr/carriere-management/actualites/salaires-gagnez-vous-plus-que-le-francais-moyen-1070467
D'un point de vue algorithmique, il convient de tenir compte de la complexité du calcul de l'un ou l'autre de ces indicateurs de position : pour calculer la moyenne d'une série de donnée, il suffit de compter le nombre de données et d'additionner les chiffres... ce qui est élémentaire. Pour calculer la médiane, il faut par contre ordonner les données, ce qui est une opération pénible. On peut concevoir qu'à l'époque où on ne disposait d'ordinateurs, on ait privilégié le calcul de la moyenne sur la médiane. Il est assez surprenant que l'on continue à utiliser ces indicateurs aujourd'hui lorsqu'on discute du salaire ou du patrimoine des français. Old habits die hard
Mathématiquement, la moyenne minimise l'écart quadratique moyen : la fonction qui à $ x $ associe $ \displaystyle \sum_{k=1}^{n}\bigl(x_{k}-x\bigr)^{2} $ est minimale lorsque $ x $ correspond à la moyenne de $ \bigl(x_{1},\dots,x_{n}\bigr) $, et la valeur du minimum correspond à la variance.
Je te laisse maintenant réfléchir au problème sous jacent à la question que tu poses : pour quelle(s) valeur(s) la fonction qui à $ x $ associe $ \displaystyle \sum_{k=1}^{n}\bigl\lvert x_{k}-x\bigr\rvert $ est elle minimale ?
PS: Je n'avais pas bien lu la discussion; la réponse est dans le message de Samuel DM.