Définition de l'écart-type

Bonjour,
étant en première année de licence et ayant eu un projet de mathématiques sur les probabilités et statistiques, une question m'est venue quant à la définition de l'écart-type.

Si l'écart-type représente la mesure de dispersion de données, pourquoi l'avoir défini comme tel ?

Plus précisément, si on considère la variable aléatoire X qui prend un nombre fini de valeurs x1, x2, ... , xn avec les probabilités respectives p1, p2, ... , pn, pourquoi avoir défini l'écart-type comme : (si l'on note s l'écart-type)
s=sqrt(somme(pi*(xi-m)2)) (où m désigne l'espérance de X)

plutôt que de la manière suivante :
s=somme(pi*|xi-m|) ?

Car de mon point de vue, cette définition permet également de mesurer la dispersion de données.
Quel est donc l'avantage de la (vraie) définition de l'écart-type par rapport à la définition que je lui aurais attribuée ?

Merci d'éclairer ma lanterne :)

Réponses

  • N'y a-t-il pas aussi, une régularité supplémentaire, je pense à la dérivation, qu'avec la valeur absolue.

    Sous cet angle, cela me fait penser aux moindres carrés, toute proportion gardée.
    On ne parle "jamais" des moindres écarts, en valeur absolue (problème d'unicité).
  • En fait, contrairement à ce qu'on pourrait penser, la valeur absolue est souvent plus compliquée que le carré pour les calculs. D'ailleurs $|x|=\sqrt{x^2}$, même s'il est généralement plus facile de trouver la valeur absolue d'un nombre que son carré.
    Au départ, l'estimation de la dispersion par la variance était naturelle pour les mathématiciens du dix-huitième siècle, tous mécaniciens (analogie avec le moment quadratique); elle apparaît donc en statistiques, puis est utilisée en probabilités. Pour des raisons d'unités, on lui adjoint l'écart type, qui a la même unité que les données. Et on trouve un grand nombre de propriétés utiles.
    Pour l'écart absolu moyen (s=somme(pi*|xi-m|) ), on peut noter qu'il es aussi utilisé en statistiques, mais n'a pas grand chose comme propriétés utilisables. Même avec des variables indépendantes, l'écart absolu moyen de la somme de deux variables n'est pas la somme de ceux des deux variables. D'ailleurs, il existe en général des valeurs m' qui rendent somme(pi*|xi-m'|) plus petit que somme(pi*|xi-m|), la meilleure étant ... la médiane. Ce qui fait qu'on utilise aussi l'écart absolu moyen à la médiane.

    Cordialement.
  • L'écart type je ne sais pas, mais la variance, oui. C'est un calcul tellement commun à la fin du dix-huitième siècle ... alors que le TCL apparaît au début du dix-neuvième.
    En fait, la mathématisation des stats est plus tardive, en tant que statistiques nettement séparées. Et si on en croit Wikipédia, les notions d'écart type et de variance sont dégagées bien après les travaux de Laplace et Gauss (1893, Pearson pour l'écart type; 1918, Fischer pour la variance). Mais les calculs correspondants sont fait depuis longtemps (De Moivre, 1718 pour l'écart type).
    Si on accepte ces éléments historiques, le premier à apparaître est l'écart type, mais vu qu'on le calcule comme racine carrée de ce qui est la variance, elle préexiste aussi.

    A noter : L'idée de carrés des écarts à la moyenne est à la base de la méthode des moindres carrés (minimiser la variance) de Legendre, Gauss, Laplace et Bienaymé. Développée un peu avant le TCL (sauf un cas très particulier vu par De Moivre), publiée au même moment, elle montre que la variance, même non dégagée comme concept, fait partie de l'outillage des mathématiciens de l'époque.

    Cordialement.
  • Merci pour vos réponses (très pertinentes)
Connectez-vous ou Inscrivez-vous pour répondre.