Au sujet de la covariance

Bonjour,
j'ai quelques questions au sujet de la notion de covariance de 2 variables aléatoires.
Concrètement, à quoi correspond la notion de covariance ? Quelle interprétation donner de la covariance ?
À part pour calculer le coefficient de corrélation, y a-t-il d'autres applications de la covariance (niveau L1/L2) ?

Réponses

  • Bonjour.

    la variance d'une variable aléatoire dit comment elle s'étale autour de la moyenne (espérance). La covariance dit si les deux variables s'étalent de concert (covariance positive) ou en sens inverse (covariance négative). Attention, ce n'est pas une mesure directe, l'interprétation est délicate; l'un des outils utilisable est le coefficient de corrélation.
    Parler d'applications de la covariance n'est pas la bonne idée, la covariance sert dans certaines situations, à différents niveaux.
    Rappel : Quand on étudie des outils mathématiques, la question "À quoi ça sert ?", sous entendu "Pourquoi perdrais-je mon temps à l'étudier" est seulement une façon de reculer devant l'obstacle. Si une notion est étudiée, c'est qu'elle servira, mais il est parfois difficile d'expliquer aux débutants toute l'étendue des utilisations. C'est le cas ici !!

    Cordialement.
  • La covariance est une étape dans le calcul du coefficient de corrélation. Mais ce n'est pas sa seule qualité. Si c'était sa seule qualité, on ne lui aurait probablement pas nommé d'un nom spécifique.
    La covariance est 'additive'.
    Si tu as 2 sous-univers (les hommes et les femmes par exemple), si tu connais la covariance au sein de ces 2 sous-univers, et si tu veux étudier l'univers total, il y a des formules simples qui permettent de trouver la covariance sur l'univers total à partir des 2 covariances de départ (... je dis ça, je suis convaincu que c'est vrai, mais je ne connais pas les formules simples en question).

    Alors qu'il n'y a pas de formule (aussi) simple pour les coefficients de corrélation.

    Aujourd'hui, avec les outils informatiques, recalculer la covariance du cumul, en repartant des données unitaires, ça coût un peu de CPU, et tout le monde s'en moque.

    Mais imaginons qu'on te dise : Voilà, on a nos 2 groupes Hommes et Femmes, on a les variances, covariances, moyennes et effectifs de ces 2 groupes. Calcule les mêmes indicateurs pour la population totale.
    C'est possible.

    C'est un peu le même intérêt que pour la variance...
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Merci à tous les deux pour vos réponses.
    @ Gerard0, ma question ne sous-entendait pas du tout le "à quoi bon l'étudier?". C'est vrai que je me demandais effectivement "à quoi ça sert", (à part pour le calcul du coefficiecient de corrélation), mais c'est simplement de la saine curiosité de ma part; pour mieux comprendre les choses ;-)
  • En fait, l'un des grands outils des statisticiens, travaillant avec de nombreuses variables, est la matrice de variance-covariance. Ce qui fait que la covariance est l'idée globale, la variance n'étant qu'un cas particulier : V(X) = cov(X,X).
    On voit mieux les idées en statistiques descriptives, mais la modélisation probabiliste sert à justifier ce qu'on y fait. D'où la présence des mêmes notions dans les deux disciplines : moyenne/espérance, médiane, quantiles, variance-covariance, écart type, etc.

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.