Matrice diagonale des variances
Bonjour
On se donne une matrice $X$ de $n$ lignes (individus) et $p$ colonnes (variables) à valeurs réelles (observations). On définit une matrice diagonale de taille $n$, $D_w$, contenant des « poids » $w_i$ associés aux individus, avec le critère usuel $\sum{w_i}=1$. On désigne par $1_n$ le vecteur colonne de taille $n$ ne contenant que des $1$.
À partir de ce petit matériel, on peut calculer, de façon matricielle, le vecteur colonne $G$ de taille $p$ contenant les $p$ moyennes (pondérées) des $p$ variables : $$G=X^T D_w 1_n.
$$ Ceci permet de passer, toujours de façon matricielle, de la matrice initiale $X$ à la matrice $Y$ des données centrées : $$
Y=X – 1_n G^T.
$$ Et, grâce à $Y$, on peut obtenir, encore de façon matricielle, la matrice $V$ de variance-covariance : $$V=Y^T D_w Y.
$$ Jusque-là, tout va bien. Mais je me demande, et je ne trouve pas, s’il serait possible, de façon matricielle, d’obtenir juste la matrice diagonale des variances…
Merci pour toute idée.
On se donne une matrice $X$ de $n$ lignes (individus) et $p$ colonnes (variables) à valeurs réelles (observations). On définit une matrice diagonale de taille $n$, $D_w$, contenant des « poids » $w_i$ associés aux individus, avec le critère usuel $\sum{w_i}=1$. On désigne par $1_n$ le vecteur colonne de taille $n$ ne contenant que des $1$.
À partir de ce petit matériel, on peut calculer, de façon matricielle, le vecteur colonne $G$ de taille $p$ contenant les $p$ moyennes (pondérées) des $p$ variables : $$G=X^T D_w 1_n.
$$ Ceci permet de passer, toujours de façon matricielle, de la matrice initiale $X$ à la matrice $Y$ des données centrées : $$
Y=X – 1_n G^T.
$$ Et, grâce à $Y$, on peut obtenir, encore de façon matricielle, la matrice $V$ de variance-covariance : $$V=Y^T D_w Y.
$$ Jusque-là, tout va bien. Mais je me demande, et je ne trouve pas, s’il serait possible, de façon matricielle, d’obtenir juste la matrice diagonale des variances…
Merci pour toute idée.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Pas d'autre chose je crois.
Une fois $Y$ calculée, j'avais pensé récupérer la $j^{\,ème}$ colonne en utilisant le vecteur adéquat, $e_j$, de la base canonique :
$$Y_j=Y e_j$$ Puis calculer la valeur $\sigma_j^2$ par $Y_j^T D_w Y_j$ et enfin construire ma matrice diagonale des variances par des produits avec les matrices élémentaires :
$$\sum{\sigma_j^2 E_{j,j}}$$
Mais ta façon est nettement meilleure... Il suffit ensuite de sommer.