ACP sur des écarts aux moyennes — Les-mathematiques.net The most powerful custom community solution in the world

ACP sur des écarts aux moyennes

Bonjour à tous,

Je dispose d'une matrice $A$ à $n \geq 20$ lignes et $m \geq 10$ colonnes.

Les lignes correspondent à des villes européennes, qui appartiennent donc à des pays, lesquels sont regroupés en des "groupes de pays" connexes géographiquement, aux contours assez arbitraires. On a donc une partition $\cal P$ de $\{1, \ldots, n \}$, tel que chaque sous-ensemble de $\cal P$ contient tous les indices des villes qui sont dans un même "groupe de pays".

Les colonnes représentent des variables démographiques et économiques quantitatives.

Écrivons ${\cal P} = G_1 \cup G_2 \cup \cdots \cup G_p$ où $p \geq 3$.

Pour tout $1 \leq k \leq r$, on calcule, pour chaque $j$ compris entre $1$ et $m$, la moyenne :
$$
\mu_{k,j} = \frac{1}{\# G_k} \sum_{i \in G_k} a_{i,j} \,.
$$

Est-il raisonnable de faire une analyse en composantes principales (ACP) sur la matrice $B$ à $n$ lignes et $m$ colonnes dont le terme général $b_{i,j}$ est défini par :
$$
b_{i,j} = a_{i,j} - \mu_{k,j}
$$
où $k$ est l'unique entier tel que $i \in G_k$ ?

Est-ce que c'est robuste ? Connaissez-vous des études ou ce genre d'ACP a pu être faite ?

Merci d'avance pour votre aide,
Jean-Yves Degos

Réponses

  • Bonjour,
    J'ai du mal avec votre formalisme. Si, vous vous demandez par là si vous pouvez regroupez les villes par zone géographiques en effectuant une transformation sur les données qui a du sens (interprétable)? La réponse est oui sans hésitation.
    Indépendamment de votre question mais, peut-être pas si loin, la présentation de l'ACP se fait avec un certain poids pour chaque individu et, pour la plupart sur des variables centrées réduites.
    Je ne suis pas sûr d'avoir répondu à votre question : pourriez-vous m'expliciter la transformation que vous effectuez en des termes courants ?
    Bien cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!