Analyse en composantes principales

adormaths · February 2019

Bonjour
J'ai du mal à comprendre le nuage des individus

Je ne sais pas si la question doit être posée ici ou dans le forum sur les vecteurs...

En effet, il s'agit d'un espace vectoriel à K dimensions dont chaque dimension est une variable.
1) Est-ce que cela signifie que l'abscisse est la variable k1, l'ordonnée la variable k2, l'axe z la variable k3 puis la dimension suivante la variable k4, etc. ?
2) Qu'est-ce qu'une dimension dans la théorie des vecteurs ?
Qu'est-ce qui est vecteur dans ce schéma ? Car l'individu i est un point de l'espace vectoriel. Donc est-ce chaque axe (chaque variable) qui est un vecteur ?
3) Comment place-t-on l'individu i1 ? Par ex, si variable1 = 3 pour cet individu, on repère l'unité 3 sur k1, variable2 = 5 on repère l'unité 5 sur k2, etc ?

Merci d'avance :-)

gerard0 · February 2019

Bonjour.

Difficile de faire sérieusement de l'ACP, plus généralement des statistique non élémentaires, sans une vraie connaissance de l'algèbre linéaire. Ce qui fait que mes réponses ne te suffiront pas, mais que c'est à toi d'apprendre la théorie des espaces vectoriels.
1) oui, mais quand il y a de nombreuses dimensions, on ne parle plus d'abscisse, ordonnée, etc.
2) Quand chaque vecteur peut se définir par n nombres indépendants, on dit que l'espace vectoriel est de dimension n (analogue aux "degrés de liberté" des physiciens).
3) Un individu est défini par la suite de ses coordonnées (le n valeurs qui servent à l'analyse). Mais ce n'est pas toi qui vas le placer.

Bon travail d'apprentissage de l'algèbre linéaire !

lourrran · February 2019

Est-ce que cela signifie que l'abscisse est la variable k1, l'ordonnée la variable k2, l'axe z la variable k3 puis la dimension suivante la variable k4, etc. ?

Non, pas directement.
Si parmi tes variables tu as le poids, la taille, le tour de hanches, le tour de cuisse, et par ailleurs l'âge, etc etc... Il y a une forte corrélation entre les premières variables (le poids dépend plus ou moins de la taille et du tour de hanche...)
L'axe des abscisses, ce ne sera ni la taille, ni le poids, ni aucune des N variables. Mais un truc du genre 3*taille+4*poids+2*Tour_de_Hanche. Autrement dit, une combinaison linéaires de toutes les variables.

Et idem pour chaque axe.

Donc ci on définit de nouvelles variables : k1= 3*taille+4*poids+2*Tour_de_Hanche, alors oui, le premier axe est l'axe de k1. Mais pas à partir des variables de base.

gerard0 · February 2019

Heu .. Iouran,

au départ, le tableau des données est bien un une suite de vecteurs de $\R^n$, où n est le nombre de variables. Ensuite, on va définir des axes principaux, mais on reste avec n valeurs par individu.
L'indépendance des dimensions n'a rien à voir avec une quelconque corrélation et une indépendance statistique.

Cordialement.

lourrran · February 2019

Oui, on reste dans un espace de même dimension, on est d'accord là-dessus.
J'essaie de voir quelle est la question derrière la question dans le message de AdorMaths, et effectivement, j'avais probablement sur-interprété la question de AdorMAths.

Dans une ACP, on a un nuage de points. Et effectivement, les coordonnées des points, ce sont les variables $k_i$. Peut-être que la question s'arrêtait là.
Puis notre nuage de point, on va le faire tourner, on va redisposer les axes au mieux, on va rechercher la diagonale la plus longue dans notre nuage plus ou moins rond, et on va dire que l'axe n°1 de notre nouveau repère, c'est cette diagonale la plus longue. Et ainsi de suite....

En faisant ça, on construit un nouveau repère, avec toujours nos $n$ dimensions. Et dans ce nouveau repère, les axes ne sont plus les données mesurées, mais des combinaisons linéaires de ces données.

jma · February 2019

Bonsoir,

Pour adormaths :

J'ai l'impression que les deux interventions de lourran ne répondent pas à vos questions, ne sont pas fondamentalement fausses mais pêchent par beaucoup d'omissions.

Ce que je vois de vos questions est que vous vous dirigez plutôt vers des interprétations d'ACP sinon un cours de L2 en Algèbre linéaire et l'utilisation ou la compréhension des formules de dérivations matricielles sont indispensables.

Cordialement.

TomTom77 · February 2019

Bonjour,

Quelqu'un pourrait-il m'expliquer pourquoi les deux axes ne sont pas orthogonaux sur la photo ci-dessous extraite de la page de Wikipedia ?

Je pensais que les axes principaux devaient être orthogonaux. 84620