ACP Preuve formelle
dans Statistiques
Bonsoir,
Je fatigue de ne trouver aucune vrai preuve mathématique sur l'ACP pour démontrer que les k première directions principales sont donnée par les k premier vecteur propre issues de la décomposition de la matrice de variance. Je cherche une preuve qui utilise la SVD et un papier sérieux pas juste un papier qui prouve que le premier axe principal est donné par le premier vecteur propre (facile en usant de l'annulation du Lagragien) et laisse au soin du lecteur de déterminer la preuve pour les autres.
Ce n'est pas un problème facile et je ne trouve rien de sérieux à ce sujet...
Je fatigue de ne trouver aucune vrai preuve mathématique sur l'ACP pour démontrer que les k première directions principales sont donnée par les k premier vecteur propre issues de la décomposition de la matrice de variance. Je cherche une preuve qui utilise la SVD et un papier sérieux pas juste un papier qui prouve que le premier axe principal est donné par le premier vecteur propre (facile en usant de l'annulation du Lagragien) et laisse au soin du lecteur de déterminer la preuve pour les autres.
Ce n'est pas un problème facile et je ne trouve rien de sérieux à ce sujet...
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Vous pouvez regarder le livre :
G. Saporta, "Probabilités, Analyse des Données et Statistique", 3ième édition révisée, Technip, 2011.
Je pense que vous trouverez une réponse aux pages 164-165-166 sinon nous verrons bien.
Cordialement.
Cordialement.
[Gilbert Saporta prend toujours une majuscule. AD]
> Le livre de Saporta c'est celui écrit sous word...>
Tu connais beaucoup d'éditeurs qui écrivent sous Word ?
Bien dommage, tout y est expliqué avec la démonstration (celle du théorème de décomposition singulières que l'on ne nomme pas ou peu en ACP.)
Je croyais que les éditeurs étaient des moines copistes spécialistes d'enluminures, m'a-t-on menti ? L'ouvrage ci-dessus cité me semble quand même avoir relativement fière allure. Bon d'accord, un petit d'amusement...(sourire.)
Bien à vous.
Bonne journée.
.
Vous pouvez trouver dans les cours sur l'analyse canonique dont l'ACP est un cas particulier et, de bien d'autres méthodes.
La matrice des poids M, que l'on considère comme la matrice des poids des caractères dans l'espace des variables semble naturelle car on s'intéresse aux angles. Or, le produit scalaire de deux caractères centrés est égal à leur covariance et, la norme suivant M d'un caractère est égale à son écart-type. Il est alors possible d'en déterminer le cosinus entre les deux variables grâce au rapport des quantités.
D est toute matrice symétrique positive bien que l'on choisisse dans la majorité des cas la matrice diagonale dont la diagonale est l'inverse des différentes variances (cf. autre fil avec P. sur les unités en ACP.)
Démontrer que c'est D la matrice des inverses des variances qu'il faut utiliser n'a pas de sens : il s'agit d'un choix, bien que raisonné, de D qui permet au statisticien des interprétations.
Cordialement.
Mea culpa: C'est le livre de Tufféry qui est écrit sous word ^^. Allez jeter un oeil c'est assez comique... (pourtant édition technip)
Ce livre n'est destiné à être exposé au MoMA. On a les amusements qu'on a ! Maintenant sur le fond,, qu'y a-t-il ? Tufféry a fait un panorama sur la fouille de donnée et l'analyse prédictive avec ses trois volumes et, les rééditions semblent montrer qu'ils suscitent un certain intérêt. Fin sur les pleins et les déliés...
Toutes vos questions de fond dont vous nous avez fait part ce trouve dans un certain "Que sais-je ?" Devinez l'auteur et la belle casse que voilà !
Il est assez surprenant de mettre un lien vers un article en anglais qui est censé expliquer ce qu'est l'Analyse de Données dite "à la française" : un petit soupir quand même...
A bientôt.
Poir l' article mis en ligne, effectivement t c' est assez désespérant mais les sources/references qui sont citées dans l' article ne sont pas disponibles en accès public (1 et 9 dans l article). Alors on fait ce qu' on peut... c' rst d' ailleurs très dommage car une presentation generale de l' ACP via un triplet ouvrent à des methodes tels statis etc...
En tout cas je vous remercie pour la référence Saporta qui fait tout de même un très beau travail sur l' ACP même si l' on ne trouve pas la preuve que les k premiers axes propres sont en fait les vecteurs propres d' une certaine matrice M-symetrique (preive qui pourrait être faite par svd généralisé, après avoir réécrit le problème).
Je me suis trompé : je voulais dire que "matrice symétrique définie positive" soit M. Le deux livres que j'ai cités font les démonstrations pour n'importe quelle M métrique en utilisant le fait que M=tTT avec une infinité de T et en utilisant la métrique I puis le théorème de décomposition en valeurs singulières (la SVD) est appliquée.
Pour quelque chose de vraiment général, vous pouvez regarder le chapitre 1 "Analyses en axes principaux : principes de base" dans l'ouvrage :
L. Lebart, M. Piron, A. Morineau, "Statistique exploratoire multidimensionnelle", 4ième édition, Dunod, 2006.
Bon courage..
Cordialement.