ACP Preuve formelle

Bonsoir,

Je fatigue de ne trouver aucune vrai preuve mathématique sur l'ACP pour démontrer que les k première directions principales sont donnée par les k premier vecteur propre issues de la décomposition de la matrice de variance. Je cherche une preuve qui utilise la SVD et un papier sérieux pas juste un papier qui prouve que le premier axe principal est donné par le premier vecteur propre (facile en usant de l'annulation du Lagragien) et laisse au soin du lecteur de déterminer la preuve pour les autres.

Ce n'est pas un problème facile et je ne trouve rien de sérieux à ce sujet...

Réponses

  • Bonjour,

    Vous pouvez regarder le livre :

    G. Saporta, "Probabilités, Analyse des Données et Statistique", 3ième édition révisée, Technip, 2011.

    Je pense que vous trouverez une réponse aux pages 164-165-166 sinon nous verrons bien.

    Cordialement.
  • Il peut être possible que vous soyez désappointé car la littérature concernant l'ACP se focalise sur la diagonalisation de la matrice de variance qui est donc carrée. Or, le théorème de décomposition en valeurs singulières est bien plus général et, la diagonalisation de la matrice de variance un cas particulier.

    Cordialement.
  • Le livre de [large]S[/large]aporta c'est celui écrit sous word... non ? Rien que cela ça me rebute ...

    [Gilbert Saporta prend toujours une majuscule. AD]
  • Tu peux aller su le site de Gerard Letac, 'documents de maitrise', 'Moins de coordonnees pour les moindres carres.
  • student2 écrivait:
    > Le livre de Saporta c'est celui écrit sous word...>

    Tu connais beaucoup d'éditeurs qui écrivent sous Word ?
  • Bonsoir,

    Bien dommage, tout y est expliqué avec la démonstration (celle du théorème de décomposition singulières que l'on ne nomme pas ou peu en ACP.)

    Je croyais que les éditeurs étaient des moines copistes spécialistes d'enluminures, m'a-t-on menti ? L'ouvrage ci-dessus cité me semble quand même avoir relativement fière allure. Bon d'accord, un petit d'amusement...(sourire.)

    Bien à vous.
  • On trouve encore quelques livres écrit avec word. Je pense à "Escapades arithmétiques" de Frédéric Laroche sorti en 2010 (quand même) chez Ellipses Marketing.
  • Alors là, je n'ai qu'une onomatopée qui me vient : Knuth, Knuth, Knuth....et Knuth.

    Bonne journée.

    .
  • En fait je recherche une preuve très générale dr l acp où l' on considère un triplet (X,M,D) avec M une matrice de poids (metrique) sur les individus et D sur les variables. Je n' ai trouvé qu' in seul arricle qui en parle sur le site de P.Besses mais il manque les preuves ^^...
  • Bonjour,

    Vous pouvez trouver dans les cours sur l'analyse canonique dont l'ACP est un cas particulier et, de bien d'autres méthodes.

    La matrice des poids M, que l'on considère comme la matrice des poids des caractères dans l'espace des variables semble naturelle car on s'intéresse aux angles. Or, le produit scalaire de deux caractères centrés est égal à leur covariance et, la norme suivant M d'un caractère est égale à son écart-type. Il est alors possible d'en déterminer le cosinus entre les deux variables grâce au rapport des quantités.


    D est toute matrice symétrique positive bien que l'on choisisse dans la majorité des cas la matrice diagonale dont la diagonale est l'inverse des différentes variances (cf. autre fil avec P. sur les unités en ACP.)



    Démontrer que c'est D la matrice des inverses des variances qu'il faut utiliser n'a pas de sens : il s'agit d'un choix, bien que raisonné, de D qui permet au statisticien des interprétations.

    Cordialement.
  • Voici un doc que j'ai pu trouvé, à méditer: https://arxiv.org/pdf/0805.2879.pdf

    Mea culpa: C'est le livre de Tufféry qui est écrit sous word ^^. Allez jeter un oeil c'est assez comique... (pourtant édition technip)
  • Bonsoir,


    Ce livre n'est destiné à être exposé au MoMA. On a les amusements qu'on a ! Maintenant sur le fond,, qu'y a-t-il ? Tufféry a fait un panorama sur la fouille de donnée et l'analyse prédictive avec ses trois volumes et, les rééditions semblent montrer qu'ils suscitent un certain intérêt. Fin sur les pleins et les déliés...

    Toutes vos questions de fond dont vous nous avez fait part ce trouve dans un certain "Que sais-je ?" Devinez l'auteur et la belle casse que voilà !

    Il est assez surprenant de mettre un lien vers un article en anglais qui est censé expliquer ce qu'est l'Analyse de Données dite "à la française" : un petit soupir quand même...

    A bientôt.
  • Attention à ne pas faire d' amalgames, j' aime beaucoup le livre de Tuffery dans le contenu mais suis très étonné que les éditeurs n' aient fait aucuns efforts de présentation.

    Poir l' article mis en ligne, effectivement t c' est assez désespérant mais les sources/references qui sont citées dans l' article ne sont pas disponibles en accès public (1 et 9 dans l article). Alors on fait ce qu' on peut... c' rst d' ailleurs très dommage car une presentation generale de l' ACP via un triplet ouvrent à des methodes tels statis etc...

    En tout cas je vous remercie pour la référence Saporta qui fait tout de même un très beau travail sur l' ACP même si l' on ne trouve pas la preuve que les k premiers axes propres sont en fait les vecteurs propres d' une certaine matrice M-symetrique (preive qui pourrait être faite par svd généralisé, après avoir réécrit le problème).
  • Bonjour,

    Je me suis trompé : je voulais dire que "matrice symétrique définie positive" soit M. Le deux livres que j'ai cités font les démonstrations pour n'importe quelle M métrique en utilisant le fait que M=tTT avec une infinité de T et en utilisant la métrique I puis le théorème de décomposition en valeurs singulières (la SVD) est appliquée.

    Pour quelque chose de vraiment général, vous pouvez regarder le chapitre 1 "Analyses en axes principaux : principes de base" dans l'ouvrage :

    L. Lebart, M. Piron, A. Morineau, "Statistique exploratoire multidimensionnelle", 4ième édition, Dunod, 2006.

    Bon courage..
  • Finalement, nous [avons] réussi à nous comprendre.

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.