PLS (SAS) nombre facteur à retenir ?

Bonjour à tous,

J'effectue une PLS sous SAS et je ne sais pas quel nombre de facteur je dois garder pour l'analyse (modèle macroéconomique quantitatif à 1 Y, 38 variables et 28 individus).
Pour la sélection des facteurs, ma "sélection manuelle, visuelle" me fait garder 3 facteurs. En revanche, la validation croisée (avec plusieurs options de CV, dont PRESS) ne m'en fait garder qu'un.


* avec 3 facteurs : expliquent 45.44 % de la Variabilité des X et 83.31 % de la variabilité des Y.

* avec 1 facteur : explique 40 % de la Variabilité des X et 70 % de la variabilité des Y.

Pour avoir une étude la plus fidèle possible à mon modèle et aux données, dois-je me fier à la validation croisée et n'en garder qu'un ?
Sachant que si un facteur est gardé, il n’existe pas des coordonnées sur l'axe factoriel > à 0.4 (val absolue) ; dans ce cas je choisis de définir l'axe par les coordonnées > 0.25.

Merci encore pour votre aide,
Respectueusement,
DANO Jérôme.

Réponses

  • Bonjour,

    Les données fournies plaident pour un seul facteur. S’emmerder avec deux autres pour 5% sur X et 10% sur Y n’est pas utile.
    Si tu as 70% sur Y, c’est déjà très bien.
    Le meilleur modèle, de loin, est un seul paramètre.

    Je ne connais pas les méthodes que tu décris pour justifier un seul paramètre, mais même sans ses méthodes, c’est la seule solution raisonnable.
  • Bonjour Yves,

    Merci pour ta réponse, c'est bien ce que je me disais. La PLS sert a faire une régression linéaire multiple mais par composantes principales, particulièrement adapté quand il y a multilinéarité et lorsque les variables dépassent le nombre d'observations. Il est aussi possible de définir plusieurs Y, mais ce n'est pas mon cas.
  • L’ajustement du modèle est effectué un groupe d’apprentissage en comparant les résultats aux observations du groupe test. L’efficacité prédictive
    est évaluée à l’aide de l’indicateur de la somme des carrés des erreurs de prédiction. La méthode utilisée consiste à exclure x observation toutes les n observations, avec : chaque observation constitue un échantillon test. Vu que la valeur absolue minimale du PRESS est atteinte pour 1 composante (sur 15 proposées), alors elle est gardée.
Connectez-vous ou Inscrivez-vous pour répondre.