Alternative à l'ACP

Bonjour,

Une approche classique pour réduire le nombre de variables à considérer dans un modèle linéaire en analyse statistique de données est l'analyse en composantes principales, qui donne un nombre réduit de variables non corrélées.

Savez-vous s'il existe une alternative moins brutale (au lieu de passer de 40 variables à 10 variables non corrélées, en avoir par exemple une vingtaine avec des corrélations possibles) ?

Merci d'avance.

Galtya

Réponses

  • Bonsoir,
    Je ne comprends pas trop dans quel but ? En général, il y a toujours un chercheur qui a travaillé sur ce type de problèmes. Je vais regarder si je ne trouve pas quelque chose : je pense déjà sans réfléchir à l'analyse canonique et, dans un contexte de régression, la régression "ridge" et "lasso".
    A suivre.
    Cordialement.
  • Merci pour votre réponse

    Le but étant de réduire les temps de calcul avec une quarantaine de variables observées c'est quasi infaisable mais on perd de l'information sur nos données si on utilise que des variables non corrélées et en si "petit" nombre. On aimerait une solution qui coupe la poire en deux, réduire le nombre de variables en autorisant le fait qu'elles soient corrélées. Ensuite, on régresse pour estimer des paramètres.

    Cordialement
  • Dans mes lointains souvenirs, l'ACP permet de passer de 40 variables à 40 autres variables (donc aucune perte d'information). Nos 40 nouvelles variables sont ordonnées, de la plus pertinente à la moins pertinente. Et on est libre de retenir les 10 premières, ou les 20 premières ou toutes les variables.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Bonsoir,
    Je crois comprendre dans ton message que le contexte est la régression. L'ACP est aussi utilisée pour réduire l'effet de la corrélation des variables explicatives (*) qui est source d'une trop grande variabilité des coefficients du modèle et, donc, d'un manque de précision de ce dernier.
    As-tu essayé les bons vieux algorithmes de sélection du meilleur sous-ensemble de variables de type "backward" ou "forward" ?
    A suivre.
    Cordialement.

    p.s. quelle puissance de calcul avez-vous ?

    (*) Ajout :..des variables explicatives entre elles...
Connectez-vous ou Inscrivez-vous pour répondre.