Multicolinéarité

Bonjour,

Je n'arrive pas à comprendre cela : "La multicolinéarité n'a aucune incidence sur l'adéquation de l'ajustement, ni sur la qualité de la prévision. Les coefficients (fonction discriminante linéaire) ne peuvent pas être interprétés de façon fiable, mais ceci n'a pas d'incidence sur les valeurs ajustées (classées)."

C'est un phénomène où les estimateurs sont instables donc ils donnent des résultats faussées. Comment ca n'a aucune incidence sur la droite ? et elle est tracé d'après ces estimations !

Merci de m'éclaircir ce point

Réponses

  • Bonjour,

    Si je suis bien le propos: en présence de variables explicatives $X$ extrêmement corrélées, tu as une incertitude importante sur les coefficients de régression $w$ associés à ces facteurs (le conditionnement est très mauvais). Pour autant, tu n'as pas nécessairement une incertitude importante sur la prédiction $y^\ast=f(X^\ast,w)$ elle-même.

    Exemple: $X=(x_1,x_2)$ avec un unique facteur explicatif répété deux fois: $x_1=x_2$, et une fonction de régression $y=x_1w_1+x_2w_2$. Tu as une infinité de combinaisons $w_1,w_2$ de somme $w_1+w_2$ égales, qui mènent à des prédicteurs identiques. Donc tu ne peux pas déterminer uniquement les coefficients $w_1, w_2$. Cependant la capacité à prédire ne s'en trouve pas directement affectée puisque toutes ces fonctions de régression mènent au même résultat $y=x_1(w_1+w_2)=x_2(w_1+w_2)$.

    Dans la vraie vie c'est plus compliqué parce qu'il est possible que cette corrélation entre $x_1$ et $x_2$ ne soit valide que sur un domaine limité, auquel cas tu peux faire de graves erreurs d'extrapolation si tu ignores l'incertitude sur les coefficients $w_1,w_2$ au profit d'une solution arbitrairement choisie.

    [Correction:] Tu parles de classification plutôt que de régression, le propos s'applique de même à cette situation.
  • Bonjour,

    En fait tu ne précises pas quel modèle ou quelle classe de modèles dont tu parles et d'où vient cette affirmation. Pour le modèle de régression linéaire multiple, c''est faux mais si c'est une autre méthode, elle peut être vraie.

    Bonne continuation.
Connectez-vous ou Inscrivez-vous pour répondre.