modèle linéaire généralisé

Bonjour, je ne comprends pas bien comment ils ont été introduits ? Quel est l'intuition derrière? Notre enseignante nous a dit que le souhait originel était de réaliser une analogie avec le modèle linéaire gaussien où l'esperance de $Y|X$ est linéaire en X : $E[Y|X]=X\beta$.
On considère donc les modèles de la famille exponentielle et l'on va chercher une analogie avec le modèle linéaire gaussien.
Ainsi si l'on dispose d'un problème où Y ne prends que deux valeurs (0 et 1) ça ne fait plus aucun sens de trouver une modélisation par une droite car les valeurs ne vaudront pas 0 où 1 et en plus on sortira de l'intervalle (0,1). Mais alors qu'est ce qui nous guide vers la fonction sigmoide bien connue ?
Il semble qu'à l'instar du MLG on souhaite écrire $E[Y|X]=g(X\beta)$ avec $g$ une fonction de lien. Mais coment choisir $g$ et pourquoi se focaliser sur $E[Y|X]$ ?

Réponses

  • Up! (je l'enlève car il paraît que ça énerve...)


    PS: j'ai tout de même quelques éléments de réponses ici: https://stats.stackexchange.com/questions/20523/difference-between-logit-and-probit-models#30909 mais si quelqu'un y connait quelque chose je suis curieux d'avoir ses explications (sans pression^^)
  • Voici une explication trouvé dans les cours du MIT https://ocw.mit.edu/courses/mathematics/18-650-statistics-for-applications-fall-2016/lecture-slides/MIT18_650F16_GLM.pdf .
    Comme :
    - $\mu(X)=b’(\theta(X)) $ (propriété pour les familles exponentielles ‘canoniques’)
    - $g\circ \mu(X)=X^T \beta$ (modélisation que l’on impose pour établir une relation entre l’aléatoire et les covariables (sous forme de linéarité via la fonction de lien $g$).

    on a donc $\theta=b’^{-1}\circ \mu$ et $g\circ \mu(X)=X^T\beta$ ; soit $\theta(X)= b’^{-1}\circ g^{-1}( X^T\beta)$ . Pour obtenir un résultat simple dans la maximisation de la log vraisemblance on a tout intérêt à imposer $g$ de manière à avoir $b’^{-1}\circ g^{-1}=Id$ dans ce cas on pose $g=b’^{-1}$ il s’agit du lien canonique !

    Après pour expliquer la modélisation que l’on impose pour établir une relation entre l’aléatoire et les covariables cela relève sans doute de l'empirique...

    [Activation des liens. AD]
Connectez-vous ou Inscrivez-vous pour répondre.