modèle linéaire généralisé
dans Statistiques
Bonjour, je ne comprends pas bien comment ils ont été introduits ? Quel est l'intuition derrière? Notre enseignante nous a dit que le souhait originel était de réaliser une analogie avec le modèle linéaire gaussien où l'esperance de $Y|X$ est linéaire en X : $E[Y|X]=X\beta$.
On considère donc les modèles de la famille exponentielle et l'on va chercher une analogie avec le modèle linéaire gaussien.
Ainsi si l'on dispose d'un problème où Y ne prends que deux valeurs (0 et 1) ça ne fait plus aucun sens de trouver une modélisation par une droite car les valeurs ne vaudront pas 0 où 1 et en plus on sortira de l'intervalle (0,1). Mais alors qu'est ce qui nous guide vers la fonction sigmoide bien connue ?
Il semble qu'à l'instar du MLG on souhaite écrire $E[Y|X]=g(X\beta)$ avec $g$ une fonction de lien. Mais coment choisir $g$ et pourquoi se focaliser sur $E[Y|X]$ ?
On considère donc les modèles de la famille exponentielle et l'on va chercher une analogie avec le modèle linéaire gaussien.
Ainsi si l'on dispose d'un problème où Y ne prends que deux valeurs (0 et 1) ça ne fait plus aucun sens de trouver une modélisation par une droite car les valeurs ne vaudront pas 0 où 1 et en plus on sortira de l'intervalle (0,1). Mais alors qu'est ce qui nous guide vers la fonction sigmoide bien connue ?
Il semble qu'à l'instar du MLG on souhaite écrire $E[Y|X]=g(X\beta)$ avec $g$ une fonction de lien. Mais coment choisir $g$ et pourquoi se focaliser sur $E[Y|X]$ ?
Réponses
-
Up! (je l'enlève car il paraît que ça énerve...)
PS: j'ai tout de même quelques éléments de réponses ici: https://stats.stackexchange.com/questions/20523/difference-between-logit-and-probit-models#30909 mais si quelqu'un y connait quelque chose je suis curieux d'avoir ses explications (sans pression^^) -
Voici une explication trouvé dans les cours du MIT https://ocw.mit.edu/courses/mathematics/18-650-statistics-for-applications-fall-2016/lecture-slides/MIT18_650F16_GLM.pdf .
Comme :
- $\mu(X)=b’(\theta(X)) $ (propriété pour les familles exponentielles ‘canoniques’)
- $g\circ \mu(X)=X^T \beta$ (modélisation que l’on impose pour établir une relation entre l’aléatoire et les covariables (sous forme de linéarité via la fonction de lien $g$).
on a donc $\theta=b’^{-1}\circ \mu$ et $g\circ \mu(X)=X^T\beta$ ; soit $\theta(X)= b’^{-1}\circ g^{-1}( X^T\beta)$ . Pour obtenir un résultat simple dans la maximisation de la log vraisemblance on a tout intérêt à imposer $g$ de manière à avoir $b’^{-1}\circ g^{-1}=Id$ dans ce cas on pose $g=b’^{-1}$ il s’agit du lien canonique !
Après pour expliquer la modélisation que l’on impose pour établir une relation entre l’aléatoire et les covariables cela relève sans doute de l'empirique...
[Activation des liens. AD]
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 8 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres