Sur la normalité en régression
dans Statistiques
Bonjour,
Je me pose une question à l'apparence très simple.
Je considère le modèle de régression linéaire gaussien standard:
$$Y = X \beta + \varepsilon$$
où $\varepsilon$ est un vecteur gaussien centré de matrice de variance covariance $\sigma^2 I$.
Supposons que j'ai envie de tester l'hypothèse de normalité de la loi des erreurs.
Comment puis-je faire rigoureusement ?
Je lis à de nombreux endroit qu'une méthode graphique pour vérifier que la loi des erreurs est à peu près normale est de faire un QQ plot sur les résidus.
Or, ces résidus, bien que gaussiens, ne sont ni indépendants, ni de même variance.
Quelle est donc la justification de cette méthode !? J'ai bien du mal à voir dans ces conditions pourquoi ce QQ plot permet une telle vérification.
Merci d'avance,
Je me pose une question à l'apparence très simple.
Je considère le modèle de régression linéaire gaussien standard:
$$Y = X \beta + \varepsilon$$
où $\varepsilon$ est un vecteur gaussien centré de matrice de variance covariance $\sigma^2 I$.
Supposons que j'ai envie de tester l'hypothèse de normalité de la loi des erreurs.
Comment puis-je faire rigoureusement ?
Je lis à de nombreux endroit qu'une méthode graphique pour vérifier que la loi des erreurs est à peu près normale est de faire un QQ plot sur les résidus.
Or, ces résidus, bien que gaussiens, ne sont ni indépendants, ni de même variance.
Quelle est donc la justification de cette méthode !? J'ai bien du mal à voir dans ces conditions pourquoi ce QQ plot permet une telle vérification.
Merci d'avance,
Réponses
-
Il faut voir les résidus comme une "estimation" des $\epsilon$, vu comme ça l'échantillon des résidus suit approximativement une loi gaussienne.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 7 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 52 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres