Test d'adéquation
dans Statistiques
Bonjour à tous.
Je me suis penché sur l'étude d'un test d'adéquation pour les lois de probabilités continues. J'aimerais savoir si vous avez déjà vu ce test (je n'ai qu'une culture très limitée dans ce domaine).
Nous avons à disposition une série statistique ordonnée (croissante) $x_1, \ldots,x_n$ de $n$ réels que l'on veut comparer à une loi de probabilité de fonction de répartition $F$.
Mon hypothèse est donc que les $x_i$ sont distribués selon $F$, et donc que les réels $y_k = F(x_k)$ suivent la loi uniforme sur l'intervalle $[0,1]$. Le test revient alors à la question d'adéquation des $y_1,\ldots,y_n$ (série croissante) avec cette loi uniforme de référence.
Je considère la statistique d'ordre : si des variables $Y_1,\ldots,Y_n$ suivent la loi uniforme sur $[0,1]$, alors la $k$-ième statistique d'ordre suit une loi d'espérance $e_k = k/(n+1)$ et de variance $v_k = \frac{ k.(n-k+1) }{(n+1)^2.(n+2)}$ (je passe les calculs).
Je finalise les calculs avec la moyenne $\displaystyle m = \frac{1}{n} \sum_{k=1}^n (y_k - e_k)^2 / v_k$.
Enfin, la valeur $m$ est utilisée avec l'abaque suivante qui indique la région d'acceptation $[0,\ldots]$ en abscisse en fonction du niveau de risque en ordonnée.
Exemple : si les $x_k$ sont $5.4, 9.5, 24.3, 35.7, 57, 67.3, 91.6, 118.4, 170.9, 251.3$
et que l'on veut tester l'adéquation avec la loi normale $N(e=83, s²=6156)$
alors on obtient les $y_k$ suivants (au arrondis près) : $0.16, 0.17, 0.23, 0.27, 0.37, 0.42, 0.54, 0.67, 0.87, 0.98$
et enfin la quantité $m = 0.4$
Si notre niveau de risque est de 20%, alors la région d'acceptation est l'intervalle [0, 1.4] (cf le graphique). Comme 0.4 appartient à [0, 1.4], on accepte donc l'hypothèse d'adéquation (largement !)
Je me suis penché sur l'étude d'un test d'adéquation pour les lois de probabilités continues. J'aimerais savoir si vous avez déjà vu ce test (je n'ai qu'une culture très limitée dans ce domaine).
Nous avons à disposition une série statistique ordonnée (croissante) $x_1, \ldots,x_n$ de $n$ réels que l'on veut comparer à une loi de probabilité de fonction de répartition $F$.
Mon hypothèse est donc que les $x_i$ sont distribués selon $F$, et donc que les réels $y_k = F(x_k)$ suivent la loi uniforme sur l'intervalle $[0,1]$. Le test revient alors à la question d'adéquation des $y_1,\ldots,y_n$ (série croissante) avec cette loi uniforme de référence.
Je considère la statistique d'ordre : si des variables $Y_1,\ldots,Y_n$ suivent la loi uniforme sur $[0,1]$, alors la $k$-ième statistique d'ordre suit une loi d'espérance $e_k = k/(n+1)$ et de variance $v_k = \frac{ k.(n-k+1) }{(n+1)^2.(n+2)}$ (je passe les calculs).
Je finalise les calculs avec la moyenne $\displaystyle m = \frac{1}{n} \sum_{k=1}^n (y_k - e_k)^2 / v_k$.
Enfin, la valeur $m$ est utilisée avec l'abaque suivante qui indique la région d'acceptation $[0,\ldots]$ en abscisse en fonction du niveau de risque en ordonnée.
Exemple : si les $x_k$ sont $5.4, 9.5, 24.3, 35.7, 57, 67.3, 91.6, 118.4, 170.9, 251.3$
et que l'on veut tester l'adéquation avec la loi normale $N(e=83, s²=6156)$
alors on obtient les $y_k$ suivants (au arrondis près) : $0.16, 0.17, 0.23, 0.27, 0.37, 0.42, 0.54, 0.67, 0.87, 0.98$
et enfin la quantité $m = 0.4$
Si notre niveau de risque est de 20%, alors la région d'acceptation est l'intervalle [0, 1.4] (cf le graphique). Comme 0.4 appartient à [0, 1.4], on accepte donc l'hypothèse d'adéquation (largement !)
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
C'est pourtant un test d'adéquation bien plus puissant que celui de Kolmogorov-Smirnov.
Je trouve la méthode proposée très intéressante, mais comment l'équation de la courbe proposée a été déterminée ?
Merci d'avance pour votre réponse !
Pour l'instant, la courbe est construite sur une série statistique (de 10 000 individus), de manière empirique, car je n'ai pas cherché (et encore moins trouvé ...) l'équation de cette courbe qui représente << 1 - la p-value >> du test d'adéquation.
Et avant de me pencher sur la chose, je me demandais si ce test d'adéquation élémentaire et assez efficace, existait déjà ... (et c'est pour cela que j'ai posté la question)