Théorème de Glivenko Cantelli
Bonsoir à tous.
Je prépare l'agrégation, et je voulais traiter le théorème de Glivenko Cantelli en développement.
J'ai trouvé une référence ici : Preuve Glivenko, qui provient du livre de Nourdin, et qui utilise la fonction quantile pour se ramener à montrer le théorème seulement pour une suite de variables aléatoires iid de loi uniforme sur [0,1].
Seulement, il me semble qu'il y a quelque chose de pas clair lorsque l'on se ramène à ces variables uniformes, justement.
A la fin de la première page, on écrit l'égalité en loi $\underset{t \in \mathbb{R}}{\sup} | F_n (t) - F (t) | \sim \underset{t \in
\mathbb{R}}{\sup} \left| \frac{1}{n} \sum_{k = 1}^n {1}_{\{
F^{\leftarrow} (U_k) \leq t \}} - F (t) \right|$, puis on montre que la suite de droite est une suite de variables aléatoires qui converge presque sûrement vers zéro.
Cela sous entend donc, pour que la preuve soit valide, que si on a deux suites $(X_n)$ et $(Y_n)$ de variables aléatoires telles que $X_n$ a la même loi que $Y_n$ pour tout $n$ et que la suite $(Y_n)$ converge presque sûrement vers zéro, alors la suite $(X_n)$ converge aussi presque sûrement vers zéro ? Ce résultat ne me semble pas évident, est-ce que vous savez c'est vrai ?
Merci d'avance,
Mystrall
Je prépare l'agrégation, et je voulais traiter le théorème de Glivenko Cantelli en développement.
J'ai trouvé une référence ici : Preuve Glivenko, qui provient du livre de Nourdin, et qui utilise la fonction quantile pour se ramener à montrer le théorème seulement pour une suite de variables aléatoires iid de loi uniforme sur [0,1].
Seulement, il me semble qu'il y a quelque chose de pas clair lorsque l'on se ramène à ces variables uniformes, justement.
A la fin de la première page, on écrit l'égalité en loi $\underset{t \in \mathbb{R}}{\sup} | F_n (t) - F (t) | \sim \underset{t \in
\mathbb{R}}{\sup} \left| \frac{1}{n} \sum_{k = 1}^n {1}_{\{
F^{\leftarrow} (U_k) \leq t \}} - F (t) \right|$, puis on montre que la suite de droite est une suite de variables aléatoires qui converge presque sûrement vers zéro.
Cela sous entend donc, pour que la preuve soit valide, que si on a deux suites $(X_n)$ et $(Y_n)$ de variables aléatoires telles que $X_n$ a la même loi que $Y_n$ pour tout $n$ et que la suite $(Y_n)$ converge presque sûrement vers zéro, alors la suite $(X_n)$ converge aussi presque sûrement vers zéro ? Ce résultat ne me semble pas évident, est-ce que vous savez c'est vrai ?
Merci d'avance,
Mystrall
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
1) L'énoncé du théorème de Glivenko-Cantelli ne dépend que de la loi de la suite $(X_n)_{n \in \mathbb{N}}$. Ok ?
2) On peut donc choisir un espace $\Omega$ sur lequel il existe une suite iid d'uniformes $(U_n)_{n \in \mathbb{N}}$ et définir, pour tout $n$, $X_n := F^{\leftarrow}(U_n)$.
Alors, par construction $(X_n)_{n \in \mathbb{N}}$ est une suite de variables aléatoires comme dans l'énoncé, et, pour une telle suite, on a, pour tout $\omega$, pour tout $t \in \mathbb{R}$, $F_n(t)(\omega) - F(t) = \frac{1}{n}\sum^{n}_{i=1} \textbf{1}_{\{F^{\leftarrow}(U_i) \leq t\}}(\omega) - F(t) = \frac{1}{n}\sum^{n}_{i=1} \textbf{1}_{\{U_i \leq F(t)\}}(\omega) - F(t)$, et donc patati patata !
Effectivement, le fait que l'énoncé porte sur les fonctions de répartition et ne dépende donc que de la loi de la suite $(X_n)$ fait que l'argument est bien valable, je n'avais pas vu les choses comme ça.
Merci beaucoup !
Sinon, pour ce qui est de la "sous-question", il y a effectivement convergence en proba mais le fait qu'on puisse trouver des suites qui convergent en probas vers zéro et pas p.s me fait penser que c'est mal parti...
Je crois qu'il y a un contre-exemple facile à cette notion de "convergence presque-sûre en loi marginale".
Soient des $X_n$ indépendantes avec $P(X_n=1) = p_n = 1-q_n = P(X_n = 0)$.
Alors la probabilité que $(X_n)$ ne converge pas vers 0 est la probabilité d'avoir une infinité de succès.
Ça s'écrit : $$1 - P((X_n)\to 0) = P((X_n)\not\to 0) = \lim_{N\to\infty} \underbrace{\prod_{n=N}^\infty q_n}_{a_N}.$$ Pour avoir $a_N = \frac{N-1}{2N} = \frac{1}{2} - \frac{1}{2N}\to \frac{1}{2}$, il suffit de choisir $$q_n = \frac{a_n}{a_{n+1}} = \frac{\frac{n-1}{2n}}{\frac{n}{2(n+1)}} = \frac{n^2-1}{n^2},\qquad \text{donc} \qquad p_n = \frac{1}{n^2}.
$$ Dans ce cas, $(X_n)$ n'a qu'une chance sur deux de converger vers 0.
Maintenant, si je prends $U$ uniforme sur $[0;1]$, les variables $Y_n = 1_{[U \le p_n]}$ sont de même loi que $X_n$, mais elles sont décroissantes, donc elles convergent presque-sûrement vers 0.