Si
sont des variables aléatoires indépendantes et de même
loi, de moyenne et telles qu'il existe avec
et si on note
le théorême suivant calcule pour le nombre
Théorème Soit une mesure positive sur
non concentrée en un point et telle que
l'intervalle des réels satisfaisant
ait un intérieur non vide. On considère la fonction strictement
convexe sur égale à et l'intervalle ouvert
et on note par
la fonction réciproque de
Soit
fixé dans . Soient
des variables aléatoires
indépendantes et de même loi
Soit enfin avec et les nombres
Dans ces conditions on a
(Inégalité des grandes déviations)
(Théorème des grandes déviations)
Commentaires: 1) Une insupportable confusion règne
dans la littérature d'enseignement concernant
ce résultat, dû à Cramer (1938),
principalement à cause de ses généralisations
à des hypothèses plus faibles (et peu intéressantes) dans
ainsi qu'à
où les résultats n'ont pas l'harmonie du résultat ci dessus.
2) Dans sa présentation, le théorème fait jouer un
rôle symétrique à toute la famille de lois de probabilités
quand varie dans
Cette famille est appelée une famille exponentielle naturelle
engendrée par Attention, n'est pas unique:
engendre la même famille exponentielle, c'est à dire le même
ensemble de probabilités, indépendamment du paramétrage,
si et seulement si il existe et réels tels que
.
Il est clair que la
loi d'une variable aléatoire réelle
telle qu'il existe avec
appartient à une famille
exponentielle naturelle: il suffit de prendre pour la loi de
Toutefois, pour la loi de donnée, souvent avec un paramètre,
il n'est pas toujours apparent de relier cette loi avec la
famille exponentielle à laquelle elle appartient. Par exemple la loi de Bernoulli
appartient à la
famille exponentielle engendrée par
prendre
3) Implicitement, l'énoncé utilise des résultats simples
comme le fait que
soit un intervalle et
comme la convexité de , qui se démontrent comme le 1) et le 6) du
théorème 6.7 du cours de Deug. De plus, il est facile de voir que avec les notations du théorème,
l'espérance des est
et leur variance est
4) La partie 2) du théorème est plus difficile. La partie 1) est comme on va le voir
amusante et élémentaire. Elle fournit une
démonstration de poche de la loi forte des grands nombres qui affirme que
si
sont des variables aléatoires indépendantes et de même
loi de moyenne , alors
Si on fait l'hypothèse suplémentaire de l'existence de moments exponentiels,
c'est à dire qu'il existe avec
alors l'inégalité
des grandes déviations et le critère de Cauchy,
du fait que , entraine
que la série converge, et on procède alors comme au
Théorème 6.6 du cours pour conclure avec le lemme de Borel.
5) Travaux pratiques: Voici quelques mesures classiques,
et les lois et les fonctions
qui vont avec.
Loi de Bernoulli: et
Loi de Poisson: et
Loi gamma: Soit fixé.
si
et
Loi normale: Soit fixé.
et
Démonstration de l'inégalité des grandes déviations : Notons
Pour tout
tel que
l'astuce est d'observer que les deux évènements
et
sont les mêmes (comme à la Prop. 6.6).
On écrit, à l'aide
de l'inégalité de Markov (voir cours de Deug, Prop. 6.2)
appliquée à
et à :
Donc
Observons ensuite que
est convexe
sur l'intervalle
ouvert
et que sa dérivée s'y annule au
point
c'est à dire tel que
La valeur de
en ce point est exactement
et le résultat est montré.
Démonstration du théorème des grandes déviations : On pose désormais
Avec cette notation,
on remarque que
L'astuce de Harald Cramer ici est d'introduire les
variables aléatoires
indépendantes et de même loi
Si on a lu le commentaire 2,
on remarque que cette loi
appartient à la même famille exponentielle naturelle que
la loi des L'espérance de est
On pose
ensuite
et
L'espérance de est zéro.
On montre alors l'identité remarquable
Pour le voir, on introduit la mesure positive sur
égale à la ième puissance de convolution c'est à dire
de transformée de Laplace La loi de est donc
comme on le vérifie en calculant
la transformée de Laplace de cette loi et en voyant qu'elle est égale à celle de soit
pour tout
De même, la loi de est
Par conséquent
et l'identité annoncée
est montrée. On peut remarquer qu'elle
nous donne au passage une seconde démonstration, moins élémentaire,
de la partie 1, puisque trivialement
Cette partie
algébrique étant faite, pour voir que la limite de
est
il suffit
de montrer que
C'est la partie plus difficile.
Commencons par un lemme classique:
Lemme Si est une variable
aléatoire positive alors l'ensemble des
tels que
est un intervalle et
est croissante sur
Démonstration du lemme: On pourrait utiliser une inégalité
classique de Hölder. Utilisons plutôt ici l'outil familier de la convexité
du logarithme de la transformée de Laplace. Soit
la loi de avec
probabilité sur
et
(tout est trivial si Soit
l'image de par
Soit
la transformée de Laplace de , soit son domaine de finitude
et soit
Sur on a
Enfin si sont dans
comme est convexe
on a
Comme (car est une probabilité) on obtient que
Comme
le lemme est montré.
Achevons alors la démonstration du théorème. On pose
On a alors
Dans cette chaîne d'inégalités,
(1) vient du lemme appliqué à
et au couple
et
, (2) est l'inégalité de Markov appliquée à
et et (3) vient du fait que
si et sont deux évènements alors
et donc
Faisons alors tendre vers l'infini.
D'après le théorème central limite, la loi de
tend vers une loi normale centrée. On en déduit que
tend vers et, puisque est aussi
on en déduit que tend vers Par conséquent,
la limite inférieure de
est Mais
entraine naturellement que
Comme
la limite de
est bien 0 et le théorème des grandes déviations est démontré.
monter:Appendice 1: Grandes déviations précédent:Appendice 1: Grandes déviations
G_Letac