Cette partie ne se veut qu'une très brève introduction aux statistiques. Il est bien évident
que dans le cadre de l'option probabilités de l'agrégation, il est indispensable de se référer à
un livre plus complet. Les livres bien faits d'introduction abondent FLEMMARD.
Nous nous contenterons ici de donner un cas d'applications, et de citer d'autres cadres d'applications.
Soit , ... , indépendantes identiquement distribués. On suppose le théorème central limite
vérifié. Intuitivement, les sont des mesures; par exemple, on mesure la taille de 50 français pour évaluer
la taille moyenne des français. L'intérêt des probabilités va être de fournir des bornes sur l'erreur commise
par une telle évaluation.
On se donne donc
. On cherche tel que
soit compris dans . Il faut alors noter que bien entendu, on ne peut être certain que
soit dans l'intervalle , quel que soit l'intervalle que l'on donne, simplement au vu
des . Il est toujours possible que l'on ait été particulièrement malchanceux dans les tirages des
et que la moyenne soit très différente de ce que l'on suppose au vu du tirage. On doit donc
plutôt donner un réel (petit de préférence) et tel que avec probabilité , pour toute
loi de ,
soit vrai. et seront alors et respectivement.
Concrètement on procède comme suit:
On évalue (empiriquement) l'écart type de .
On repère tel que
, avec loi normale centrée réduite (espérance nulle et écart-type ). Les valeurs de sont tabulées (il s'agit simplement
de la fonction de répartition de la loi normale).
Le plus courant est de choisir
, étant alors environ égal à .
On détermine
et
.
On peut alors écrire que, au seuil de confiance , est compris entre et . Ceci constitue
un intervalle de confiance.
On peut citer les développements suivants:
le cas des petits échantillons (). Il faut alors utiliser la loi de Student.
le cas où l'on ne s'intéresse pas à la probabilité pour que la moyenne soit mal évaluée,
mais à la probabilité pour que la moyenne soit sur-évaluée. Il suffit de voir pour cela que
pour toute variable aléatoire symétrique, et en particulier donc
la loi normale.
le cas de à valeur dans .
le cas où l'on n'étudie pas la moyenne des mais leur .
le cas de non réellement indépendants.
le cas de non identiquement distribués.
l'évaluation de la loi de par la fameuse technique du bootstrap, très ingénieuse.
on a fait l'approximation que pour , la distribution était environ celle de la loi normale. On peut
se passer de cette approximation, et donner une borne absolue à l'écart à la loi normale.
Ces études et d'autres encore constituent la théorie des tests et font appel à des variantes
difficiles du théorème central limite. Les trois premiers points sont utiles pour faire bonne impression à un jury d'agrégation...
suivant:Index monter:Statistique précédent:Propriétés
  Index
C_Antonini,J_F_Quint,P_Borgnat,J_Bérard,E_Lebeau,E_Souche,A_Chateau,O_Teytaud