Estimation fonctionnelle

Bonjour,

Je ne comprends vraiment pas bien ce qui suit.

Pour commencer j'essaie de préciser ce qui semble implicite chez l'auteur: le modèle est il bien le suivant ? (* inspiré de l'extrait **)
L'estimateur de l'histogramme est donné par $\hat{f}_n(x)=\sum_k\dfrac{N_k(w)}{nh}1_{I_k}(x)$ avec $I_k=]a_k,a_{k+1}]$, $N_k(w)=\sum_i^n1_{X_i \in I_k}(w)$

1) Qu'est ce que c'est que cette histoire de $\hat{f}_n(x)$ biaisé ? Je n'y comprend rien... Pouvez vous clarifier les propos de l'auteur ? (ie) le paragraphe ci-dessous "Comme $p_k=...$, $p_k/h$ est la valeur moyenne de $f$ sur ... blabla")

[Edit: je crois que je l'ai résolu]
Voici ce que j'ai compris:
On fixe $x$; on est donc en présence d'une v.a. (et non d'un processus stochastique) et on s'intéresse à l'estimation de $f(x)$ par l'estimateur $\hat{f}_n(x)$. L'auteur montre bien que $E[\hat{f}_n(x)]=p_k/h$, or il n'y a aucunes raisons pour que $f$ (qui est continue) soit constante de valeur $p_k/h$ sur le morceau $I_k$ (on sait juste par le théorème des valeurs intermédiaires que $f$ passera au moins une fois par sa valeur moyenne: ces points sont les $x_k*$ ). Il y'aura donc un biais en dehors de ces fameuses valeurs!
https://snag.gy/SZUYyI.jpg


**https://snag.gy/2Cx5FY.jpg

Réponses

  • Bon malgré la clarté de l'auteur en général, je trouve que la présentation est ici peu claire.
    L'histogramme est un estimateur (donc une variable aléatoire fonction des observations (ie) les v.a. $X_i$); on s'en sert comme "estimateur de la densité de probabilité $f$ des $X_i$ (l'hypothèse de départ est que les $X_i$ sont iid de densité $f$).
    Pour bien comprendre le caractère aléatoire de l'histogramme on l'écrit comme suit: $\hat{f}_n(x;w)=\sum_k\dfrac{N_k(w)}{nh}1_{I_k}(x)$.

    2) En tant que va l'histogramme ci-dessus possède une loi; quelle est sa loi ? sa densité ?

    L'autre fait étrange est qu'il y a deux variables:$x$ (on remarque qu'en intégrant par rapport à x on obtient 1 et que l'on a affaire à une densité de probabilité) et $w$ qui symbolise l'aléatoire. En général les va ne dépendent que de l'aléa $w$ (c'est une sorte de processus aléatoire c'est ça ?)


    Merci d'avance pour vos réponses aux questions 1) et 2)
Connectez-vous ou Inscrivez-vous pour répondre.