Médiane inégalité
dans Statistiques
Bonjour,
Soit $X_{1},\ldots,X_{n}$ iid de moyenne $\mu$ et variance $\sigma^{2}$.
Soit $\mu_{K} = \text{median}(\bar{X}_{B_{1}},\ldots,\bar{X}_{B_{K}})$ pouvez-vous m'aider à montrer que $$
P(\mu_{k} - \mu \ge \frac{2\sigma}{\sqrt{m}}) \le P(\text{Binomial}(K,\frac{1}{4}) \ge \frac{K}{2}),
$$ avec $B_{j}$ une partition de $\{1,\ldots,n\}$ en $K$ blocs disjoints EDIT : de taille $m = \frac{n}{K}$ avec $K \le \frac{n}{2}$ pour que ça marche.
Merci !
Soit $X_{1},\ldots,X_{n}$ iid de moyenne $\mu$ et variance $\sigma^{2}$.
Soit $\mu_{K} = \text{median}(\bar{X}_{B_{1}},\ldots,\bar{X}_{B_{K}})$ pouvez-vous m'aider à montrer que $$
P(\mu_{k} - \mu \ge \frac{2\sigma}{\sqrt{m}}) \le P(\text{Binomial}(K,\frac{1}{4}) \ge \frac{K}{2}),
$$ avec $B_{j}$ une partition de $\{1,\ldots,n\}$ en $K$ blocs disjoints EDIT : de taille $m = \frac{n}{K}$ avec $K \le \frac{n}{2}$ pour que ça marche.
Merci !
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
On a $\displaystyle P
\Big(
\bar{X}_{B_i} - \mu \ge \frac{2\sigma}{\sqrt{m}}
\Big)
= 1-\Phi\Big(2 \cdot \sqrt{\frac{K \cdot \sharp B_i}{n}}\Big) = a_i$.
Donc $\displaystyle P
\Big(
\mu_K-\mu \ge \frac{2\sigma}{\sqrt{m}}
\Big)
=
\sum_{\ell=\lceil K/2 \rceil}^{K}
\sum_{\sharp L = \ell}
\Big(
\prod_{i\in L} a_{i} \times
\prod_{i\not\in L} (1-a_{i})
\Big)
$. ($L$ parcourt les parties de $\{1,\dots,K\}$ de cardinal $\ell$).
Quand tous les $B_i$ sont de cardinal $m=\frac{n}{K}$, ça donne exactement $P\big(Bin(K,1-\Phi(2))\ge K/2\big)$, ce qui est plus petit que $P\big(Bin(K,1/4)\ge K/2\big)$.
Pour le cas général, je ne sais pas trop, mais c'est sans doute un truc de convexité ($\ln(\Phi)$ est convexe ou concave)
P \Big(\bar{X}_{B_{j}} - \mu \ge \frac{2\sigma}{\sqrt{m}} \Big) \le \frac{1}{4}
$$
J'ai du mal à comprendre votre égalité ici : $$
\displaystyle P\Big( \mu_K-\mu \ge \frac{2\sigma}{\sqrt{m}} \Big) = \sum_{\ell=\lceil K/2 \rceil}^{K} \sum_{\sharp L = \ell}
\Big( \prod_{i\in L} a_{i} \times \prod_{i\not\in L} (1-a_{i}) \Big)
$$
$$
\displaystyle P
\Big(
\bar{X}_{B_i} - \mu \ge \frac{2\sigma}{\sqrt{m}}
\Big)
= 1-\Phi\Big(2 \cdot \sqrt{\frac{K \cdot \sharp B_i}{n}}\Big) = a_i
$$
Les $X_{i}$ ne sont pas gaussiennes.
C'est pour ça alors que je ne comprenais pas trop le $\frac{1}{4}$.
Du coup le $\frac{1}{4}$, c'est ce qui est donné par l'inégalité de Bienaymé-Chebyshev.
Si les $\underbrace{\bar{X}_{B_{i}}}_{Y_i}$ sont iid, c'est beaucoup plus simple, bien sûr.
Pour que la médiane soit $\ge a$, il faut qu'il y ait au moins $K/2$ valeurs qui soient $\ge a$.
En notant $\epsilon_i = 1_{Y_i\ge a}$, on veut donc $\sum \epsilon_i \ge K/2$.
Or $\epsilon_i \hookrightarrow B(\underbrace{P(Y_i\ge a)}_{=p})$ sont iid, donc la somme est binomiale $B(K,p)$.
Or $p\le\frac{1}{4}$ (BC), d'où le résultat.