Échantillonnage et proportion infime

Bonsoir à tous,
une question toute bête, existe-t-il des méthodes pour effecteur des échantillonnages portant sur des proportions infimes ?
Ma question est bien évidemment liée à l'actualité, imaginons qu'une affection touche 1 personne sur 1 million et que suite à une vaccination on constate que cette proportion est multipliée par 3 sur un échantillon de quelques millions. Dans quelle mesure peut-on considérer que cet écart est significatif ?
D'un point de vue naïf, si je considère un bête intervalle de confiance, je me retrouve avec une marge d'erreur de l'ordre de $10^{-3}$ et aurais donc tendance à considérer cet écart comme non significatif.
Et je vois du coup assez mal comment on peut analyser un tel échantillonnage. Même avec un échantillon de taille $10^9$ on se retrouve avec une marge d'erreur bien plus grande que la proportion observée...

Bonne soirée
F.

Réponses

  • Si tu as $10^6$ patients dans ton échantillon, et que ta maladie vient avec proba $p = 10^{-6}$, alors le nombre de malades suit la loi de Poisson $P(1)$. Effectivement, c'est un peu délicat impossible d'écarter l'hypothèse nulle dans ce cas là si tu as obtenu 2 malades, car voici la fonction de répartition de $P(1)$
       0.       1.       2.       3.      4.       5.       6.    
       0.3679   0.7358   0.9197   0.981   0.9963   0.9994   0.9999
    
    Tu avais 8% 26.5% de chances d'avoir 2 malades sans que la vaccination ait changé quoi que ce soit.
    Par contre, si tu as 3 malades, c'est quand même presque net (moins de 2% 8% de chances !)

    Maintenant, si tu as $10^7$ patients dans ton échantillon, et toujours $p=10^{-6}$, on a la loi de Poisson $P(10)$, dont la variance est $\sqrt{10} = 3$.
    Donc si tu as 20 patients malades dans ton échantillon, tu es à plus de 3 écarts-type de la valeur attendue : il n'y avait que 0,16% 0,35% de chances d'en avoir autant !

    -- Corrigé, j'avais mal lu mes fonctions de répartition !
  • En fait, ce qu'il faut bien comprendre, c'est que la variance pour la loi binomiale $B(n,p)$ est $np(1-p)$, donc si $p$ est petit, il ne faut pas la majorer par $\frac{n}{4}$, mais par $np$, qui est bien plus petit, donc ça donne des intervalles de fluctuation moins catastrophiques.
  • Bien vu Marsup !
  • Merci pour cette intéressant réponse...du coup, je comprends mieux pourquoi cette loi s'appelle loi des évènements rares ;-)

    Bonne soirée

    F.
Connectez-vous ou Inscrivez-vous pour répondre.