Équation de Chernoff

Bonjour,
j'ai un petit problème à résoudre, on aimerait découvrir avec quel pourcentage un dé pipé affiche le nombre 1. C'est évident que si on lance 1'000'000'000'000 de fois on aura plutôt de bonne chance d'y arriver, ce qu'on aimerait c'est trouver un nombre minimum de lancés pour que : $$Pr[|p_1 - p_{a_1}| < 0.01] \geq 995/1000$$ où $p_1$ est la réel probabilité réelle recherchée et $p_{a_1}$ l'approximation, l'approximation que j'ai déjà remplacéé par $\dfrac {\mbox{nombre de fois que 1 apparaît}}{N}$
C'est donc le nombre $N$ minimum pour satisfaire ce que j'ai écrit plus haut. Je suppose qu'il faut découvrir l'espérance pour utiliser Chernoff mais je ne suis pas sûr et je ne sais pas comment m'y prendre. On précise que la probabilité n'est pas inférieure à 5%. Pouvez-vous m'aider ?

Réponses

  • Bonjour.

    Le calcul se fait facilement, puisque le nombre de 1 sortis suit une loi binomiale B(N,p1). Seul petit problème : on n'a pas de formule explicite pour les probabilités cumulées de la loi binomiale. Et il est évident que N minimum dépend de p1. Mais comme il est facile de voir que N augmente quand $p_1\in[0,05, \frac 1 2]$ se rapproche de 0,05, on peut trouver un N "minimum" global.

    A toi de traiter le problème avec les formules de base. Si tu parles de Chernoff, tu es normalement capable de traiter des exercices élémentaires.

    NB : Tu parles de "découvrir l'espérance" ?? Veux-tu dire "estimer $p_1$ ?

    Cordialement.
  • Bonjour

    La question porte simplement sur l'intervalle de confiance, non ? Je me trompe ?
    Dans ce cas, il existe une réponse simple.
  • Je propose N = 19700 ..

    Notation : f désigne la fréquence observée : f = "nombre d'apparitions" / N

    Alors, quel que soit p dans [0,1],
    p appartient à l'intervalle [ f - 0.01, f + 0.01 ] avec une probabilité supérieure à 0.995

    Ce qui est faux avec 19699. La "difficulté" vient lorsque p est proche de 0.5
  • gerard0 écrivait:
    > il est facile de voir que N augmente quand $p_1\in[0,05, \frac 1 2]$ se rapproche de 0,05,

    C'est plutôt le contraire je pense...
  • Pour avoir une meilleure précision lorsque p est loin de 0.5 , je propose n = 22 500

    Et l'intervalle $U = [\ f-3\sqrt {f \left( 1-f \right) / n},\ \ f+3 \sqrt {f \left( 1-f \right)/ n} \ ]$
    où f désigne la fréquence observée : f = "nombre d'apparitions" / n

    Ainsi U est un intervalle de rayon ${\frac {1}{50}}\,\sqrt {f \left( 1-f \right) }$ donc toujours inférieur ou égal à 1 / 100.

    Quel que soit p dans [0, 1], la probabilité que p appartienne à U est au moins de 995 / 1000 .
    Comme p > 0.01 alors la probabilité est proche de 997 / 1000.
  • Léon1789,

    Quand p tend vers 0,05, il diminue, donc on a de moins en mois de chances de tomber sur un 1, il faut de plus en plus d'essais pour savoir ce qui se passe.

    Cordialement.
  • Gérard,

    Tomber sur 1 est une chose qui n'apporte pas plus d'information que tomber sur 0.
    C'est la variance qui indique la vitesse de convergence ! Ici , pour la loi binomiale, on a V = N.p.(1-p) donc, quand p est proche de 0 (ou de 1), la variance tend vers 0, ce qui implique un intervalle de confiance plus petit pour un nombre d'essais N fixé, ou un nombre d'essais N plus petit pour un rayon d'intervalle fixé (comme ici, à 1 / 100).

    Prenons un exemple concret si tu veux bien vérifier (par expérience ou par calcul via loi binomiale) : 
    Je note f la fréquence observée sur n essais avec n = 10 000.

    - choisis p entre 0.4 et 0.6,
    alors [ f – 1 /n^0.5 , f + 1 /n^0.5 ] est un intervalle de confiance à 95%

    - choisis p entre 0 et 0.1,
    alors [ f – 0.6 /n^0.5 , f + 0.6 /n^0.5 ] est un intervalle de confiance à 95%, mais c'est un intervalle presque deux fois plus petit.
  • Dit autrement, sur un autre exemple, pour avoir une précision de 1 / 100 , c'est-à-dire en considérant l'intervalle [ f - 0.01, f + 0.01 ] comme demandé par Adaq

    si p est compris entre 0.4 et 0.6, il peut prendre N = 19 700 pour un niveau de confiance de 99.5%

    si p est compris entre 0 et 0.1, il peut prendre N = 7 000 environ un niveau de confiance de 99.5%

    N diminue quand p tend vers 0 (ou 1), N augmente quand p tend vers 1/2. ;-)
  • Effectivement, tu as raison, on cherche ici un intervalle fixe (j'avais en tête un intervalle relatif sur p, qui est à priori plus petit quand p tend vers 0).

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.