Jeu de loterie

Bonjour,

Une lotterie compte 25 millions de participants.
A chaque tour, on choisit au hasard le nombre de participants pour le prochain tour et ce uniformément entre $1$ et le nombre de participants restants.

Combien de tours en moyenne faut-il pour arriver à 5 participants ou moins?

J'avais pour idée d'introduire une chaîne de Markov par $X_0 = 25 000 000$ et $X_{n + 1} = X_n - U_{n + 1}$ où $U_{n+1} | X_n \hookrightarrow \mathcal{U}(1, X_n)$ mais les $U_n$ n'ont a priori pas la même loi

Réponses

  • Bonjour
    C'est un peu pénible de calculer la valeur exacte. Par contre ton idée de Markov donne une assez bonne approximation je pense.

    Méthode approchée. Il suffit de remarquer que
    $$
    E[X_{n}|X_{n-1}] = \frac{1+X_{n-1}}{2}.

    $$ Et donc en passant à l'espérance tu as que
    $$
    E[X_{n}] = \frac{1+E[X_{n-1}]}{2}.

    $$ Du coup tu devrais avoir que $E[X_n]$ passe en-dessous de $5$ au bout de (environ) $\log_2(25.000.000/5)$ étapes. Ca n'est pas exactement ce que tu cherches mais ça doit pas être trop mauvais.

    Méthode exacte. Notons $T_n$ le temps moyen pour arriver en-dessous de $5$, en partant de $n$ participants. On a bien sûr
    $$
    T_1=T_2=\dots = T_5=0.

    $$ Par ailleurs,
    $$
    E[T_n] = 1+ \sum_{\ell =1}^n \frac{1}{n} E[T_\ell].

    $$ C'est une formule exacte mais un peu pénible à exploiter. Avec un ordi tu dois quand même pouvoir en sortir la valeur exacte.
  • Bon, j'ai dû dire une bêtise dans ma méthode approchée, ça donne un résultat très surestimé. D'après ce code python :
    n=25000000
    
    TempsMoyens=np.zeros([1,n])
    
    SommeCourante=0
    for k in range(6,n+1):
        NouveauTemps=(k+SommeCourante)/(k-1.0)
        TempsMoyens[0,k-1]=NouveauTemps
        SommeCourante=SommeCourante+NouveauTemps
    
    print(TempsMoyens[0,n-1])
    
    On trouve $16,53$ étapes en moyenne pour arriver en-dessous de 5 participants.
  • C'est trop complique, a cause de l'arithmetique. Solution approchee avec des va continues. Considerons
    $U_1,\ldots,U_n,\ldots$ uniformes sur $[0,1]$ Alors $X_{n}=U_nX_{n-1}$ avec $X_0=25 \times 10^6$ et tu demandes l'esperance de $N=\inf\{n; X_n<5\}.$ Comme cette esperance est aussi $\sum_{n=0}^{\infty}\Pr(N>n)$ Il faut evaluer $\Pr(N>n)=\Pr(X_n>5).$ Posons $Y_n=-\log U_n$ qui suit une loi exponentielle standard on a en notant $A=\log (25\times 10^6-5)=17,03...$ pour $n>0$
    $$\Pr(N>n)=\Pr(Y_1+\cdots+Y_n<A)=\int_0^Ae^{-y}\frac{y^{n-1}}{(n-1)!}dy$$ suivant les proprietes des sommes des lois exponentielles independantes, d'ou le joli resultat
    $$\mathbb{E}(N)=1+A.$$
  • Bonjour,

    Il me semble que $ \:\:\mathbb E(T) =1+\displaystyle \sum _{k=7}^N \dfrac 1k \quad$ où $\:\: N=25 \times 10^6.$
  • Bonjour,

    Merci pour vos réponses.

    @Lucas: L'erreur provient peut-être du fait que l'on a plutôt

    $\mathbb{E}[X_{n} \vert X_{n-1}] = X_{n-1} - \frac{1 + X_{n-1}}{2} = \frac{X_{n-1} - 1}{2}$

    ce qui me donne que $T = \inf\{n > 0, X_n \leq 5\}$ vaut $22$ en moyenne.

    Pourtant je trouve moi aussi $16,5302$ par Monte-Carlo mais l'énoncé dont je tire cet exercice est un QCM dont les réponses sont $22, 23, 24$ ou $25$.

    @LOU16: peux-tu m'expliquer comment tu as eu cette formule?
  • @Sevaus
    J'ai trouvé cette expression en examinant la série formelle $\sum _{n\geqslant 0}\mathbb E (T_n) X^n$ avec $\mathbb E (T_n) $ obéissant à la relation $ (\bigstar )$ ci-dessous. Je me contente ici de justifier que: $$\:\: \boxed{\forall n \geqslant 6,\quad \displaystyle \mathbb E (T_n)=1+ \sum _{k=7}^n \dfrac 1k = \log n + \gamma-\dfrac{29}{20} +\mathcal O\left (\frac 1n \right ) \:\:\:\text{ où} \:\gamma \:\text{ est la constante d'Euler.}}$$
    $\forall n \in \N, \:T_n\:$ désigne le nombre de tirages nécessaires à l'obtention d'un effectif inférieur à $\:5\:$ participants à partir d'un effectif de $\: n\:$ participants.

    $\forall n \in [\![0;5]\!], \:\:\mathbb E (T_n)= 0, \quad \forall n \in \N\:$ tel que $ \:\:n \geqslant 6,\:\: \:\:\mathbb E (T_n)= \displaystyle 1+ \dfrac 1n \sum_{k=6}^{n-1}\mathbb E (T_k).\quad (\bigstar )$
    On démontre alors par récurrence que: $\:\: \forall n \geqslant 6,\quad \displaystyle \mathbb E (T_n)=1+ \sum _{k=7}^n \dfrac 1k.\quad$
    C'est vrai pour $n=6$, et si $n>6$ on obtient avec l' hypothèse de récurrence et $\:\: (\bigstar )$:
    $\displaystyle \mathbb E (T_n)= 1 + \dfrac 1n \sum_{k=6}^{n-1}\left(1+\sum_{i=7}^k \dfrac 1i\right)= 1+\dfrac 1n(n-6) + \dfrac 1n \sum_{i=7}^{n-1} \left(\dfrac 1i \sum _{k=i}^{n-1} 1\right)= 2-\dfrac 6n+\dfrac 1n \sum _{i=7}^{n-1} (\dfrac ni -1) =1+ \sum _{i=7}^n \dfrac 1i \:\square$
  • @LOU16 : Je ne suis pas tout à fait d'accord avec ta formule $\bigstar$. Pour moi la somme va jusqu'à $n$ (on peut stagner à chaque étape).

    Avec mon interprétation j'ai bien un résultat exact confirmant les simulation de sevaus : 16.52826869439897...
  • A part ça la stratégie de P. est très jolie! (Mais bizarrement ne donne pas une super approximation.)
  • Bonjour,

    @Lucas
    "A chaque tour, on choisit au hasard le nombre de participants pour le prochain tour et ce uniformément entre 1 et le nombre de participants restants "
    J'ai crû comprendre que ces participants, une fois choisis, sont exclus du tour suivant et qu'ainsi, à chaque tour, le nombre de joueurs décroit strictement (et ne stagne donc pas) jusqu'à atteindre une valeur inférieure à $5$.
    $\mathbb E(T_6)=1, \quad\mathbb E(T_7)= \dfrac 17 \times(1+1)+\dfrac 67 \times1 = 1+\dfrac 17,\quad\mathbb E(T_8)=\dfrac 18 \times(1+\dfrac 87) + \dfrac 18 \times (1+1) + \dfrac 68\times 1= 1+\dfrac 17+ \dfrac 18.$
    $$\xymatrix{&&&&9 \ar[llld]_{\frac19} \ar[d]_{\frac 19}\ar[rd]^{\frac 19}\ar[ld]^{\frac 69} \\
    & 8 \ar[ld] _{\frac 18}\ar[rd]^{\frac 18} \ar[d]^{\frac 68}&&\boxed{T=1}&7 \ar[ld]_{\frac17} \ar[d]^{\frac 67}&6 \ar[d] ^1 \\
    7 \ar[d]_{\frac 17} \ar[rd]^{\frac67}& \boxed{T=2} &6\ar[d]^1 &6\ar[d]^1 &\boxed{T=2} & \boxed{T=2} \\
    6 \ar[d]^1& \boxed{T=3} &\boxed{T=3} &\boxed{T=3} \\
    \boxed{T=4} } $$ $$\mathbb E(T_9)=\dfrac{695}{504} = 1+ \dfrac 17 +\dfrac 18 +\dfrac 19 $$
  • Bizarre que personne n'ait parlé de factorielle dans cette histoire ?

    On part d'un nombre $n$. On choisit un nombre au hasard entre 1 et n.
    Effectivement E(n) vaut (n+1)/2 , mais la moyenne arithmétique de toutes les valeurs possibles ne nous intéresse pas vraiment.
    A priori, on est plus intéressé par la moyenne géométrique de toutes les valeurs possibles.
    D'où cette histoire de factorielle.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • @LOU16 Euh... la phrase que tu cites est justement très clair non? Enfin bref, peu importe l'interprétation : les réponses proposées dans le QCM de sevaus sont farfelues.
  • @Lucas
    Ce n'est pas si clair car nous n'avons apparemment pas la même compréhension du protocole de cette expérience aléatoire, et je ne revendique aucune expertise en matière de "loterie".

    "Ce qui me semble clair", c'est que l'énoncé dit que $\mathbb E (T_6)=1$ et non $\mathbb E (T_6)= \dfrac 65$ comme tu l'écris dans $\mathbb E(T_n) =1 + \displaystyle \dfrac 1n\sum_{l=1}^n \mathbb E(T_l).$
    Un et un seul tirage est nécessaire pour atteindre sûrement, à partir de $6$, un effectif inférieur ou égal à $5$.

    Pour ton protocole (bien mystérieux pour moi) qui conduit à $\mathbb E(T_n) =1 + \displaystyle \dfrac 1n\sum_{l=1}^n \mathbb E(T_l).$, l'expression de $\mathbb E(T_n) $ demeure néanmoins extrêmement simple: $\:\displaystyle \mathbb E(T_n) =1+ \sum_{k=5}^{n-1} \dfrac 1k \simeq \gamma + \log n - \dfrac {13}{12}\:$ où $\gamma$ est la constante d'Euler.
  • Bonjour

    Je simplifie le problème en prenant 5 candidats et un couperêt de 2 ou moins.

    À chaque tour, on tire des candidats parmi une population, indépendamment de l'ordre (choisir Roger puis Pierre est la même chose que choisir Pierre puis Roger) et sans répétition (on n'élimine pas 2 fois Pierre). C'est donc une combinaison. On peut donc construire la matrice du nombre de tirages possibles, de terme général ai,j, donnant un restant de j-1 candidat(s) partant de i-1 candidats, après 1 tour. (image jointe 1)

    En partant d'une matrice (0 0 0 0 0 1) comme point de départ (0 tour), on peut donc déterminer le nombre de tirages, à chaque tour, en fonction du résidu. (image jointe 2)
    Le "120" en ligne du tour 5 n'est pas étonnant. Éliminer tous les candidats en 5 tours revient à trouver un ordre parmi 5 éléments. Donc 5!=120.

    Notez au passage que l'énoncé se tait quand à l'adéquation de continuer ou d'arrêter si l'objectif est atteint. Sans précision, je suppose qu'on continue. Sinon, on ne fait pas une moyenne en considérant tous les cas possibles.

    Il y a donc 1082 situations possibles. Et 1046 sont favorables. Faisons la moyenne pondérée. Les tours 0...5 ont les poids 0, 16, 160, 390, 360, 120, pour une moyenne de 3.39.

    Reste plus qu'à faire de même avec 25 millions au lieu de 5.109420
    109422
    Ce site est fatigant. Les gens modifient sans cesse leurs messages passés, et on ne comprend plus rien à la discussion. Je suis nostalgique du temps où, si on postait une bêtise, on devait l'assumer. Et si on cite le passage pour l'ancrer, l'administrateur supprime en disant qu'on n'a pas besoin de recopier le message passé.
Connectez-vous ou Inscrivez-vous pour répondre.