Exo proba v.a. indép. uniformes

Bonjour, soient $X_1,X_2,\dots$ des v.a. indépendantes et de distribution uniforme sur $\{1,\dots,N\}$.
Soit $T_N:=\min\{n\in \mathbb N^*:X_n=X_m \text{ pour un }m<n\}$.
La première question est de calculer $\mathbb P(T_N>n)$.

Ce que j'ai fait:$$\begin{align*}
\{\omega:T_N(\omega)>n\} &=\{\omega:\min\{n\in \mathbb N^*:X_n(\omega)=X_m(\omega) \text{ pour un }m<n\}>n\} \\
&=\{\omega:\forall k\leq n,X_l(\omega)\neq X_k(\omega)\; \forall l<k\} \\
&=\bigcap_{k=2}^n\{\omega:X_l(\omega)\neq X_k(\omega)\; \forall l<k\} \\
&=\bigcap_{k=2}^n\bigcap_{l=1}^{k-1}\{\omega:X_l(\omega)\neq X_k(\omega)\} \\
&=\bigcap_{k=2}^n\bigcap_{l=1}^{k-1}\{\omega:X_l(\omega)\in \{1\dots,N\}\setminus \{X_k(\omega)\}\}
\end{align*}$$Ensuite en passant par $\mathbb P$, on a par indépendance$$\prod_{k=2}^n\prod_{l=1}^{k-1}\mathbb P(\{\omega:X_l(\omega)\in \{1\dots,N\}\setminus \{X_k(\omega)\}\})=\prod_{k=2}^n\prod_{l=1}^{k-1}\frac{1}{N-1}=\frac{1}{(N-1)^{\frac{n(n-1)}{2}}}$$Mais ce n'est pas le résultat, qui apparemment est $\frac{N(N-1)(N-2)\dots (N-n+1)}{N^n}=\prod_{i=1}^{n-1}\left(1-\frac{i}{N}\right)$, mais je ne comprends pas...

Merci pour votre aide.
«1

Réponses

  • Une remarque, tu utilises $n$ dans la même formule pour désigner deux choses différentes, l'un est libre, l'autre est lié, c'est mauvais.

    Ensuite, ton calcul "par indépendance" est fantaisiste, il ne s'agit pas d'un événement de la forme $\{X_1 \in A_1\} \cap \{X_2 \in A_2\} \cap \dots \{X_k \in A_k\}$ !

    Tu ferais mieux de raisonner comme ça : ton événement correspond au fait que les $X_i$ sont deux à deux distincts. $X_1$ ayant été choisi, il y a $1- \frac{1}{N}$ chances que $X_2 \neq X_1$, puis $1- \frac{2}{N}$ chances que $X_3 \neq X_2$ et $X_3 \neq X_2$, etc. Je te laisse formaliser ça.
  • Je lis et j'éris en même temps.

    Les $X_i$ sont iid sur $1;N$.

    Soit $T$ le rang de la première répétition.

    On a l'égalité d'événements : $[T>n] = \big[X\text{ injective sur } 1:n\big]$.

    Donc ça vient avec probabilité $\frac{N(N-1)\dots(N-(n-1))}{N^n}$, c'est ça ?

    Ah, je trouve comme l'énoncé, mais tu voulais qu'on relise tes calculs.

    Je pense que tu as écrit des choses trop compliquées pour moi.
  • (c'est littéralement la formule : nombre de tirages sans remise / nombre de tirages avec remise !)
  • Merci pour vos réponses.

    Poirot, je suis votre indication mais je bloque dans ma formalisation. J'ai que
    \begin{align*}

    \{T_N>n\} &=\{X_i\neq X_j\mid \forall i,j\leq n,\ i\neq j\} \\

    &=\{X_i\mid \forall i\leq n,\ X_i\neq X_j,\ \forall j\neq i,\ j\leq n\} \\

    &=\bigcap_{i=1}^n\{X_i\neq X_j\mid \forall j\neq i,\ j\leq n\} \\

    &=\bigcap_{i=1}^n\bigcap_{j=1,j\neq i}^n\{X_i\neq X_j\}

    \end{align*} Sachant que l'événement $\{X_i\neq X_j\}$ a probabilité $1-\frac{1}{N}$ comme tu l'as dit. Mais en passant par $\mathbb P$ j'ai une intersection imbriquée dans une autre...
  • Tes événements $[X_i\neq X_j]$ ne sont pas du tout indépendants.
  • Pour appliquer la formule des probabilités composées, il vaut mieux écrire :
    $$[T>n] = \bigcap\limits_{i=2}^n \underbrace{\bigcap\limits_{j=1}^{i-1} [X_i \neq X_j]}_{\text{proba cond : }\frac{n-i+1}{n}}$$
  • Je n'ai jamais vu cette formule des probabilités composées, comment l'appliquer ici? Les événements $A_i$ sont ici de la forme $A_{j_i}$, c-à-d des événements imbriqués...

    Aussi, pourquoi est-ce que les événements $[X_i\neq X_j]$ ne sont pas indépendants? N'a-t-on pas que $[X_i\neq X_j]=[X_i\in 1,n\setminus X_j]$?
  • Ils sont indépendants 2-à-2 mais pas mutuellement.

    Par exemple, c'est évident pour $A = [X_1 = X_2]$, $B = [X_2 = X_3]$ et $C = [X_3 = X_1]$
    Je n'ai jamais vu cette formule des probabilités composées,
    :-S Vu le niveau des questions que tu poses habituellement, je ne comprends pas comment tu peux n'avoir jamais vu cette formule, qu'on apprend dans les deux premières semaines du premier cours de proba post bac. (peut-être même en terminale)
  • Plus simplement:

    $\{T_N>n\}=((X_1,\dots,X_n)\in \mathcal{I}(n,N))$ où $\mathcal{I}(n,N)$ est l'ensemble des injections de $\{1,\dots,n\}$ dans $\{1,\dots N\}$.

    Donc $\mathbb{P}(T>n)=\mathbb{P}_{(X_1,\dots,X_n)}(\mathcal{I}(n,N)))$.

    Les $X_i$ sont indépendants, donc $\mathbb{P}_{(X_1,\dots,X_n)}=\otimes_{i=1}^n \mathbb{P}_{X_i}=\mathcal{U}(\{1,\dots,N\})^{\otimes n}=\mathcal{U}(\{1,\dots, N\}^n)$ et $\mathbb{P}(T_N>n)=\frac{|\mathcal{I}(n,N)|}{|\{1,\dots,N\}^n|}$.
  • Oui je n'ai jamais vu cette formule marsup, je n'ai peut être pas le meilleur cours... Est-ce que tu peux me détailler juste pour ce cas précis ?

    Il me semble aussi que dans votre exemple, si on suppose que les $X_i$ sont indépendants alors on a que $\mathbb P(A)=\mathbb P(B)=\mathbb P(C)=\mathbb P(A\cap B)=\cdots=0$ non ? (Si les $X_i$ sont des v.a. réelles à densité en tout cas je crois).
  • Je propose cet exercice ci-joint.

    J'ai aussi posé la question à tout le monde ici : http://www.les-mathematiques.net/phorum/read.php?12,2223554,2223554#msg-2223554120456
  • Bonjour marsup, cet exercice est assez facile, je ne vois pas comment le faire avec la formule des probabilités composées (vu que je ne l'ai jamais vu peut-être...), mais il est facilement faisable si on écrit l'évènement $A_n$ comme l'intersection d'évènements indépendants $B_1\cap\cdots\cap B_n,$
    où $B_n=$ "J'ai pioché 1 blanche parmi $n$ blanches et 1 verte".
  • Oui, c'est facile, si on veut. C'est ce qu'on appelle la formule des probabilités composées.
  • D'accord mais pour en revenir au sujet initial, je suis toujours bloqué... Peux-tu me détailler comment appliquer cette formule dans mon exercice s'il te plaît?
  • C'est le même principe dans ton problème que dans celui-ci de l'urne de Pólya. (l'urne de Pólya me semble plus compliquée !)

    Si je note $A_k$ l'événement : pas encore de répétition jusqu'au rang $k$, on a : $P_{A_k}(A_{k+1}) = \frac{N-k}{N}$.

    En multipliant le tout pour la suite décroissante $(A_k)$, on trouve $P(A_n) = \frac{N(N-1)\dots(N-(n-1))}{N^n}$.
  • Je ne comprends vraiment pas... Pourquoi cette histoire de répétition? Pourquoi aussi écrire cette proba conditionnelle $\mathbb P_{A_k}(A_{k+1})$? Je croyais que dans le cas de l'urne de Pólya, $\mathbb P_{A_k}(A_{k+1})=\mathbb P(A_{k+1})$ vu que l'événement $A_{k+1}$ implique l'événement $A_k$...
  • Si je note $A_k$ l'événement : pas encore de répétition jusqu'au rang $k$, l'événement $A_{k+1}$ implique aussi l'événement $A_k$.

    Et non, absolument pas, ça ne donne pas du tout $P_{A_k}(A_{k+1}) = P(A_{k+1})$.

    Ça, ce serait une propriété d'indépendance, et là, ce n'est pas du tout le cas !
  • J'ai très peu vu les proba conditionnelles... Que représente en fait $\mathbb P_{A_k}(A_{k+1})$? Pourquoi ca s'applique dans notre cas?
  • Tu peux regarder Yvan Monka, si tu veux :
  • Merci pour la vidéo.
    Juste pour en revenir aux urnes de Pólya, pour la question 4, est-ce que $\mathbb P_{A_k}(A_{k+1})=\frac{k+1}{k+2}$ ($k+1$ boules blanches, $1$ boule verte)?
  • Je suis d'accord avec cette réponse. ;-)
    Karl Tremblay 1976-2023, je t'appréciais tellement.
  • Oui, je crois que c'est ça. On a ajouté $k$ boules depuis le début, en partant de 2, et il y en a toujours une seule qui est verte.
  • En plus la question 5 fonctionne bien aussi. ;-)
    Karl Tremblay 1976-2023, je t'appréciais tellement.
  • (Ça me rassure que Code_Name ait l'air, maintenant qu'il le fait pour de vrai, de trouver mon exercice moins facile qu'hier :)o !)
  • La formule de probabilité composée pour la question 5 donne $$\mathbb P(A_n)=\mathbb P(A_1\cap \dots \cap A_n)=\mathbb P(A_1)\mathbb P_{A_1}(A_2)\dots \mathbb P_{A_1\cap \dots \cap A_{n-1}}(A_n)=\mathbb P(A_1)\mathbb P_{A_1}(A_2)\dots \mathbb P_{A_{n-1}}(A_n)=\frac{1}{2}\frac{2}{3}\dots \frac{n+1}{n+2}=\frac{1}{n+2}$$Non?
  • Tu fais une petite erreur de technique, mais c'est exactement l'idée de la formule des probabilités composées.

    $$\mathbb P(A_n)=\mathbb P(A_1\cap \dots \cap A_n)=\mathbb P(A_1)\mathbb P_{A_1}(A_2)\dots \mathbb P_{A_1\cap \dots \cap A_{n-1}}(A_n)=\mathbb P(A_1)\mathbb P_{A_1}(A_2)\dots \mathbb P_{A_{n-1}}(A_n)=\frac{1}{2}\frac{2}{3}\dots \color{red}{\frac{n}{n+1}=\frac{1}{n+1}}$$
  • Comment l'appliquer pour mon exercice?
  • Je crois que j'ai enfin compris.
    Si on n'a pas encore de répétition jusqu'au rang $k$, alors ca veut dire que $\forall i\leq k$ et $j\leq i-1,\; X_i\neq X_j$.

    Donc pour que $A_{k+1}$ se réalise, il suffit que $X_{k+1}\neq X_j\; \forall j\leq k$ c-à-d on a $\bigcap_{j=1}^k [X_{k+1}\neq X_j]$ qui est équivalent au fait que $X_{k+1}$ appartienne à $N$ valeurs après avoir enlevé $k$ valeurs, dont la probabilité vaut $\frac{N-k}{N}$.

    En d'autres termes, on a que $\mathbb P_{A_k}(A_{k+1})=\mathbb P\left(\bigcap_{j=1}^k [X_{k+1}\neq X_j]\right)
    =\frac{N-k}{N}$.
  • Bravo, je suis content !

    Juste, il faut faire un tout petit peu attention :

    $$\mathbb P_{A_k}(A_{k+1})=\mathbb P_{\color{red}{A_k}}\left(\bigcap_{j=1}^k [X_{k+1}\neq X_j]\right) =\frac{N-k}{N}$$
  • Je ne vois pas pourquoi il y a ce $A_k$ en indice. Je croyais que c'était l'évènement $A_{k+1}$ sachant $A_k$ qui s'écrivait $\bigcap_{j=1}^k [X_{k+1}\neq X_j]$, donc pour ce dernier évènement il suffit juste de passer à $\mathbb P$ non?
  • Parce que si $A_k$ n'est pas réalisé, la probabilité n'est pas la même $\frac{N-k}{N}$

    Par exemple, si on suppose que les $k$ premiers tirages ont tous donné le même résultat, la probabilité conditionnelle est de $\frac{N-1}{N}$.
  • Ah je comprends, j'avais supposé que les premiers tirages étaient tous différents sans vraiment y réfléchir.

    Pour revenir à notre exercice, on sait maintenant que $\mathbb P_{A_{i-1}}\left(\bigcap_{j=1}^{i-1}[X_i\neq X_j]\right)=\frac{N-(i-1)}{N}$.

    On peut aussi réécrire $\bigcap_{i=2}^n\bigcap_{j=1}^{i-1}[X_i\neq X_j]=A_1\cap A_2\cap \dots \cap A_{n-1}$.

    En appliquant la formule des probabilités composées, on a que $\mathbb P(A_{n-1})=\mathbb P(A_1)\mathbb P_{A_1}(A_2)\dots \mathbb P_{A_{n-2}}(A_{n-1})$.

    Il y a cependant un problème car $\mathbb P(A_1)=0$...
  • Non, on a $P(A_1) = 1$ (jusqu'au premier tirage, il n'y a pas de répétition)
  • Il y a cependant un problème car $\mathbb P(A_1)=0$...

    Non $\mathbb P(A_1)$ ne vaut pas 0.

    Cordialement.
    Karl Tremblay 1976-2023, je t'appréciais tellement.
  • P(A1)=1

    J'aurais dit 0.5
    Karl Tremblay 1976-2023, je t'appréciais tellement.
  • J'aurais dit 0.5
    Ah... Bah je pense que tu te trompes, mais j'aurais du mal à dire où, vu la richesse de ton argumentation (:D:-DX:-( (je plaisante, ne le prends pas mal, Zeitnot ;-) !)

    D'ailleurs, la formule $P_{A_{k}}(A_{k+1}) = \frac{N - k}{N}$ donne bien, pour $k=0$, que $P_{A_0 = \Omega}(A_1) = 1$.
  • Après la 1ère pioche,on n'a toujours pas tiré de boule verte.

    Il y a deux boules dont une verte, donc une probabilité de 1/2 de ne toujours pas avoir tiré une boule verte après le premier tirage.
    Karl Tremblay 1976-2023, je t'appréciais tellement.
  • On ne parle plus de l'urne de Pólya, là, mais des répétitions, l'exercice initial du fil !

    Pour l'urne de Pólya, oui, on a $P(A_1) = \frac{1}{2}$.
  • N'a-t-on pas que $A_1=[X_1\neq X_1]$ qui est de proba nulle?

    Edit: Ah non, c'est moi qui me suis trompé. On a je crois plutôt que $\bigcap_{i=2}^n\bigcap_{j=1}^{i-1}[X_i\neq X_j]=A_2\cap A_3\cap \dots \cap A_n$.

    Donc $\mathbb P(A_n)=\mathbb P(A_2)\mathbb P_{A_2}(A_3)\dots \mathbb P_{A_{n-1}}(A_n)$

    On sait que $\mathbb P(A_2)=\frac{N-1}{N}$.

    Là tout rentre dans l'ordre.
  • J'aurais encore d'autres questions relatives à cet exercice mais je devrais plutôt créer un autre fil vu que celui-ci est déjà assez rempli non ?

    [Si elles se rapportent à ce problème, pose les là, ce sera plus utile pour un futur visiteur d'avoir tout rassemblé. AD]
  • Voici la prochaine question: Montrer que $Y_N:=N^{-\frac{1}{2}}T_N$ converge en loi et identifier la distribution limite.

    Il y a l'indice suivant: Utiliser le résultat précédent et calculer $\log \mathbb P(Y_N>x)$ pour $x$ fixé, en utilisant le développement $\log(1+t)=t+O(t^2)$ pour $|t|\leq \frac{1}{2}$.

    Je peux vous donner le début de mon corrigé que je comprends: Pour $x>0$ et $n:=\lfloor x\sqrt N \rfloor$ on a que $$\begin{align*}
    \log \mathbb P(Y_N>x) &=\log \mathbb P(T_N>x\sqrt N) \\
    &=\log \left(\prod_{k=1}^{n-1}\left(1-\frac{k}{N} \right ) \right ) \\
    &=\sum_{k=1}^{n-1}\log \left(1-\frac{k}{N} \right) \\
    &=\sum_{k=1}^{n-1}\frac{-k}{N}+O\left((\frac{k}{N})^2 \right ) \\
    &=-\frac{n(n-1)}{2N}+O\left(\frac{n^3}{N^2} \right )
    \end{align*}$$Ensuite je ne comprends pas que faire avec ceci...
  • À $x$ fixé, on a pour $N\to\infty$ : $n\sim x\sqrt{N}$, donc $\ln(P(Y_N>x)) \to -\frac{x^2}{2}$, donc $P(Y_N>x) \to \exp\big(-\frac{x^2}{2}\big)$.

    Reste à vérifier que cette fonction d'antirépartition limite est une fonction d'antirépartition : décroissante, avec $\lim_0 = 1$, \lim_{+\infty} = 0$. Et puis c'est bon, pour trouver la densité limite, tu prends moins la dérivée de ça.


    C'est vrai que je divulgâche un peu trop, là :-(. (Ça fait une semaine qu'on est sur cet exo, je commence à avoir hâte que ça se finisse 8-)!) Se référer à la question de Poirot.
  • Qu'est-ce que ça t'apprend sur la limite de $\mathbb P(Y_N > x)$ quand $N$ tend vers l'infini ?

    EDIT : marsup a tout dit...
  • Une chose que je ne savais pas est qu'apparemment si deux fonctions sont équivalentes dans un voisinage d'un point $a$ alors dans une expression qui contient une de ces deux fonctions, elles deviennent interchangeables en passant à la limite en $a$.

    Ensuite je vois bien que $\mathbb P(Y_N>x) \to \exp\big(-\frac{x^2}{2}\big)$ mais quel rapport avec la convergence en loi?

    (P.S excusez ma lenteur, je suis un peu lent de base mais je travaille aussi sur d'autres choses... Merci pour votre patience en tout cas :-))
  • Ne connais-tu pas le lien entre convergence en loi et convergence des fonctions de répartition ?

    Ce que tu dis sur "l'interchangeage" est faux en général ($x$ et $x+1$ sont équivalentes en l'infini, mais pas $e^x$ et $e^{x+1}$).
  • Ah oui c'est bon! Merci.
    J'aurais peut-être encore une dernière question mais je vais d'abord tout mettre au propre puis essayer de la faire.
  • J'ai oublié de te demander pourquoi est-ce que l'interchangeabilité marche ici? Ou quelle propriété de l'équivalence a été employée?
  • Pour la dernière question c'est bon mais je ne sais toujours pas exactement comment marsup a utilisé cette équivalence.
Connectez-vous ou Inscrivez-vous pour répondre.