Erdös-Kac et loi normale : problème
dans Arithmétique
Bonjour,
Il y a un truc que je ne comprends pas avec le théorème d'Erdos-Kac (1939) qui est le suivant :
Le théorème dit finalement que la distribution des valeurs de $\omega(x)$ pour $1 \leq x \leq n$ tend vers une loi normale de moyenne $\ln \ln n$ et d'écart-type $\sqrt{\ln \ln n}$ lorsque $n$ tend vers $+\infty$.
Or, en utilisant MAPLE j'ai calculé les fréquences pour $n$ = 50 millions (données écrites ici), et j'obtiens cela (loi normale + histogramme) sous GEOGEBRA :
La somme des aires des rectangles de l'histogramme est bien égale à 1, mais on ne peut pas dire que "l'histogramme tende vers la courbe de Gauss" là... Est-ce parce que $n$ n'est pas assez grand (puisqu'il s'agit d'un résultat asymptotique) ou j'ai mal fait un truc ? :-(
MERCI par avance.
Il y a un truc que je ne comprends pas avec le théorème d'Erdos-Kac (1939) qui est le suivant :
Pour tout réel $\lambda$, on a :
$$\lim_{x\to+\infty}\frac { \left|\left\{n\leq x~|~\omega(n)\le\ln\ln x+\lambda\sqrt{\ln\ln x}\right\}\right| } {x}=\frac1{\sqrt{2\pi}}\int_{- \infty}^\lambda e^{-t^2/2}~\mathrm dt.$$
où $\omega(n)$ désigne le nombre de facteurs premiers (distincts) de $n$ (comptés sans leurs multiplicités).
Le théorème dit finalement que la distribution des valeurs de $\omega(x)$ pour $1 \leq x \leq n$ tend vers une loi normale de moyenne $\ln \ln n$ et d'écart-type $\sqrt{\ln \ln n}$ lorsque $n$ tend vers $+\infty$.
Or, en utilisant MAPLE j'ai calculé les fréquences pour $n$ = 50 millions (données écrites ici), et j'obtiens cela (loi normale + histogramme) sous GEOGEBRA :
La somme des aires des rectangles de l'histogramme est bien égale à 1, mais on ne peut pas dire que "l'histogramme tende vers la courbe de Gauss" là... Est-ce parce que $n$ n'est pas assez grand (puisqu'il s'agit d'un résultat asymptotique) ou j'ai mal fait un truc ? :-(
MERCI par avance.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
et Factorizer software ici http://telecharger.cnet.com/Factorizer/3000-2053_4-77398825.html
Je note $\mu = \ln \ln (n)$ et $\sigma = \sqrt{\mu}$.
J'ai bien compris qu'ils "centrent et réduisent" en calculant $\frac{1-\mu}{\sigma}, \frac{2-\mu}{\sigma}, \frac{3-\mu}{\sigma}, ...$ et qu'ils font des classes ; les hauteurs des bâtons sont (me semble-t-il) les fréquences multipliées par $\sigma$, autrement dit ils "centrent et réduisent" comme on le fait toujours. C'est ce que j'ai fait sur mes graphiques perso.
Mais eux, ils tracent une loi normale de paramètres 0,17591 ("mean") et 0,64758 ("std. dev.")... :
Alors oui, leur loi normale est nickel, mais comment trouvent-ils ces paramètres ?? ::o
Ils écrivent : Je ne trouve pas 0,17591 comme moyenne... Je me trompe ?
De plus, le théorème d'Erdös-Kac dit pourtant qu'on devrait tracer la loi normale centrée réduite, c'est bizarre non ?
$$\dfrac{5972*ek_1+23225*ek_2+35311*ek_3+25388*ek_4+8813*ek_5+1242*ek_6+49*ek_7+1*ek_8}{100001}$$
ce qui donne environ 0.02868787634.
Comment arrivent-ils à "Mean = 0.17591" ?
Mon calcul me semble juste puisqu'ils disent :
Et puis de toute façon, je maintiens que le théorème d'Erdös-Kac doit faire apparaître une loin normale centrée réduite :-(
Digression :
- La quantité de premiers inférieurs à n est environ n/ln(n).
- « Erdös et Kac lient définitivement la théorie des nombres à celle des probabilités en montrant que le nombre des diviseurs premiers d'un entier suit statistiquement une loi de Gauss. ».
- On sait qu’il y a n/2ln²(n) façons d'écrire un entier n pair assez grand comme somme de deux premiers (Goldbach) - https://goo.gl/kFfYct
- Sur votre (ta) page, Gérald Tenenbaum dit à 1h15 du début https://goo.gl/DxKsTS qu’on « s’intéresse à la probabilité d’apparaître des nombres naturels, comme si c’étaient des variables aléatoires ... »
Je trouve qu’il y a pas mal de résonances dans tout cela sans comprendre très bien ce qui les noue. Encore une fois, je me demande si la conjoncture de Goldbach n’est pas l’expression additive d’un postulat qui définit les nombres pairs.
Si d’aventure la comète de Goldbach et la courbe de Gauss du nombre de diviseurs premiers avaient des accointances, ce serait super, mais bon ...
Pour revenir à mon problème, j'ai poussé mes calculs jusqu'à $n=2^{31}$ (mon pc a calculé pendant plus de 46h).
J'obtiens cet histogramme des fréquences (j'y ajoute la courbe de la loi normale de paramètres $\ln \ln n$ et $\sqrt{\ln \ln n}$ comme l'indique le théorème d'Erdös-Kac :
On ne peut pas dire que la courbe approche l'histogramme...
Je pense donc qu'il y a une "erreur" dans ma façon de représenter l'histogramme, on devrait normalement avoir une courbe qui approche les histogrammes... :-S
Quelqu'un a une idée ?
MERCI remark pour ta citation de wikipedia ! Je n'avais pas lu l'article jusqu'en bas et ça me rassure.
Cette phrase est incroyable quand même... ça signifierait que la distribution du nombre de facteurs premiers tend TRES TRES lentement vers une gaussienne.
Du coup, ne trouvant pas la distribution des $\omega (i)$ pour $i$ de 1 à $10^{100}$, je vais pousser mes calculs encore plus loin. Je viendrai alors poster mes nouveaux histogrammes (tu)