proportion d'entiers commençant par...

Bonsoir...

Peut être que le sujet a déjà été traîté ici, mais quelqu'un aurait il une référence ou une explication ou autre sur le problème suivant :
pour $k$ entier entre 1 et 9, quelle est la proportion d'entiers dont le premier chiffre est $k$ ?

merci d'avance

Réponses

  • Pour $n \geq 0$, il y a $10^n$ entiers commençant par k dans $D_n = \{ 10^n, 10^n + 1, ..., 10^{n+1}-1 \}$ ($k=1...9$).
    Par ailleurs $\N^* = \cup_{n \geq 0} D_n$.

    La proportion recherchée est donc $\frac{1}{9}$.
  • je crois que non en fait...
    il y a plus de 1 que de 2, plus de 2 que de 3, ...
    j'ai souvenir d'avoir lu ça un jour
  • Bonsoir

    La proportion est par rapport à quoi ?
    Si c'est la proportion d'entiers inférieurs à n et commençant par le chiffre k, alors par exemple :
    pour n=20 il y a 11/20 commençant par 1 et 2/20 par 2, 1/20 par 3, ..., 9

    Alain
  • J'imagine que c'est la probabilité qu'un nombre tiré au hasard suivant une loi uniforme commence par k avec k=1...9.

    Gaston, j'imagine que tu penses aux vieilles tables de logarithmes, dont les pages concernant les nombres commençant par 1 étaient plus usées que les autres. Mais le fait qu'on rencontre plus souvent des nombres commençant par 1 ne signifie aucunement qu'il y a plus de nombres commençant par 1 que de nombres commençant par k (k différent de 1).
  • Je crois que Gaston veut parler de résultats bizarre avec des log qui disent que les premiers chiffres d'un nombre ont des probas décroissante d'apparaître dans la vie... Non?
  • Pour tout vous dire, on m'a posé ça sous forme d'énigme hier...
    Spontanément j'ai répondu 1/9, mais la personne m'a dit "non non... tu t'es fait piéger..."
    me souvenant d'avoir entendu vaguement parlé de ça un jour, mais étant incapable de trouver de justification, j'ai demandé ici. (ce que je commence à regretter car je subis les sarcasmes même d'un modo)

    Il s'agirait donc d'une sorte de mythe empirique? Qu'entends-tu exactement par "d'apparaître dans la vie"?

    [Gaston, les modos pourraient se vexer à juste titre : "[i]je subis les sarcasmes même d'un modo[/i]" ! D'autant plus que je ne vois aucun sarcasme dans les intervention d'aviva ou d'Alain. Bruno]
  • Il y a deux choses distintes : comme l' a dit Guimauve si tu prend entier au hasard alors la proba recherchée est bien sûr $\frac{1}{9}$.

    Cependant les chiffres qui interviennent dans la vie de tous les jours comme : les prix d'un supermarché ( que cela soit en euros où en francs ), la longueur de cours d' eau... commencent à plus de $30 %$ par un $1$.
    Cela n' a rien de mystérieux, on peut en faire la démonstration et ce fait est connu sous le nom de loi de Benford.
    Une petite recherche sur google ou Wikipédia t' en apprendra plus.
  • En plus quand je relis le texte de Guimauve cela me semble incohérent : je m'explique :
    Si on note $p_k(n)=#\{p \leq n, \ \ tel \ que \ p \ commence \ par \ un \ k \}$ ( ceci pour $k=0..9$ ).
    Alors il serait légitime de définir la probabilité qu'un entier commence par un $k$ par $lim_{n \rightarrow +\infty} \frac{p_k(n)}{n}$.
    Cependant il se trouve que cette limite n'existe pas ! Guimauve prenait la limite d' une suite extraite très particulière ( celle des $10^n$).
    Donc il est difficile de parler de cette probabilité, en toute généralité.

    Cependant je pense que Gaston faisait bien allusion à la loi de Benford que j' ai mentionnée au dessus.

    ( merci Bruno pour le $\%$ j'y penserai dorénavant)
  • Merci beaucoup Pilz. C'est bien ça qu'il me manquait.
    Je vais pouvoir expliquer à la personne le pourquoi du comment
  • Merci Pilz, c'était bien à la loi de Benford que je faisais référence!
  • Notons que la loi de Benford n'est pas complètement sortie du chapeau. En reprenant les notations de Pilz, la suite $(p_k(n)/n)$ n'a effectivement pas de limite, mais l'on a cependant, pour tout $n$ :
    $$p_1(n)\geq p_2(n)\geq \cdots\geq p_9(n)$$
    Pour $p_9$, $1/9$ est la limsup, alors que c'est la liminf pour $p_1$ (et les limsup et liminf des $p_k$ sont faciles à calculer, et décroissent avec $k$). Donc on est bien amené à se dire qu'il y a, en un certain sens, davantage d'entiers commençant par un 1 que par un 9.

    Pour donner un sens précis à cette affirmation, il est vrai qu'on ne peut pas calculer la densité naturelle des entiers commençant par k puisqu'elle n'existe pas. En revanche, on peut essayer de calculer d'autres types de densités définies pour des familles d'entiers plus générales. Par exemple, si l'on définit la densité analytique $d_{\rm an}(A)$ d'un ensemble $A\subset \N^*$ comme la limite en 1, si elle existe, de la fonction $(s-1)\zeta_A(s) = (s-1)\sum_{n\in A} n^{-s}$, il me semble que ça coïncide avec la densité naturelle quand elle existe, que c'est compris entre la liminf et la limsup évoquées plus haut, et que pour les ensembles considérés ici, on obtient bien les valeurs attendues, à savoir :
    $$d_{\rm an}(A_k) = \log_10(1+1/k)$$
    où $A_k$ est l'ensemble des entiers commençant par $k$.
  • Merci pour ses précisions Medhi ton explication est très claire , cependant je n' arrive pas à voir comment tu calcules $d_{an}(A_k)$ ?
  • Il y a équivalence entre l'existence d'une densité analytique et celle d'une densité {\it logarithmique} d'une suite $\mathcal {A}$ d'entiers, et, dans ce cas, les deux densités sont égales.

    En revanche, l'existence d'une densité logarithmique (ou analytique) n'implique pas celle d'une densité naturelle.

    Borde.
  • on a finalement bien fait de ne pas mettre ce topic en lycée...

    pff

    [Veux-tu que je le remette en M2/++ ? AD]
  • S'il existe vraiment une démonstration satisfaisante de la loi de Benford, ça doit être récent

    je crois que Ted Hill a proposé une démonstration mais j'ignore si elle est reconnue et si d'autres en ont proposé ( par contre, beaucoup se sont cassés les dents dessus donc bon, ce n'est pas si simple et anodin )
  • Il me semblait que la loi de Benford était purement empirique. Comment peut-on démontrer mathématiquement une proposition qui porte sur des mesures du monde "réel" ?

    Pilz, tu as tout à fait raison, pour ma défense je vais invoquer l'heure tardive et la canicule.
  • En fait Guimauve, pour avoir lu vite fait l' article de Wikipédia tout cela semble avoir un réel fondement mathématiques, mais comme tu t' en doutes il faut quand même une hypothèse sur les nombres que l' on regarde : la plage de nombres doit être assez vaste ( si l' on regarde les poids dans une population en kg le chiffres de tête le plus fréquent ne sera bien sûr pas le $1$.) et il doit y avoir une sorte d' hypothèse d' équirépartition logarithmique ( tout cela est très bien expliquer dans Wiki ).

    Sinon c'est vrai que comme toi j' ai trouvé cela très surprenant au début et je croyais aussi que c'était un truc empirique.
  • moi ce qui me fascine c'est la remarque de wikipédia :

    "La loi de Benford est utilisée aux États-Unis, ainsi que dans d'autres pays, dont la France, pour détecter des fraudes fiscales, suite aux idées exposées en 1972 par Hal Varian."

    maintenant, pour frauder, il faudra donner des listings de chiffres "à peu près cohérents" avec la loi de benford.

    ( on voit bien le genre du type qui, face à son pavé numérique, commence chacune des valeurs qu'il invente par un chiffre distinct ).

    quelqu'un en sait plus à ce sujet ? ça me plait énormément.
  • par rapport aux fraudes, il y a trop de 6 et plus assez de 1

    mais ça, c'est de la psychologie ....
  • Pilz: comme dit Borde, le plus simple pour calculer $d_{\rm an}(A_k)$ est de voir que ça coïncide avec la densité logarithmique :
    $$d_{\rm log}(A_k) = \lim_{N\to\infty} \frac{\sum_{n\in A_k \cap \{1,\dots,N\}} 1/n}{\sum_{n\leq N} 1/n}$$
    qui en l'occurrence se calcule facilement. Il suffit essentiellement de découper la somme au numérateur en tranches entre $10^j$ et $10^{j+1}-1$, de voir qu'elle s'écrit comme différence de deux termes de la série harmonique, et d'utiliser le développement asymptotique de cette dernière. Contrairement à ce qui se passe pour la densité naturelle, cette fois-ci, la limsup et la liminf coïncident bien, et donc la densité logarithmique ainsi que la densité analytique existent bien.
Connectez-vous ou Inscrivez-vous pour répondre.