Langage mathématique, probas et stats

Je double en ouvrant ce fil un envoi par MP que je vais faire à JL pour que tout le monde en profite (car le fil concerné est un peu parti en vrille).

Je n'ai absolument ni le temps ni le courage de faire long. Pour plus de détails, je rappelle que foys s'est opposé à moi dans un petit débat philosophique et une recherche google (ou plus tard, je remettrai un lien) permet d'accéder à de nombreux échanges sans avoir besoin d'aller conseiller des livres ou des docs extérieurs (foys a tout reprouvé et recalculé lors de ces échanges).

En particulier, foys comme moi, malgré notre désaccord, avons "jeté aux orties" les appellations snobs du style "philosophie bayésienne, approche fréquentiste", et autres expressions grandiloquentes qui ne servent qu'à "vendre" ou "intimider"

J'interviens juste pour signaler des faits courants incorrects, mais pratiqués. Je ne prends qu'un exemple, mais les exemples sont nombreux. La plupart des chercheurs (et qui n'ont aucune chance d'être suspects d'incompétence :-D ) ne s'embarassent pas, mais vraiment pas, de précaution quand ils disent que le célèbre algo non déterministe atteste que tel ou tel très grand nombre (de 10000 chiffres par exemple) est "probablement premier". Ils ne disent pas "est risquement premier" (ou "nonrsiquement non premier) tout simplement parce que le français n'offre pas ce mot


Ce qui me fait venir à ma première remarque (il n'y en aura que deux):

1/ Je cite Yves: Yves citant JL: la probabilité que m se trouve dans l’intervalle. C’est une erreur GRAVE.

Yves a parfaitement raison sur le fait que c'est une erreur, mais a tort de dire qu'elle est grave. C'EST UNE ERREUR, c'est tout.
Pour justifier qu'elle est grave il faudrait trouver des situations où des matheux, (j'insiste des matheux ayant une démarche mathématique) se prendraient les pieds dans le tapis en la faisant. Or.... ça n'existe tout simplement pas. Ce qu'on trouve, ce sont des non matheux qui se prennent les pieds dans le tapis en la faisant. Certes, mais croyez-vous un instant que lesdits nonmatheux ont attendu de faire cette erreur pour se ratatiner??? Et bien la réponse est évidemment non, ils se sont ratétinés plein de fois avant et ils se ratatinent une 1306874ième fois en la faisant. Bon, bin.... c'était grave avant et rien de fonde le mot grave à propos de cette erreur.

Je vais illsutrer ça de manière simple (et attention, je ne dis pas que JL n'est pas matheux, il a pris toutes les précautions essentielles pour dire qu'il parlait de sentiments:

2/ Je cite JL: JL: Avant le tirage de X, "m" a été posé en tant que paramètre, et l'écart entre "m" et X suit une distribution LG(0,1). Le "tirage" a donné x=10 et comme c'est la seule info que j'ai, j'ai très envie de dire qu'il y a plus de chance d'avoir "m" à ±1 de la valeur 10. Franchement c'est humain ! et du coup, j'ai aussi très envie d'associer une distribution à "m" (qui n'en avait pas avant le tirage, on est d'accord).

J'ai mis des couleurs: le vert est "correct" (on n'est pas vraiment en maths), et le marron est fautif. Point barre. D'où la réaction assez vive de Yves. Mais encore une fois attention: JL est parfaitement conscient et il le dit, qu'il ne fait pas des maths, et il constate qu'un truc modéré qu'il fait est "humain" (dit-il) et que quand on pousse le bouchon, (et JL le dit lui-même ce n'est plus du tout humain), ca foire.

Pas besoin non plus de parler de stats pour avoir ça.

J'en reviens pour terminer aux intervalles de confiance: on sait que 97% des enveloppes contiennent la bonne réponse. On n'a pas encore tiré d'enveloppe. On dit "il y a une proba de 0.97 de tirer une enveloppe qui contient la bonne réponse***". Tout le monde est content. L'heure tourne, on tire (équiprobablement) une enveloppé, on l'ouvre et le nombre 59 sort.

Le mec qui dit "j'ai une proba de 0.97 qu'il y ait 59 planètes autour de Pastilla". Il se fait étriper pour tous les statisticiens présents à sa table car le nombre de planètes autour de Pastilla n'est pas tiré au sort, c'est l'enveloppe qui l'a été (au passé). Et bien moi, je pense qu'ils ont raison, mais à la condition de bien préciser pourquoi ils ont raison, parce que sinon, on n'en finit pas.

Ils ont raison pour un seul et unique motif pédagogique. Et oui, pédagogique. Ils savent et ont raison que s'ils laissent perdurer avec cette façon de parler le mec en question, ils ne parviendront jamais à lui enseigner les stats. Et ils ont raison, j'insiste bien, mais il n'y a nulle science la dedans. La seule chose que la science vous dit c'est qu'il y a 0.97 d'avoir une enveloppe qui donne le bon nombre de planètes (enfin c'est l'hypothèse que j'ai faite). Il n'y a JAMAIS de tirage au sort et la phrase est éternellement au présent (par défaut, il n'y a pas de temps).

Si on veut aller plus loin , il faut alors préciser si on s'assoit pour faire de la philo, ou si on veut qu'une cohorte d'étudiants obtienne son M2 de stats (qui ne sont que partiellement validées par les maths). Selon que c'est la première ou la deuxième option, les façons de discuter seront PARFAITEMENT INCOMPATIBLES. Il n'existe pas dans les maths de quoi fonder qui a raison de celui qui dit que le nombre de planètes est déterminé plutôt que celui qui dit qu'il ne l'est pas.


*** qui est disons le nombre de planètes qui tournent autour de Pastilla du Centaure
Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi

Réponses

  • Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • christophe c a écrit:
    En particulier, foys comme moi, malgré notre désaccord, avons "jeté aux orties" les appellations snobs du style "philosophie bayésienne, approche fréquentiste", et autres expressions grandiloquentes qui ne servent qu'à "vendre" ou "intimider"

    Il y a un théorème de De Finetti qui valide la démarche bayésienne (google! mais il faut mettre les mains dans le cambouis pour voir de quoi il s'agit vraiment, dans ces questions le handwaving se substitue trop facilement aux développements techniques propres).
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Le monde déterministe ne contient aucun phénomène "d'essence aléatoire" mais le but des probas classiques n'est pas de décrire de tels prétendus phénomènes, mais de dire que certaines parties de l'ensemble des possibles sont petites voire carrément minuscules (ceci relève exclusivement de la théorie de la mesure), de donner des méthodes pour décorer un événement avec un nombre ("il a 30% de chances de se produire") et d'epliquer comment et en quoi ce choix peut être fait pour faire des prédictions pertinentes (comment chiffrer son ignorance le plus intelligemment possible? C'est ce que paradigme bayésien proposede faire).

    Il ne faut jamais perdre de vue qu'un énoncé comme "si $A= \{\omega \in \Omega \mid \sum_{k=1}^n X_k > n(m+\rho)\}$$P(A)\leq K\exp(-n\rho)$" n'est rien d'autre qu'une reformulation imagée de "$\nu_n \left (\{x \in \R^n \mid \sum_{k=1}^n x_k > n(m+\rho)\} \right ) \leq K\exp(-n\rho)$" où $\nu_n$ est une mesure de Radon sur $\R^n$ (lorsque cette mesure est une mesure produit on parle "d'indépendance". Le choix de $\nu_n$ est guidé par des choix extérieurs aux maths, ou par des considérations de symétrie).

    Bref on peut dire que $\Omega = \R^n$ ($\R^{\N}$ s'il y a une infinité de "variables aléatoires") et que $X_k$ est la $k$-ième projection.
    Cependant les gens préfèrent envisager que $X_k$ désigne un "objet variable" (une sorte de réel qui "bouge"; peu importe ce que ça veut dire). C'est une fable qui engendre beaucoup de mauvaise philo si on la prend au sérieux mais qui sert à faciliter la lecture et l'assimilation intuitive des énoncés.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Merci d'avoir précisé les choses et fait mon travail (j'avais ouvert le fil donc il aurait été bien que ce soit à moi de donner des précisions techniques). Mais heureusement tu es là et a mieux précisé les choses que je ne l'aurais fait.
    Aide les autres comme toi-même car ils sont toi, ils sont vraiment toi
  • @Foys : Peux-tu pointer vers des liens où la relation De Finetti-démarche bayésienne est, à ton goût, bien discutée ?
    J'ai trouvé ce lien stackexchange mais n'y ai pas tout compris. En fait, j'ai peut-être besoin d'un texte qui détaille proprement et mathématiquement les enjeux philosophiques des différents "modes de pensée" statistiques.
Connectez-vous ou Inscrivez-vous pour répondre.