Exercice de probabilités
dans Statistiques
Bonjour j'aurais besoin d'un petit coup de pouce.
J'ai fait un peu de stat il y a longtemps mais j'ai oublié pas mal de choses...
Il y a 60 000 000 de français.
Sur ces 60 000 000 il y a 4 000 personnes mortes du virus.
Il y 300 étudiants dans une université.
Pourriez-vous m'aider à calculer la probabilité qu'un étudiant ait un de ses deux parents morts svp ?
Je vous remercie d'avance !!!
J'ai fait un peu de stat il y a longtemps mais j'ai oublié pas mal de choses...
Il y a 60 000 000 de français.
Sur ces 60 000 000 il y a 4 000 personnes mortes du virus.
Il y 300 étudiants dans une université.
Pourriez-vous m'aider à calculer la probabilité qu'un étudiant ait un de ses deux parents morts svp ?
Je vous remercie d'avance !!!
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Le sujet est effectivement très mal choisi. Mais le problème est aussi mal posé car on ne sait pas quelle part des étudiants sont frères ou sœurs.
Mais qu'il s'agit d'une question 'personnelle' que se pose Delloway.
Faisons quelques impasses.
4000 victimes sur une population de 60000000, ça fait une proportion de 4/60000.
On a 300 étudiants, donc 600 parents.
Grosse impasse : La probabilité demandée est : 600*4/60000=4%
Quelles sont les impasses ?
- Le dernier calcul, la vraie formule est plus compliquée que ça, mais comme la proportion 4/60000 est très faible, l'impact est mineur. En vrai, la bonne formule donnerait un résultat un peu plus faible.
- impasse n°2 : je dis que si on a 300 étudiants, on a 600 parents ... en fait c'est un peu moins, certains étudiants n'ont pas leurs 2 parents, et il peut y avoir 2 étudiants qui sont frères ou soeurs.
- impasse n°3 : c'est la plus importante. On parle d'une maladie qui tue 4000 personnes sur une population de 60 000 000 de personnes.
Si cette maladie ne tuait que des enfants, la réponse à la question serait évidente ... la maladie ne tue que des enfants, donc elle ne peut pas tuer des parents d'étudiants.
Or cette maladie tue essentiellement des adultes. L'information de départ, et qui nous est utile, ce n'est donc pas : une maladie tue 4000 personnes sur une population de 60 000 000 de personnes.
Mais :
Une maladie tue 3700 personnes sur une population d'environ 30 000 000 d'adultes de plus de 40 ans.
Si on part sur cette hypothèse, on arrive donc très grossièrement à 600*3700/30000000=7.4%
Le bon résultat doit être quelque part entre ces 2 chiffres 4% et 7.4%.
4% est clairement sous-évalué.
7.4% est sur-évalué, parce qu'il faudrait les chiffres sur les adultes de 40 à 65 ans, et pas les chiffres sur les adultes de plus de 40 ans.
Il ne faut jamais faire de probabilités sur des cas concrets réels, la vie n'est pas une épreuve probabiliste.
Non je ne suis pas prof de maths, c'est un problème personnel. Et désolé si j'ai pu en heurter certains, si les termes du sujet vous gênent vous pouvez les remplacer par des variables...
C'était pour l'unversité de Lille.
Avec hypothèse de départ qu'il n'y a pas de frère et soeur parmi les élèves.
Merci Lourran !!!
: )
Portez-vous bien et prenez bien soin de vous et de vos proches.
Il ne faut pas être prisonnier de son savoir.
Par ailleurs il a additionné les deux parents sans que je comprenne vraiment pourquoi... En fait il a plutot calculé l'espérance du nombre de parents morts sur toute la population des étudiants. Bref, rien à voir avec la question.
La question était un peu ambigue : quelle est la probabilité qu'un étudiant ait un de ses deux parents morts svp
Comment comprendre cette question :
- interprétation n°1 ; je prends un étudiant au hasard, et quelle est la probabilité que cet étudiant précis ait 1 de ces 2 parents qui décède de cette maladie.
Dans ce cas, le nombre '300 étudiants' ne sert à rien.
- interprétation n°2 : la question est : quelle est la probabilité qu'un étudiant au moins ait un de ses deux parents morts svp
J'ai considéré que c'était ça la question, et je suis très confiant, il suffit de se dire que ce n'est pas un exercice de maths, mais une question de la vraie vie pour arriver à cette conclusion. Savoir sortir de son livre de maths.
Et dans le calcul, je l'ai dit et redit, j'ai fait pas mal d'approximations.
Ici, le bon calcul aurait été :
- Etape 1 : calcul de la probabilité inverse : quelle est la probabilité qu'aucun des 600 adultes en question ne décède : $P = p^{600}$ avec $p = 1 - \frac{4000}{60000000} $
- Etape 2 : on calcule le complément à 1 du résultat précédent.
J'avais donné un résultat de 4%, en disant que la vraie valeur était un peu inférieure. Effectivement, le calcul précis donne 3.9212%.Je me suis permis l'approximation, parce que je savais que l'écart serait faible. Le calcul précis le confirme, l'écart est négligeable.
Dans un exercice de maths, mon calcul était faux. J'en suis conscient, et je l'avais écrit. Dans la vraie vie, et donc dans le contexte de la question de Delloway, le résultat est parfait.
Ce n'est pas de la mauvaise foi, c'est du bon sens paysan, ce qui manque visiblement à certaines personnes.
PS : Dans l'étape 1 du calcul ci-dessus, il y a encore une approximation. Je le dis moi-même ... avant qu'on ne vienne me dire que je me suis encore trompé. Au lieu de $P = (1-\frac{4000}{60000000})^{600}$ , il faudrait faire :
$P=(1-\frac{4000}{60000000})(1-\frac{4000}{59999999})(1-\frac{4000}{59999998}) ... (1-\frac{4000}{59999601})$ Mais la différence avec le calcul précédent est encore plus négligeable que les autres approximations effectuées.
Tu as oublié une donnée fondamentale : Nettement plus de la moitié des morts du covid-19 n'étaient plus des parents d'étudiants, mais des grands parents d'étudiants (voire des arrière grands parents). La population des parents a une mortalité bien inférieure à la moyenne (en général, ils ont la quarantaine).
Et bien évidemment, le résultat est différent suivant les régions.
Cordialement.
J'avais griffonné un calcul au brouillon : 4000 décès sur une population de 60 Millions,c'est incomplet comme information. Et j'avais vaguement estimé le nombre de décès dans la tranche 40-65ans, ainsi que la population totale dans cette tranche d'âge. Mais j'arrivais à peu près aux mêmes proportions. Pas très 'pédagogique'. (Mais à peu près aligné sur la population totale)
C'est pour ça que dans mon premier message, j'avais pris comme 2ème point de référence une population de tous les adultes de plus de 40 ans. (donc parents et grands parents d'étudiants, effectivement). Et c'est sur cette base que j'obtenais l'autre chiffre, de l'ordre de 7%.
Ce n'est ni une probabilité ni un pourcentage...
Le développement limité $1- (1-\epsilon)^n = n \epsilon $ ; c'est peut-être un raccourci un peu rapide, il faut que je ré-explique ? Malgré l'explication déjà donnée ?
Cordialement.