Parité et mauvaise répartition ?

Est-ce qu'une parité "forcée" permet de rectifier une mauvaise répartition ?

Soit m boules numérotées de 1 à m, r boules sont rouges, n sont noire. Je prends au hasard t boules rouges (t<=min(r,n)), et t boules noires.
Application : j'ai un déséquilibre de répartition homme/femme dans une catégorie. En tant qu'employeur, je décide de forcer la parité dans mon entreprise en prenant toujours le même nombre de femmes et d'hommes de cette catégorie. On suppose que la population peut être ordonnée dans cette catégorie du meilleur au moins bon, indépendamment de homme/femme.

Problème 1 : Quelle est la probabilité p1 pour que la boule ayant le plus petit numéro soit rouge ?
Application : si 30% des 100 polytechniciens entre 25 et 50 ans sont des femmes, Si je prends 2 hommes et 2 femmes polytechniciens, quelle probabilité que le meilleur des 4 soit une femme ?

Problème 2 : Quelle est la probabilité p2 pour que la boule numéro 1 soit dans les t boules noires et t boules rouges ?
Application sociale : si 40% des médecins sont des hommes. Si je prends deux médecins hommes et deux médecins femmes, est-ce que j'ai moins de chance de tomber sur le meilleur que si je tirais au hasard indépendamment de femme/homme ?

Exemple 3 : une fois ce premier tirage effectué avec parité, je recommence un nouveau tirage sans avoir remis les boules précédemment tirées. Comment évoluent les probabilités des problème 1 & 2. Note : la parité ne sera plus possible à partir d'un certain nombre de tirages q ...
Application : que se passe-t-il pour les autres entreprises qui veulent elles aussi appliquer la parité ?

Réponses

  • Ça ressemble beaucoup à un exercice scolaire. On ne va donc pas te donner des réponses toutes faites, ne serait-ce que par solidarité avec notre collègue professeur qui t'a soumis cet exercice.

    Normalement, tu as répondu aux questions 1 et 2 sans difficulté. Peux-tu juste partager ce que tu as trouvé pour ces 2 questions, pour valider si c'est bon, et les pistes que tu envisages pour la question 3.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • A 56 ans, je n'ai plus de professeur de mathématiques :)o
    J'ai juste la curiosité dune démonstration simple et rigoureuse à un problème qui devient polémique si il reste en "discussion de comptoir". J'ai une petite idée des réponses, mais je ne suis pas assez matheux pour en apporter une démonstration rigoureuse et irréfutable...
  • Bonjour,

    Si tu gardes cette hypothèse de "Le classement est indépendant de la couleur de la boule" alors les réponses sont assez claires :

    Problème 1) : $\frac{r}{r+n}$

    Problème 2) : $\frac{2t}{r+n}$

    Problème 3) : Les classements dans chaque tirage ont tous même distribution. En particulier, chaque entreprise a la même probabilité ($2t/(r+n)$ donc) d'avoir le-la meilleur(e). Par contre les tirages ne sont pas indépendants bien sûr puisqu'une seule entreprise a le-la meilleur(e).

    Pour prouver tout ça il faut revenir aux définitions. Tu es face à des variables aléatoires $X_1,\dots,X_r,Y_1,\dots,Y_n$ qui sont indépendantes et identiquement distribuées (ce sont les "valeurs" des canditat-e-s). Pour le problème 1) par exemple tu es en train de calculer
    $$
    \mathbb{P}(\exists i, X_i < \min\{ X_j, j\neq i,Y_k\}) = \sum_i \mathbb{P}( X_i < \min\{ X_j, j\neq i,Y_k\}) =r\times(1/(r+n))
    $$
  • problème 1) la probabilité que la boule rouge soit la première serait indépendante du fait qu'on tire un nombre égal de boules t noires et rouges (alors qu'il n'y a pas forcément le même nombre de boules rouges r et noires n ) ?
  • Problème 1 : on tire 4 boules dont 2 rouges et 2 noires...
    Dans l'urne rouge, les boules sont numérotées aléatoirement entre 1 et 1000 ; dans l'urne noire aussi.

    On va changer un peu la question :
    Au lieu de choisir 2 hommes et 2 femmes, on choisit 1 homme et 1 femme, c'est plus simple.
    Quelle est la probabilité que l'homme choisi ait un n° plus petit que la femme ? je ne sais pas, vu qu'il y a plus d'hommes que de femmes en tout, ce n'est pas simple. disons que la probabilité vaut X.
    Quelle est la probabilité que l'homme choisi ait un n° plus grand que la femme ? Je ne sais pas non plus, mais par symétrie, c'est le même nombre que précédemment, c'est également X
    Et on est forcément dans le cas 1 ou dans le cas 2. Donc X+X = 1.
    Donc X=50%

    Donc, à partir du moment où on choisit autant d'hommes que de femmes, la probabilité que le plus petit n° soit un homme ne dépend pas du nombre d'hommes ou de femmes en tout, et cette probabilité est 50%

    MAIS
    Si on applique cela à la question des polytechniciens par exemple, ça ne marche plus du tout.
    Les calculs sont compliqués, je pense même qu'on n'a pas tous les éléments pour les faire. Et si on prend 2 polytechniciens hommes et 2 femmes au hasard, la probabilité que le mieux classé soit une femme est clairement inférieure à 50%.

    Pourquoi ça marche dans le cas du début, et ça ne marche pas dans le cas des polytechniciens.
    Dans le cas du début, j'ai commencé en disant : Dans l'urne rouge, les boules sont numérotées aléatoirement entre 1 et 1000 ; dans l'urne noire aussi.
    C'était la condition qui permettait de faire quelques calculs.
    Dans le cas des polytechniciens, cette condition n'est pas respectée ; la numérotation n'est pas aléatoire.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • > la probabilité que la boule rouge soit la première serait indépendante
    > du fait qu'on tire un nombre égal de boules t noires et rouges

    Ah pardon, je pense que j'ai mal interprété le problème 1 (pourtant l'exemple était clair effectivement). Alors la réponse est tout bêtement $1/2$.
  • Problème 1 :
    @lucas : il me semble en effet que c'est 1/2. J'ai une approche de ce 1/2 avec une simulation sous Excel.
    Quand à "tout bêtement" cela me semble peu mathématique comme démonstration... Si on prend le problème par le bon bout, cela me semble facilement démontrable (reste à faire de façon évidente , simple et indiscutable, pour montrer que c'est indépendant de la répartition initiale). Si on prend le problème par le mauvais bout, c'est insolvable.
    Ça me rappelle la polémique du jeu avec les 3 portes : j'en choisis une , on me montre une autre porte incorrecte. Faut-il changer de porte ... La réponse est évidente (ou non selon certains). La démonstration claire et précise et irréfutable : un peu plus difficile. La simulation suos calculateur est facile. Une indication "par la limite" aide beaucoup (milles portes).
    Il y a toujours des cailloux dans les choses'sures ...
    @lourran : il n'y a qu'une seule urne, contenant r boules rouges et n noires, ordonnées de 1 à r+n, de façon aléatoire indépendamment de la couleur, pouvant s'imager à un classement supposé homogéne d'une classe d'élèves?

    Intérêt du problème : cela correspond au cas "Arkema" qui a fait beaucoup couler d'encre, avec livre.
    Ils on appliqué le problème 1 sur leur haut staff de polytechnicien, et ont obtenu une probabilité finale de femme dans les plus haut postes très inférieure à 1/2 après application de la parité (avec un nombre de mesures très faibles non représentatif bien sûr). Sans démonstration sur cette probabilité 1/2, et sans justification de la non représentativité des mesures, il y a eu des discours sociologiques très bien pensant qui remplissent des livres. J'aurai au moins aimé avoir une preuve indubitable (et très simple à mon avis), que la parité appliquée à la présélection permet d'éliminer la disparité initiale. Ce qui est contraire à un postulat intuitif "sheet-in sheet-out" : si on a une mauvaise répartition, il est difficile de la corriger... D'où le problème 1 générique.

    Quid du problème 2 et du problème 3 ?
  • Une urne avec des boules rouges et noires, ou bien 2 urnes différentes (une avec les boules rouges et une avec les boules noires), c'est pareil, vu qu'on a décidé de regarder dans l'urne, et de prendre PRECISEMENT 2 rouges et 2 noires.

    "La parité appliquée à la préselection permet d'éliminer la disparité initiale" : Non. Elle élimine la disparité sur le périmètre 'Total', mais pas sur le sous-périmètre 'Elite'.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • > Quand à "tout bêtement" cela me semble peu mathématique comme démonstration...

    J'ai dit que la réponse était tout bêtement $1/2$, pas la preuve... ;-)

    A partir de la modélisation que j'ai écrite plus haut tu peux en fait écrire une preuve convaincante pas si longue.
  • Tentative de "démonstration" (je ne suis pas mathématicien).

    Problème (1) :
    On affecte un nombre réel aléatoire à chacune des r boules rouges et n noires. Chaque tirage de nombre réel est indépendant des autres, et génère une nombre réel toujours différent (la probabilité d'avoir deux nombre réels égaux est considérée négligeable).
    Je tire t boules rouges et t boules noires. Le nombre réel affecté à chacune des 2*t boules sont indépendants et aléatoires. chacune des 2*t boules à une probabilité 1/(2*t) d'être le plus petit réel.
    Après parité forcée, il y a une chance sur 2 d'avoir une boule rouge ou une boule noire en tête des 2*t sélectionnées.
    La disparité initiale a été effacée par la parité forcée
    .
  • Vérification par algorithme sur 100000 tirages aléatoire :

    nb candidat retenu par couleur t=2

    en tirant 2*t boules au hasard (indépendamment de leur couleur)
    La probabilité d'avoir le premier : p=2*t/(r+n)=0,04
    en tirant t boules rouges et t boules noires
    La probabilité d'avoir une boule noire en tête p1 = 0,5 (indépendant de la mauvaise répartition)


    nombre de boules rouges : r=80
    nombre de boules noires : n=20
    p1=0,50157
    p2=0,03906

    nombre de boules rouges : r=40
    nombre de boules noires : n=60
    p1=0,50324
    p2=0,03989

    Code en python.
    import random
    import operator
    
    class boule:
        def __init__(self, couleur):
            self.note = random.random()
            self.tirage = random.random()
            self.couleur = couleur
    
    class urnes:
        def __init__(self, nbNoir, nbRouge):
            self.boules = []
            for i in range(nbNoir):
                self.boules.append(boule("n"))
            for i in range(nbRouge):
                self.boules.append(boule("r"))
            self.boules.sort(key=operator.attrgetter('note'))
            rang = 0
            for b in self.boules:
                b.rang = rang
                rang = rang + 1
            self.boules.sort(key=operator.attrgetter('couleur', 'tirage'))
    
    nbNoir = 40
    nbRouge = 60
    nbSelectionne = 2
    nbNoirPremier = 0
    nbPremierSelectionne = 0
    nbTirage = 100000
    for tirage in range(nbTirage):
        murnes = urnes(nbNoir, nbRouge)
        ## print("=====")
        meilleur = 10000
        noirMeilleur = 0
        for c in ["n", "r"]:
            nrSelection = 0
            for b in murnes.boules:
                if c == b.couleur:
                    if nrSelection < nbSelectionne:
                        # print(b.couleur, b.rang)
                        if b.rang == 0:
                            nbPremierSelectionne = nbPremierSelectionne + 1
                        if b.rang < meilleur:
                            if c == "n" :
                                noirMeilleur = 1
                            else :
                                noirMeilleur = 0
                            meilleur = b.rang
                    nrSelection = nrSelection + 1
        nbNoirPremier = nbNoirPremier + noirMeilleur
    print("nbNoirPremier", nbNoirPremier)
    print("nbPremierSelectionne", nbPremierSelectionne)
    
  • Qu'est-ce que c'est que cette habitude de vérifier des démonstrations avec une simulation informatique ? Tu vas avoir une grande surprise un jour.
    Cordialement.
  • frevolle écrivait:

    > Soit m boules numérotées de 1 à m, r boules sont rouges, n sont noires. Je tire 4 boules au hasard.
    > Problème 1 : Quelle est la probabilité p1 pour que la boule ayant le plus petit numéro soit rouge ?
    > Application : si 30% des 100 polytechniciens entre 25 et 50 ans sont des femmes, Si je prends 2 hommes et 2 femmes polytechniciens, quelle probabilité que le meilleur des 4 soit une femme ?

    Le problème 1 est simple, la probabilité est de 50%, la simulation le confirme.
    Mais au risque de me répéter, attention, la suite de la phrase parle d'application concrète, alors que la question sur les polytechniciens n'a rien à voir avec la simulation faite sur les boules rouges et noires. Mais alors vraiment rien à voir.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • > Qu'est-ce que c'est que cette habitude de vérifier
    > des démonstrations avec une simulation informatique ?

    Ca me paraît au contraire une démarche tout à fait raisonnable. Je suis chercheur en Probas et quand je travaille sur un problème je fais des simulations tout au long du processus de recherche, ça aide à comprendre les maths (et sur le problème dont on parle dans ce fil ça évite de dire des bêtises).

    Par ailleurs tu ne sembles pas avoir perçu que frevolle n'est pas un élève de 4ème...
  • lourrran écrivait : http://www.les-mathematiques.net/phorum/read.php?13,1859772,1863410#msg-1863410
    [Inutile de recopier l'avant dernier message. Un lien suffit. AD]
    Le problème 1 est simple, c'est vrai, mais me surprend par sa simplicité ... Je pense que la démonstration est à peu près juste.
    Si vous considérez que mon application avec les polytechniciens est fausse, pourriez-vous reformuler ?
    Je reformule.
    J'ai 6 femmes et 14 hommes polytechniciens disponibles. Ils ont un classement du meilleur au moins bon de 1 à 20.
    J'en sélectionne 4 au hasard : 2 polytechniciennes et 2 polytechniciens pour avoir une parité.
    Quelle est la probabilité pour que le classement du meilleur des 4 soi une femme ?
  • Je vais reformuler ce problème de façon un peu différente.

    Dans ma commune, j'ai convoqué toutes les personnes de plus d'1m75. Elles sont toutes devant moi, Il y a 6 femmes et 14 hommes. Les 6 femmes mesurent entre 1m76 et 1m79, et parmi les 14 hommes , 3 mesurent 1m77 ou 1m78 et les autres mesurent plus de 1m80.

    Je prends 2 femmes et 2 hommes au hasard dans ce groupe, quelle est la probabilité que le plus grand parmi ces 4 personnes soit un homme : disons 98%, je n'ai pas le courage de faire les calculs précis (et pas toutes les infos nécessaires non plus).

    Par ailleurs, les 20 personnes en question ont toutes un n°. Ce n° a été attribué au hasard. Parmi les 4 personnes en question, quelle est la probabilité que celle qui a le plus grand n° soit un homme : la probabilité est de 50%.

    Dans le cas des polytechniciens, est-on proche du cas n°1 (personnes classées selon la taille), ou du cas n°2 (personnes classées au hasard)
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Euh non...
    Je suppose que le classement du meilleur au dernier n'est pas dépendant de H/F, car l'intelligence est indépendante de H/F, contrairement à la taille. Cest donc le deuxième cas que vous citez.
  • Je ne sais pas si l'inteligence est indépendante de H/F.
    Je ne sais pas non plus si le classement à Polytechnique est une mesure de l'intelligence.
    Mais il me semble que sur 400 polytechnicens, il y a en gros 80 femmes et 320 hommes.
    Et donc, le classement à Polytechnique doit mesurer une capacité qui n'est pas l'intelligence, et sur cette capacité-là, les hommes semblent plus performants que les femmes.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Ceci est un autre débat.
    Je voulais comprendre si une parité forcée était ou non efficace, basé une mauvaise répartition numéraire, avec une répartition homogène de compétence. (cas "Arkema" très médiatisé situé plus haut)
    Sous réserve de ces conditions, je me suis auto-répondu avec une petite démonstration qui me semble juste (à ma sauce), qui allait à l'encontre de mon intuition immédiate. J'ai "vérifié" avec une simulation à l'ordinateur. Je n'ai pas eu de commentaires pour savoir si mes calculs et démonstrations étaient justes (dommage pour un forum de mathématiques..)
    Si on considère que la répartition n'est pas homogène pour les compétences (pour la notation des boules rouges et noires indépendamment de leur couleur) : cela remet bien sûr tout en cause (le calcul, mais aussi les actions de parité, et tous les débats sociaux).
    Le débat sur la répartition homogène des compétences H/F est un peu hors-sujet sur un ce fil. Pourquoi plus de H en filiaires techniques (ce qu'on essaie de rectifier avec des lois, et de la parité obligée, ..). Pourquoi plus de F en médecine, droit, éducation (sujet ignoré). Tout un débat à discuter sur des forums sociaux.
  • Frevolle,

    si personne ne te tombe dessus pour dénoncer une erreur dans ta preuve, c'est généralement qu'elle est bonne. Mais à condition qu'elle soit bien mathématisée. Si elle comporte des affirmations qui ne sont pas dans l'énoncé, on ne peut plus savoir.
    Comme j'ai regardé de très loin ce sujet, je ne me prononcerai pas, je ne sais d'ailleurs pas trop de quelle preuve tu parles (et preuve de quoi).

    Cordialement.

    NB : je ne comprends pas ce que veut dire "basé une mauvaise répartition numéraire", ni ce que tu appelles "parité forcée" (il y a plusieurs façons de forcer la parité).
  • On affecte un nombre réel aléatoire à chacune des r boules rouges et n noires. Chaque tirage de nombre réel est indépendant des autres, et génère une nombre réel toujours différent (la probabilité d'avoir deux nombre réels égaux est considérée négligeable).
    Donc, quel que soit la façon de tirer des boules noires et rouges, on aura un sous-ensemble de boules noires et rouges avec un nombre réel aléatoire indépendant les uns des autres, avec une probabilité identique pour chaque tirage de tomber sur le premier de l'urne.
    La parité forcée efface donc toute disparité numéraire initiale...

    La simulation s'approche raisonnablement du résultat théorique de 0,5 (autant de chance qu'une boule noire ou rouge soit première du tirage à parité forcée), et 0,04 (autant de chance que le premier soit dans le tirage à parité forcée)
Connectez-vous ou Inscrivez-vous pour répondre.