médiane

Bonjour,
On nous répète sans arrêt que la médiane M d'une série stat est la valeur M telle que AU MOINS 50% des individus ont une valeur du caractère inférieure ou égale à M et AU MOINS 50% des individus ont une valeur du caractère supérieure ou égale à M.
Mais lorsqu'on construit la courbe des fréquences cumulées croissantes et qu'on cherche l'antécédent de 50% qui correspond à la médiane M (sur l'axe des abscisses), on dit qu'il y a 50% des individus qui ont une valeur du caractère inférieure ou égale à M environ pour interpréter des résultats.
Est-ce correct ?
Par exemple, dans un exercice où le caractère est le temps d'attente devant un guichet de poste et où la question de l'exercice (après nous avoir demandé de tracer la courbe des f.c.c.) est la suivante :"pour assurer le bon fonctionnement du bureau, le directeur estime que 75% de la population doit avoir un temps d'attente inférieur à 10 min. Cet objectif est-il atteint ?"
J'ai cherché limage de 10 par la fonction cumulée croissante et j'ai trouvé 66%. Est-il juste d'écrire : "le pourcentage de personnes attendant 10 min ou moins est de 66% donc l'objectif n'est pas atteint."
Merci
Cédric

Réponses

  • Bonsoir Cirdec.

    Tes questions mélangent allègrement séries discrètes et continues.
    Commençons par les séries discrètes :
    "la médiane M d'une série statistique discrète est la [une]valeur M telle que AU MOINS 50% des individus ont une valeur du caractère inférieure ou égale à M et AU MOINS 50% des individus ont une valeur du caractère supérieure ou égale à M. "

    Par exemple dans la série 1,1,2,2,2,3 la médiane est 2, car 5/6 des individus ont une valeur inférieure ou égale à 2 et 2/3 ont une valeur supérieure ou égale à 2.
    Dans la série 1,1,2,3,3,4, la médiane est n'importe quelle valeur x entre 2 et 3, y compris 2 ou 3 (x est tel que [AU MOINS] 50% des individus ont une valeur du caractère inférieure ou égale à x et [AU MOINS] 50% des individus ont une valeur du caractère supérieure ou égale à x).

    Pour une série continue, c'est à dire pour laquelle les données sont rassemblées dans des classes par intervalle, il n'y a pas connaissance des vraies valeurs, et on utilise un principe simple : les valeurs des individus sont réparties dans la classe de façon proportionnelle à l'intervalle. Par exemple, s'il y a 10 individus dans la classe [2;4[, alors il y en a 5 entre 2 et 3, il y en a 1 entre 2 et 2,2 ou encore un entre 2,31 et 3,51. J'exprimais cela à mes élèves en disant qu'on a "étalé" les individus sur toute la largeur de la classe. Cette idée est la traduction de la probabilité à priori uniforme sur la répartition dans la classe.

    Tu parles de "courbe des fréquences cumulées croissantes", ce qui n'a de sens que dans le deuxième cas. Alors, la médiane est la valeur telle que 50% des individus ont une valeur inférieure ou égale et 50% des individus ont une valeur supérieure ou égale; sous-entendu : dans le modèle théorique ci dessus (individus "étalés").
    "on dit qu'il y a 50% des individus qui ont une valeur du caractère inférieure ou égale à M environ pour interpréter des résultats. " Pour moi c'est insuffisant si on ne précise pas que les autres 50% ont une valeur supérieure.

    Pour ton exemple des temps d'attente, je suis d'accord avec l'interprétation. Une autre façon de voir était de calculer le troisième quartile et de voir qu'il était supérieur à 10 mn.

    Cordialement.
    Et si la classe médiane est "très irrégulière" (par exemple presque tous les individus ont une valeur proche d'une des bornes), l'interprétation est fausse, mais c'est normal, on ne le savait pas.
  • Merci beaucoup pour la mise au clair et la distinction entre "discrète" et "continue".
    Une toute petite chose qui me dérange concerne l'exemple d'une série discrète 1 1 2 3 3 4.
    Dans les livres de seconde, il est dit que si il y a 6 valeurs, la médiane est la demi-somme de la troisième et la quatrième valeur, à savoir ici 2,5 (c'est ce qu'affiche d'ailleurs la calculatrice) mais si j'ai bien compris, cette façon de faire n'est pas universelle !
    Cordialement,
    Cédric
  • Bonsoir.

    Ce que tu donnes est la définition "officielle" du programme de seconde (celle qui simplifie la vie des programmeurs). mais pour un statisticien, une série de 6 valeurs (et 4 classes) n'est pas des statistiques. S'il y a peu de classes, la médiane perd de son intérêt.
    Par contre, pour apprendre ça à des élèves de seconde, on est amené à traiter des cas simples, trop simples. Puis à donner une "définition" précise (inutile en statistiques concrètes) pour pouvoir noter (ce n'est pas vraiment obligatoire, j'ai enseigné ça en post bac, et une grande variabilité des résultats des étudiants était possible, en restant raisonnable (arrondis différents). Mais l'ensemble des correcteurs (pourtant tous profs de lycée) était d'accord pour enseigner les statistiques, pas la soumission à une règle.
    Bien évidemment, lorsque l'insee calcule la médiane des salaires en France (1580 € en 2010), non seulement les différents salaires sont très nombreux, mais le 1580 est un arrondi (on trouve souvent 1600) car quelques euros ne changent pas la réflexion sur la question (pour le salarié, c'est différent, évidemment).

    Cordialement.
  • Bonsoir
    Selon les pays on utilise moyenne ou médiane.La moyenne permet des considérations analytiques que ne permet pas la médiane. Elle ne connait pas les acrobaties que signalent les amis. ( suite discrète)
Connectez-vous ou Inscrivez-vous pour répondre.