Médiane pour classes-intervalles (lycée)

Bonjour
Une série a un effectif total fini égal à n.
Y a-t-il une formule, une théorie qui unifie les deux calculs tentants pour cette médiane, suivant que les données sont :
1) rangées par valeurs : on va s'orienter vers le rang (n+1)/2, non ?
2) rangées par intervalles : on va interpoler à partir de y = n / 2 ?

Si la réponse est non, d'où vient le fait que ces deux définitions de la médianes soient irréconciliables : de la part de continuité introduite dans l'affaire par la notion d'intervalle ?

Exemple. Série basique de 3 données, avec divers ECC, et une médiane calculée selon (2) qui semble plus fréquemment utilisé.
"(1)" aurait donné $Q2\approx 6,67$ pour les ECC 0;3. Pourquoi serait-ce moins raisonnable que 6 ?
Cordialement,
Swingmustard100644

Réponses

  • Vaste question.

    d'où vient le fait que ces deux définitions de la médianes soient irréconciliables

    Tu travailles avec deux modèles, l'un est discret, a priori exact dans la mesure où tes valeurs sont exactes. Le second est approché et suppose une répartition homogène dans chaque classe. Il donne donc une valeur approchée.

    Maintenant les statisticiens ne font pas des maths. Ils s'en servent. Ils travaillent avec des gros effectifs - contrairement aux profs de lycée - donc ils se fichent pas mal d'avoir deux résultats différents. Pas trop quand même.

    Même chose avec les quartiles- educnat contre les quartiles-tableur. Deux résultats différents. Et alors ?

    Ai-je répondu ?

    Bon dimanche.

    e.v.
    Personne n'a raison contre un enfant qui pleure.


  • Merci, j'avais un pressentiment dans ce sens, qui semble être "ça dépend".

    OK pour la distinction "discret donc exact, vs soumis à hypothèse donc approché".

    Le tout est que deux personnes qui calculent des quantiles sur une même série sachent que si elles veulent s'assurer d'obtenir un même résultat, elles ont intérêt à préciser leur méthode commune.

    "Irréconciliables" dans le sens que, si les deux personnes ont utilisé chacune sa définition, je ne saurais même pas trop dire à (1) "fais telle ou telle opération sur ton résultat, le nouveau résultat coïncidera avec (2)".
    Je me suis d'ailleurs trouvé dans la situation (1), avant de réaliser que (2) semblait répandu. Bref j'ai recalculé mes trois quartiles en redémarrant à zéro.

    Une autre question me vient à l'esprit : est-on au moins sûr de tomber dans le même "intervalle médian", avant l'interpolation ? Ce n'est pas pour chercher la petite bête. Si la réponse était oui, on pourrait dire que ça crée un terrain d'entente...

    Je vais voir, et suis preneur si quelqu'un a ça sous la main. Merci e.v. !
  • Il faut savoir de quoi on (les deux personnes) dispose.

    Si on dispose de la série discrète complète, on y va avec la méthode discrète. De nos jours, on a les moyens de calculer ça.

    Si on ne dispose que de la série répartie en classes, on a perdu de l'information par rapport à la série discrète. ( mais on y voit plus clair sur un graphique, c'est une autre histoire)

    Donc si une personne travaille sur la série discrète et pas l'autre, il y en a une qui cache des choses (de l'information) à l'autre. Non ?

    e.v.
    Personne n'a raison contre un enfant qui pleure.


  • Attention,

    la médiane de la série "par classes" dépend d'autant plus fortement du choix des bornes de classes que ces classes sont larges. Si les bornes sont mal choisies, elle peut être très loin de la vraie médiane.

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.