médiane
dans Statistiques
Bonjour.
Ma question est simple:
Pour la série statistique: 2 - 5 - 7 - 9 - 10 - 13, la médiane peut-elle correspondre au rang N/2 soit ici rang 6/2 = 3. Ce qui ferait Med = 7 au lieu de 8 (moyenne de 7 et 9, communément proposé par les livres et les définitions) ?
Merci
Ma question est simple:
Pour la série statistique: 2 - 5 - 7 - 9 - 10 - 13, la médiane peut-elle correspondre au rang N/2 soit ici rang 6/2 = 3. Ce qui ferait Med = 7 au lieu de 8 (moyenne de 7 et 9, communément proposé par les livres et les définitions) ?
Merci
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
-- Schnoebelen, Philippe
$\frac{7+9}{2}=8$
On peut prendre ce qu'on veut comme valeur dans l'intervalle [7;9]. De toutes façons, la médiane n'a d'intérêt que comme valeur approximative (que la médiane des salaires soit 1226,50 € ou 1227€ ne change rien à la situation des salariés français) sur une série composées de nombreuses valeurs. Même s'il est pratique d'apprendre la notion avec des séries courtes.
Cordialement.
Moi je trouve que la question de "Papa" est tout à fait intéressante. C'est vrai que la solution réside du point de vue pratique en prenant un échantillon impair, mais c'est moche mathématiquement.
Yadollah Dodge et Wonnacott² font aussi le calcul de la moyenne des 2 valeurs au centre de l'échantillon trié par ordre croissant. La raison est la suivante : comme il s'agit d'un échantillon, il est tout à fait concevable avec un échantillon de plus grande taille, que l'on trouve d'autres valeurs comprises en me- et me+, d'où l'utilisation d'une moyenne. Mais, la faiblesse de ce raisonnement provient du fait que si on a affaire à une distribution qui n'est pas symétrique, la moyenne théorique n'est plus égale à la médiane... C'est la raison pour laquelle, je pense que ça serait bien d'avoir un estimateur non biaisé de la médiane.
Et si Wonnacott donne l'expression de la variance dans son annexe du grand livre rouge à la section 7.2, c'est que cet estimateur non biaisé existe aussi. Dommage que ce très bon auteur n'ait pas mis en référence l'auteur de la formule...
La solution, c'est peut-être de compulser les articles de Numdam. C'est peut-être aussi reprendre à zéro l'étude d'un livre de probabilité pour créer soi-même l'équation. Sacré challenge!
Malgré tout mon respect pour Wonnacott, je trouve l'explication un peu courte, car on ne calcule pas les médianes sur les échantillon seulement (*) mais aussi sur la population toute entière. Donc plus d'autre valeur. Je préfère l'argument d'indifférence (comme on n'a pas de raison de se mettre plutôt d'un côté que de l'autre de l'intervalle, on se met au milieu). Au moins quand ça a un sens.
Sauf erreur de ma part, la médiane d'un échantillon est un estimateur non biaisé de la médiane de la population.
Quant à l'estimateur non biaisé de la variance, c'est un classique dont l'origine est suffisamment lointaine pour qu'on ne lui donne pas d'auteur. D'ailleurs, ça servirait à quoi, un nom ?
On trouve tout ça dans la plupart des cours de statistiques français de niveau universitaire. Les textes de Wonnacott que je connais éliminent l'essentiel de ce qu'on met dans un cours de statistiques en France, la mathématisation et la preuve, mais je les ai appréciés pour leur aspect pratique statistique.
Cordialement.
(*) c'est d'ailleurs peu pratiqué, l'utilisation de la médiane de l'échantillon.
L'idée de mettre le nom de l'auteur de la formule, c'est de pouvoir retrouver la démonstration de pouvoir faire face à des problèmes inédits. Bachelard évoque le passage à une connaissance amputée lorsqu'il évoque une chimie qui se baserait seulement sur un catalogue de résultats.
Est-ce que quelqu'un aurait la démonstration que l'espérance mathématique de l'estimateur de la médiane est un estimateur sans biais?
Est-ce que quelqu'un aurait la démonstration que la variance de l'estimateur de la médiane est un estimateur convergent?
Existe-il d'autres estimateurs de la médiane?
Ce que Wonnacott publie dans son annexe, c'est ça :
$Var (X')=\frac{1}{4n[p(\upsilon]^2}$
sauf qu'il met un trait vertical au dessus de X à la place de X' (je ne sais pas comment l'écrire en tex. Donc, s'il arrive à faire le calcul de la variance de cet estimateur (POUR UN GRAND ECHANTILLON), il doit aussi exister la formule pour un petit échantillon et la formules pour l'espérance mathématique de cet estimateur.
Ce qu'il y a de bien dans cette formule, c'est qu'elle tient compte de la disymétrie. C'est donc certain que l'on peut mieux faire que la moyenne des deux valeurs proches du "centre" en cas d'échantillon pair, mais après je n'en sais pas plus. Et je serais très content de la connaître.
peux-tu expliciter ta formule (il y a des lettres dont la signification n'est pas donnée). D'autre part, classiquement, $\bar X$ est une notation pour la moyenne, pas la médiane; éventuellement pour la moyenne empirique, mais la moyenne empirique ne d'estime pas, on l'a.
"Est-ce que quelqu'un aurait la démonstration que l'espérance mathématique de l'estimateur de la médiane est un estimateur sans biais? " Quel estimateur ? Mais ce n'est pas grave, je n'aurai pas de réponse.
"L'idée de mettre le nom de l'auteur de la formule, c'est de pouvoir retrouver la démonstration de pouvoir faire face à des problèmes inédits." Pas besoin de nom pour trouver une formule, et le même nom peut désigner de nombreuses formules. Pour les résultats classiques de statistiques, les idées sont suffisamment évident pour qu'on ne donne pas de nom d'auteur.
Dernière chose : l'existence de formules pour de grands échantillons ne prouve surtout pas l'existence de formules pour les petits. Lorsqu'on a de grands échantillons, le théorème limite central permet souvent des simplifications impossibles pour les petits. A la limite, les échantillons trop petits ne permettent même plus de faire des statistiques.
Cordialement.
Merci pour la réponse de gerard0: toute valeur entre 7 et 9 au sens large est correcte.
J'y pensais mais je n'en étais pas sûr.
Prof Papa
Merci
Effectivement, je tombe sur de nombreux cours qui évoquent le sujet à un niveau mathématique élevé.
En plus simple dans ces documents, j'ai trouvé une solution pratique qui consiste à tracer à la main la fonction de répartition empirique ce qui permet de trouver une meilleure approximation de la médiane. En un peu plus fin, on peut aussi calculer le nombre dérivé de la fonction de répartition et procéder par interpolation linéaire pour avoir une meilleure approximation.
bonSamaritain
7 et compris entre 7 et 9 donc je dirais oui à priori