Par quel test commencer?

Voici l'énoncé d'un exo dont j'hésite sur la manière de l'attaquer :

On possède les données suivantes (des profs ont corrigés des copies)
profs           1         2         3         4         5         6         7
nb de copies    50        44        24        50        50        24        30
moyennes        7.14      7.23      7.15      7.41      7.71      6.73      5.83
écart-types     2.48      3.71      3.91      3.65      3.58      3.61      4.07
médianes        7.0       6.38      6.25      7.25      7.25      6.50      ---
(la dernière médiane est apparemment non renseignée)

1) Peut-on dire que certains profs sont significativement plus sévère que d'autre ?

2) Essayez d'interpréter les différences (ou les accords éventuels ) entre les moyennes et les médianes. Qu'est-ce que cela nous renseigne sur la distribution des notes ?

A priori, d'après le cours que l'on a eu deux candidats se distinguent pour commencer : le test du Khi2 et l'Anova.
Le problème c'est que, si j'ai bien compris, le test du Khi2 nécessite que l'on s'occupe d'effectifs et non de valeurs (ici les moyennes).
Mais, l'ANOVA, outre l'hypothèse gaussienne (mais apparemment le modèle est assez robuste sur ce point), il faut, d'après ce que j'ai compris, l'hypothèse impérative d'avoir les écart-type égaux.

Avez-vous des suggestions ?

Quand à la deuxième question, elle me parait un peu nébuleuse...

Réponses

  • Bonjour.

    Une ANOVA te donnera un résultat global sur la dispersion des moyennes. Mais dans ce cas, il me semble qu'on peut aussi faire directement des comparaisons de moyennes par le test de Student. On peut ainsi comparer directement les résultats des deux derniers soit à l'un quelconque des premiers, soit à l'ensemble des 5 premiers correcteurs, dont les résultats sont assez homogènes.

    Enfin, si la question est bien "Peut-on dire que certains profs sont significativement plus sévère que d'autre ? ", la réponse est non. Les notes dépendent au moins autant du contenu des copies que de la sévérité de la correction. Faire l'hypothèse que les contenus des copies sont homogènes est assez hasardeux, sauf à connaître la façon dont les copies ont été distribuées.

    Pour la deuxième question, on remarque que les médianes sont proches des moyennes, c'est à dire que les séries sont, d'un certain point de vue, plutôt symétriques. Ce qui est d'ailleurs un peu inquiétant.

    Mais ça révèle surtout que l'exercice (pas très net) est une construction à partir de présupposés (répartition des notes à peu près gaussienne - les copies sont "comme toujours mauvaises" - si un paquet de copies a des notes plus mauvaises c'est que le prof "sacque" - ...).

    Cordialement.
  • Dans ce cas, je vais peut-être essayer une Anova sur les 5 premiers (les variances n'étant pas trop éloignés) pour tester si ces moyennes sont potentielement identiques puis faire une student entre chacune des dernières variables et la moyenne des 5 premières.

    En tout cas, merci beaucoup pour vos conseils!
  • Bonjour
    Il y a bien 20 ans j'ai rédigé un petit programme : compamoyen en GWBASIC qui inspiré de l'Analyse statistique de Morice et Chartier page 206 compare deux moyennes connaissant les 2 moyennes, les 2 écarts-types et les 2 nb de valeurs. On obtient un nb qui avec la table de Lqplace-Gauss donne la proba d'une telle valeur.
    La comparaison des 2 premiers profs donne -0.136 et celle des 2 suivants : -0.275 soit des probas de 0.45 et de 0.395 les notes sont donc sensiblement équivalentes.
    Cordialement
    Koniev
Connectez-vous ou Inscrivez-vous pour répondre.