Indicateur de similitude entre deux séries

Bonsoir

Je suis enseignant et j'aimerais avoir un indicateur de similitude entre deux copies (je dispose des notes sous la forme de % à chacune des questions dans mon fichier tableur). Ainsi lorsque l'indicateur serait élevé, je regarderais plus en détails les copies concernées pour voir si l'élève a bien travaillé seul.

J'ai au départ pensé calculer une simple «distance» entre les copies : pour chaque paire de copie, je calcule la différence dans chaque question, puis je fais la somme des différences ; mais je m'aperçois que ce n'est pas très discriminant.

EDIT : je fais la somme des carrés des différences en fait. (j'ai oublié d'indiquer le carré !)

Existe-il un test statistique qui pourrait m'aider ? (s'il est facile à mettre en œuvre au tableur, c'est encore mieux !)

J'ai un peu cherché, essayé les fonctions test.khideux, test.student et testf, mais les tests que j'ai pu faire n'ont pas été très convaincants

Merci de vos conseils.

Réponses

  • Pourquoi pas essayer de tracer le nuage de points et comparer avec la droite d'équation y = x ?
    X_i les données de la première copie et Y_i celles de la seconde.
    Il y a des tests basés sur Student pour a = 1 et B = 0.
    Ce n'est qu'une idée. Il y a sans doute mieux.
  • Je ne suis pas sûr de bien comprendre ce que je dois utiliser pour x et y. Pour un nuage de points il me faut 2 coordonnées (disons X_i et Y_i) pour chaque point (ou 3 si on est en 3d).

    Or, pour chaque copie, j'ai 11 questions. Il me faut en fait comparer des points en 11 dimensions.
  • Je ne parlais que de la comparaison entre 2 copies.
    Tu peux jeter un coup d'oeil sur la méthode de Bland et Altman.
    Disons que tu as une copie "de référence " et les 10 autres. Il me semble que tu cherches à évaluer les autres copies item par item avec cette dernière. Est-ce bien ça ?
  • Dans le premier message, il était difficile de comprendre autre chose que la comparaison de 2 copies : " un indicateur de similitude entre deux copies", "pour chaque paire de copie, je ...".
    Et on compare les 11 valeurs de deux copies.
    Une distance classique est la racine carrée de la somme des carrés des différences.
    Mais si seules deux questions sur 11 ont été copiées, ça ne fonctionne pas.

    Cordialement.
  • Je vais regarder Bland et Altman, ce week-end sans doute, mais je ne suis pas prof de math, j'espère que ce n'est pas trop complexe.

    Ce sont des «copies» de bureautique (des fichiers en fait) qu'ils font à la maison. Ce ne sont pas des questions à proprement parler mais un % de réussite sur certaines compétences. Les tricheurs que je veux découvrir sont ceux qui ont pris le fichier d'un copain et changé quelques éléments de forme seulement. Les fichiers sont visuellement différents mais la réussite par compétence devrait être similaire. Si j'ai des fichiers qui se ressemblent, je creuserai le pourquoi ensuite.

    Je ne veux pas voir item par item, mais avoir une vue d'ensemble des copies, à travers de 11 nombres.
Connectez-vous ou Inscrivez-vous pour répondre.