Comparaison de valeurs observées et théoriques
dans Statistiques
Bonjour,
Je viens sur ce forum car j'aurai besoin d'aide concernant l'analyse de données.
Je vais essayer d'expliquer ça le plus clairement possible...
J'ai des objets (des silhouettes de poissons) qui sont mesurés de deux façons différentes : par un plongeur sous l'eau et par une personne devant un écran d'ordinateur (une caméra a filmé les silhouettes sous l'eau).
Le but est de savoir si ces deux façons d'estimer les tailles sont fiables.
On a donc deux mesures pour le même objet.
Je souhaiterais savoir si les tailles estimées (que ce soit sous l'eau ou sur l'écran) diffèrent significativement ou pas de mes tailles réelles.
J'ai pensé à utiliser un test de Student bilatéral apparié. Pensez-vous que ce soit la bonne solution. Ayant lu plusieurs choses sur les données appariées, je ne suis plus sûr que les miennes le soient.
J'aurais également souhaité savoir si en fonction des classes de tailles, on a des différences d'estimation (exemple : estime-t-on mieux la taille des silhouettes de moins de 40 cm ?)
J'ai lu quelque part qu'il fallait utiliser les coefficients de variations. Quelqu'un saurait-il me dire comment les utiliser concrètement ? (J'utilise le logiciel R.)
J'ai joint un fichier Excel avec les données pour mieux voir de quoi il s'agit.
Merci d'avance!
Je viens sur ce forum car j'aurai besoin d'aide concernant l'analyse de données.
Je vais essayer d'expliquer ça le plus clairement possible...
J'ai des objets (des silhouettes de poissons) qui sont mesurés de deux façons différentes : par un plongeur sous l'eau et par une personne devant un écran d'ordinateur (une caméra a filmé les silhouettes sous l'eau).
Le but est de savoir si ces deux façons d'estimer les tailles sont fiables.
On a donc deux mesures pour le même objet.
Je souhaiterais savoir si les tailles estimées (que ce soit sous l'eau ou sur l'écran) diffèrent significativement ou pas de mes tailles réelles.
J'ai pensé à utiliser un test de Student bilatéral apparié. Pensez-vous que ce soit la bonne solution. Ayant lu plusieurs choses sur les données appariées, je ne suis plus sûr que les miennes le soient.
J'aurais également souhaité savoir si en fonction des classes de tailles, on a des différences d'estimation (exemple : estime-t-on mieux la taille des silhouettes de moins de 40 cm ?)
J'ai lu quelque part qu'il fallait utiliser les coefficients de variations. Quelqu'un saurait-il me dire comment les utiliser concrètement ? (J'utilise le logiciel R.)
J'ai joint un fichier Excel avec les données pour mieux voir de quoi il s'agit.
Merci d'avance!
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Avec ce que tu as fait, tu as déjà de très bons éléments de comparaison. En effet, les nuages de points (avec leurs droites de régression disent plein de choses :
* L'estimation sous l'eau diffère peu, en moyenne, de la bonne valeur, surtout pour les tailles faibles (*). Par contre, au fur et à mesure de l'augmentation de taille, la dispersion augmente très fortement.
* L'estimation en vidéo est beaucoup moins fiable, toujours très dispersée, trop forte pour les faibles tailles, trop faible pour les grandes tailles.
Maintenant, si tu veux aller plus loin, il faut savoir ce qu'il te manque. Pour ma part, concernant des mesures dont les plus grandes sont presque 8 fois la plus petite, j'aurais plutôt analysé les erreurs relatives.
Sinon, pour ta question : Les données sont effectivement appariées, mais le test de Student te dira si, en moyenne, les données sont correctes. Ce qui est facile à voir : la vraie moyenne est de 43 cm, la vision sous l'eau rajoute en moyenne moins de 3 cm, alors qu'à la vidéo on en enlève plus de 5. Vu la dispersion des données (écart type de 20), les moyennes seront données comme sensiblement égales.
Enfin une dernière remarque : analyser ce qui se passe suivant la forme de la silhouette pourrait être intéressant.
Cordialement.
(*) Attention, ce peut être un artéfact dû à la bonne connaissance de la taille réelle des poissons.
En effet, je comptais voir aussi si la forme influait sur les estimations par la biais d'une ANOVA.
Par contre je veux bien que tu m'en dises plus sur l'erreur relative. J'ai calculé l'erreur (comme elle prend en compte le signe, ça m'indique si les tailles sont surestimées ou sous-estimées) et l'erreur absolue (pour connaître l'ordre de grandeur des erreurs).
Mais je n'ai pas saisi l'intérêt des erreurs relatives. J'ai vu ça dans un article mais je n'ai pas compris à quoi ça servait exactement (quel renseignement en tirer).
L'erreur relative est le quotient de l'erreur (ou de l'erreur absolue si on ne s'intéresse pas au signe) par la valeur (supposée jamais nulle, donc plutôt dans le cas de mesures toutes strictement positive - C'est ton cas).
C'est un classique de toutes les réflexions sur la mesure qu'une erreur de 3 cm est sans problème pour la longueur d'une rue, irréaliste pour la longueur de la muraille de Chine, et énorme pour la taille d'un escargot. En fait, de façon générale et dans un domaine précis, plus la mesure est importante, plus les erreurs le sont. Donc la précision est correctement rendue par l'erreur relative, très mal par l'erreur. Il est assez normal de faire des erreurs trois fois plus grandes sur des poissons trois fois plus grands.
Cordialement.
Merci beaucoup pour ton aide.
Indice de correl eau et exact : 0.943 avec p = 0
vidéo et exact : 0.795 avec p= 0
Données appariées eau et exact inter conf = 0.54 et 4.62 à 0.95 diff = 2.58-
video et exact inter conf = -8.65 et -1.78 à 0.95 diff = -5.22
Logiciel MINITAB
Cordialement
Koniev