Débutant en stat, quel test pour corrélation

Bonjour à tou(te)s,
Je me permets de vous solliciter étant inscrit en première année de psychologie et ayant un exercice de statistique auquel j’avoue ne pas comprendre grand chose. Je n’ai absolument pas l’esprit mathématique et donc autant là j’ai 2 que la [large]B[/large]ravais-Pearson, je n’arrive pas à en saisir la logique ...

Je vous explique tout d’abord ce que je dois tester.
J’ai trois catégories de personnes, ceux qui consomment peu d’alcool, ceux qui consomment de manière modérée et enfin les consommateur dexcessifs. Pour chaque catégorie j’ai leur score obtenus lors de la réalisation d’une tâche de mémoire.
Je dois décider si je dois faire un khi 2 ou un [large]B[/large]ravais-Pearson. Le souci c’est que je ne parviens pas à savoir comment faire pour le test de trois variables indépendantes différentes (catégorie de consommation d’alcool) avec une variable dépendante (leur score au test de mémoire).

Je suis preneur pour toute aide que vous pourrez m’apporter ... je précise que je ne souhaite pas que l’on me dise forcément que faire, mais surtout qu’on m’explique si possible, car cela commence à me déprimer de voir à quel point je n’arrive pas à saisir cette partie des cours...
Je vous remercie d’avance et vous souhaite une excellente soirée.

[Auguste Bravais (1811-1863) mérite sa majuscule. AD]

Réponses

  • Bonjour.

    Premièrement, je te rappelle que la connaissance du cours permet de répondre soi-même aux questions (je en sais rien de plus que ce qu'il y a dans tes cours, je ne connais pas ton exercice, dont tu ne donnes même pas l'énoncé).

    Deuxièmement, si ton cours est correctement structuré, l'analyse de corrélation (ce que tu appelles Bravais-Pearson) n'est pas dans la partie tests d'hypothèse. C'est la mesure d'un rapport d'évolution linéaire de deux variables quantitatives. Par contre, le khi-deux est un test statistique, qui teste une indépendance entre deux caractères à partir d'un tableau de contingences (effectifs des classes croisées). Si le test est significatif, on pourra, avec un certain risque, rejeter l'idée d'une vraie indépendance. Sinon, il n'y a rien à dire.

    Pour ton exercice, sans les données, difficile de te conseiller. Tel que tu le dis, aucune des deux méthodes n'est applicable; mais tu parles d'un énoncé, et tu l'as peut-être trahi.

    NB : Pas besoin d'avoir l'esprit mathématique pour faire des stats, mais il faut vraiment penser. Penser au sens des mots, au vocabulaire (et l'apprendre), penser aux différences entre les notions, penser à ce que veut dire l'hypothèse d'un test classique, et comment il s’interprète, ...

    Cordialement.
  • Bonjour Gérard,

    Merci beaucoup pour le temps que vous avez pris pour me répondre. .

    Tout d’abord je suis bien conscient que je suis censé avoir les réponses au sein même de mes cours. Ce n’est pas faute de l’avoir lu, relu et encore relu mais malheureusement mon esprit n’intègre absolument pas ces notions. Je suis en psychologie, mon esprit marche plus facilement en ces termes.
    Les cours se déroulaient malheureusement beaucoup trop rapidement pour les personnes qui ont besoin de plus de temps pour intégrer les différentes notions. Seul, je le vois bien, j’ai beau lire, regarder des tutoriel, regarder sur internet tout ce qui concerne les différentes méthodes mais je n’arrive pas à comprendre, cela va toujours trop rapidement pour moi. Si je suis venu sur ce forum c’est que je recherche à vraiment comprendre, étant plutôt littéraire, et ayant souvent du mal à intégrer les notions « logiques » concernant les test des hypothèses.

    Dans le cadre de mon cours « Méthodologie et Analyse des données » nous avons effectué un test sur la mémoire dans le but de créer un mini dossier de recherche pour nous permettre de s’exercer avec des donnés réels au différentes méthodes statistiques. Pour les statistiques inférentiels nous devons justement utiliser soit le khi 2 soit le bravais de Pearson.

    Nous avons appris que le khi 2 permet de tester la dépendance entre 2 variables ordinal, ou nominale, qui permet de mesurer des écarts à l'indépendance, nous avons appris la formule et les hypothèses H0 et H1.
    Le bravais de Pearson est quant à lui pour mesurer des variables d’intervalle et numérique, il teste l’existence d’une liaison entre deux variables. Nous avons également appris les formules comment et quand accepter ou refuser H0 ou H1.

    Pour revenir à mon exercice et si vous ou quelqu’un d’autre a la patience de m’expliquer, nous avons demandé à des personnes de retenir une liste de 16 mots que nous leur avons préalablement montré, à la suite de ce test ils devaient
    1) se rappeler sans aucun indice des 16 mots
    ensuite 2) se rappeler des mots avec un indice concernant la catégorie sémantique du mot.

    Comme nous voulions mesurer la différence de la mémoire entre les personnes consommant de l'alcool de manière excessive et les personnes qui consomment peu nous avons fait 3 catégories, puisque le test d'alcool Audit que nous avons utilisé pour mesurer la consommation d'alcool sépare en trois catégorie.
    Nous avons donc comme donnée, les résultats détaillée de chaque personne (que je ne vous ai pas joins pour vous épargner un document très long), et comme vous pouvez le voir au tableau ci joint, la moyenne des rappels libre et indicé de chacune des personnes appartenant à chacune des trois catégorie (la performance de la mémoire donc ; notre variable dépendante), ainsi que le taux de consommation d’alcool (notre variable indépendante).

    Nos hypothèses sont les suivantes :
    H0 : Il n’y a pas un lien entre la consommation de l’alcool et la mémoire.
    H1 : Il y a un lien entre la consommation de l’alcool et la mémoire.

    Peut-être que nous devrions rassembler une des deux catégories pour permettre d'utiliser l'un des deux tests, notamment le bravais de Pearson afin de voir justement s'il existe une évolution linéaire entre mes variables quantitative.
    A défaut de rassembler une des deux catégories peut-être que nous devons faire le test sur plusieurs étapes ?
    Par exemple d'abord entre les personnes consommant entre 0 et 6 verres et les personnes consommant entre 7 et 12, puis les personnes consommant entre 7 et 12 et les personnes consommant entre 13 et 18.

    Encore une fois merci beaucoup pour votre patience, je comprends que cela puisse être évident pour vous, ça ne l'est pas pour tout le monde, mais on est toutefois désireux de comprendre :-)

    Bien cordialement86254
  • Le problème est que vous avez imité des expériences classiques sans faire le lien avec les outils que vous voulez utiliser :
    * Une série double pour la corrélation (*)
    * Un tableau de contingence pour le khi-deux.

    Si vous avez tous les résultats (**), vous pouvez faire une analyse de corrélation avec la population de vos testés, en prenant pour chaque individu sa consommation et ses résultats au test sans indice; une autre en prenant pour chaque individu sa consommation et ses résultats au test sans indice. En espérant que la corrélation sera forte (*) et de même sens. Et en oubliant que la consommation n'est pas une variable gaussienne, faire le test r=0 pour faire plaisir à vos profs (il n'a aucun sens ici, mais ne leur dites pas ;-) ).

    Par contre, pour faire un khi-deux, je ne vois pas trop que faire, à part créer des classes de résultats des test, ce qui est un peu contre-nature (on a des connaissances précises, on les remplace par des connaissances faibles !).

    Cordialement.

    (*) On peut compléter une analyse de corrélation par un test de r=0 où r est le coefficient de corrélation. mais si on a déjà une forte corrélation, ce test ne sert à rien, pour |r|>0,7 le test est toujours significatif. Mais les psychologues ont tendance à utiliser des tests sans utilité, voire dans des conditions où ils n'ont aucun sens. Par exemple, pour le test de r=0, il y a une très forte condition de Normalité des variables qui est rarement vérifiable.
    (**) Drôle d'idée d'avoir fait des classes pour la consommation d'alcool, alors que vous aviez une vraie variable numérique.
  • Bonsoir
    Excusez ma réponse tardive et merci beaucoup pour toutes ces précisions ...

    Je crois comprendre beaucoup mieux comment j'ai fait pour arriver à ce blocage justement, en utilisant une seule moyenne générale pour chaque catégorie au lieu de me concentrer sur mes résultats détaillés ...
    Normalement nous savons déjà que nous n'aurons absolument pas une forte corrélation, notre population était beaucoup trop jeune pour que la consommation de l'alcool ait des conséquence significatives ... Donc bon ça sera une bon exercice même si peu satisfaisant pour notre "recherche" :-) :-)
    Bon je n'ai plus qu'à appliquer, et effectivement nous pouvons garder les variables numériques, ce qui facilitera largement notre tâche.

    Encore une fois mille mercis, cela me parait beaucoup plus clair maintenant ... ^^
  • Il pourrait y avoir un lien entre ces 2 variables quantitatives et aucune corrélation linéaire non ?
    Dans le cas où vous souhaitez/pouvez catégoriser la population: ceux qui consomment peu d'alcool C1, ceux qui en consomment moyennement C2 et ceux qui en consomment beaucoup C3 on peut s’interroger sur la dépendance entre la variable numérique quantifiant la qualité de la mémoire et la catégorie concernée. Dans ce cadre on pense d'abord à une ANOVA et si l'hypothèse de normalité de la distribution de la variable numérique n'est pas vérifié on peut penser à un test comme Kruskal Wallis...
    Gérard pourra sans doute confirmer/infirmer l'intérêt d'une telle démarche pour prendre en compte une liaison non linéaire entre 2 variables.
  • Effectivement, si on a toutes les données, on peut travailler avec les trois classes; mais justement, on peut faire mieux !!

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.