Étude de corrélation en médecine

mattrd · August 2021

Bonjour à toutes et à tous :-)
Je suis étudiant en médecine et dans le cadre d’un master biologie-santé je réalise une étude ayant pour titre « L'impression globale de changement du patient au cours d'une étude reflète-t-elle son évolution globale ou l'efficacité du traitement ? À propos d'une étude prospective, randomisée, contrôlée en simple aveugle, sur la relaxation dans la fibromyalgie. »

Le but dans cette recherche est donc d’établir (ou non) des corrélations entre différentes données ayant été recueillies dans le cadre d’une étude sur l’efficacité de la relaxation dans une maladie appelée fibromyalgie.

Voici les données : pour chacun des 74 patients
- PGIC (impression globale de changement dans la maladie du patient à la fin de l’étude : coté de 1 : très amélioré à 7 : très aggravé)
- aide globale de la relaxation cotée de 1 à 10 (1 = pas d’aide, 10 = aide maximale).

il s’est en fait avéré que ces deux données, « à vue d’œil » n’étaient pas du tout corrélées ! intrigant n’est-ce pas ? Certains patients n’observent pas de changement vis-à-vis de leurs douleurs mais une aide globale énorme de la relaxation dans leur vie de tous les jours. On peut s’interroge alors sur l’intérêt de la relaxation chez les patients fibromyalgiques.

J’en viens à une question concrète pour les matheux que vous êtes.
Quels seraient les outils statistiques à utiliser pour prouver cette absence de corrélation de manière rigoureuse ?
J’ai déjà trouvé un coefficient de corrélation r= -0,19 mais je ne sais pas si c’est assez rigoureux (exemple : j’ai entendu dire que pour des variables ordinales on ne faisait pas comme ça…)
Bref, je cherche à savoir ce que vous auriez fait, vous, à ma place.

Merci énormément d’avance à tous ceux qui prendront du temps pour m’aider.;-)

gerard0 · August 2021

Bonjour.

Un coefficient de corrélation de 0,19 ou -0,19 indique généralement (*) qu'il n'y a manifestement pas de corrélation. On peut confirmer ça à l'aide du test de nullité du coefficient de corrélation. Si tu as fait calculer le coefficient par un logiciel statistique, même élémentaire, tu as la p-value de ce test indiqué. Au risque 5%, si cette p-value est supérieure à 0,05, il n'y a aucune raison de penser que une non-corrélation (r=0) n'aurait pas pu donner ces valeurs.
Si tu as traité les données à la main, calculette ou tableur, et qu'il n'y a pas trop de valeurs, tu peux utiliser BiostaTGV, qui fait directement ce test.

Cordialement.

(*) pour un nombre habituel d'individus.

mattrd · August 2021

Gerard0,

merci beaucoup pour cette réponse :-)
n’y a-t-il pas de spécificité vis-à-vis du calcul du coefficient de corrélation pour les deux variables que je suppose être ordinales ?
Je suis désolé pour mon piètre niveau mais mes connaissances en statistiques se résument à mes cours de première année !

gerard0 · August 2021

Effectivement,
faire des corrélations à partir de variables ordinales aussi floues n'est pas une bonne idée, mais c'est ce que tu demandais. Si ça te gêne, utilises la corrélation ordinale, mais tu n'auras plus de test.
À toi de voir ce qui est le plus raisonnable.

Cordialement

mattrd · August 2021

Donc vous estimez qu’il reste « acceptable » d’un point de vue mathématique de faire un test de corrélation de Pearson avec de telles variables ?

bien cordialement

gerard0 · August 2021

Ce n'est pas "un point de vue mathématique", mais une réflexion statistique : si l'échelle utilisée n'est pas trop aléatoire, la numérisation ne va pas trahir la réalité. Mais ça, toi seul peux l'évaluer.

Cordialement

mattrd · August 2021

je comprends, merci infiniment pour votre aide !

mattrd · August 2021

Monsieur,

Je me permets de vous relancer une dernière fois concernant mon étude parce que je bloque (encore...!) sur un problème.
je vais essayer de vous remettre rapidement dans le contexte :
On a souhaité évaluer l'efficacité de la relaxation dans la fibromyalgie sur un groupe de 74 patients, et on a (entre autres) évalué l'efficacité par le recueil de la PGIC (patients' global impression of change) que les patients ont cotés de 1 à 7
avec 1 : fibromyalgie très améliorée
2 : améliorée
3 : un peu améliorée
4 : Inchangée
5 : un peu aggravée
6 : aggravée
7 : très aggravée

Dans cette même cohorte, on a également évalué cette efficacité par un questionnaire agréé pour évaluer l'impact de la fibromyalgie, le questionnaire "FIQ" qui est un score de 0 à 100 avec 0 = aucun impact et 100 = impact maximal

Mon problème : j'aimerais montrer statistiquement que lorsque un patient a un PGIC qui va dans le sens de l'amélioration (PGIC = 1, 2 ou 3), il fait également diminuer son score sur le FIQ (qu'on a évalué en début d'étude et en fin d'étude évidemment).
Je bloque complètement et j'espère que cela n'est pas trop complexe. (En fait je ne comprends pas comment traduire ce problème en données variables sur lesquelles je pourrais par exemple établir ou non une corrélation ?)

Très cordialement

gerard0 · August 2021

Bonjour.

Tu peux créer deux variables qualitatives (amélioration/pas d'amélioration et diminution/pas de diminution), obtenir une table de contingence et utiliser un test du khi-deux.

Cordialement.

mattrd · August 2021

Bonjour monsieur,

Mais oui tout simplement, merci beaucoup !

Pour simple confirmation de votre part, l'hypothèse H0 serait que les deux variables sont indépendantes ? (et H1 qu'elles sont dépendantes) ?

gerard0 · August 2021

Oui, c'est toujours l'hypothèse d'un test de khi-deux.

mattrd · August 2021

Merci beaucoup monsieur

gerard0 · August 2021

Pas de monsieur, s'il te plaît, ça me vieillit !!

Cordialement.

mattrd · August 2021

ahah, pas de soucis, merci tout de même pour votre aide précieuse :-)

mattrd · August 2021

Bonjour Gerard0,

Vous parliez « d’utiliser la corrélation ordinale » pour comparer PGIC et aide globale de la relaxation.
Les PGIC (cotées entre 1 et 7) se distribuent presque toutes autour de 3-4-5 tandis que la note globale varie uniformément entre 0 et 10. Pour prouver que les deux variables sont indépendantes j’ai bien effectué un coefficient de corrélation de Pearson mais quelque chose me gène… j’ai l’impression que c’est trop flou pour mettre en évidence une absence de corrélation. Quel test me conseilleriez-vous d’utiliser ? la corrélation ordinale ? je ne comprends pas vraiment son principe. Pourriez-vous m’éclairer sur ce point ? :-)

Merci par avance !

gerard0 · August 2021

La corrélation de Pearson étudie l'existence d'une liaison linéaire entre les deux variables; si elle est forte, on sait que les valeurs $(x_i,y_i)$ sont distribuées de façon proche d'un modèle théorique $Y=aX+b$. La corrélation ordinale, corrélation de Spearmann "oublie" les valeur pour ne plus considérer que l'ordre de ces valeurs dans l'échelle considérée. Si elle est forte, proche de 1, on sait que quand une des valeur augmente, l'autre le fait très probablement.
Dans les deux cas, si une des variables est très peu dispersée, la corrélation sera faible (nulle si une variable est quasi constante).

Cordialement.

mattrd · August 2021

Merci beaucoup, je comprends mieux le principe du test de spearman.

N'étant cependant (vous l'aurez remarqué ;-) ) pas du tout à l'aise avec les statistiques, je me permets de vous demander votre avis. Si vous aviez donc d'un côté les PGIC (impressions de changement du patient, coté de 1 à 7 avec 1=très amélioré à 7=très aggravé) et de l'autre les scores attribués à la relaxation cotés de 1 à 10, avec une distribution globalement autour de 3,4,5 pour les PGIC, et des scores attribués à la relaxation plus dispersés, quel test auriez-vous utilisé ? Spearman ou Pearson ?

Très cordialement

gerard0 · August 2021

Je n'ai pas les données, je n'ai pas d'hypothèses à tester, donc je n'ai pas de conseil à donner. Sauf de représenter le nuage de points.

mattrd · August 2021

Je ne comprends pas quelque chose, en faisant un test de [large]S[/large]pearman sur mes données je trouve un coefficient r = -0,35 (faible corrélation négative, donc) mais pourtant ma p-value est de 0,005 ? Ce qui montre une forte corrélation non ? Puisqu'au risque 0,5% je peux rejeter H0 : "les variables ne sont pas corrélées".
Cordialement.

[Charles Spearman (1863-1945) prend toujours une majuscule. AD]

gerard0 · August 2021

Non, la faible corrélation est simplement significativement différente de 0 au seuil 0,01 par exemple. La p-value ne dit pas directement la valeur de la corrélation, simplement le résultat du test de l'hypothèse r=0.
Donc, significativement, quand une des valeurs augmente, l'autre a tendance à diminuer. Mais c'est loin d'être significatif.

Cordialement.

NB : Les résultats flous sont les plus courants, en statistiques pratiques.

mattrd · August 2021

Effectivement, après réflexion je me suis dit que la p-value m’indiquait seulement que je pouvais rejeter H0 jusqu’au seuil 0,005 mais ne me donnait aucune information sur la valeur de ma corrélation.

Merci encore une fois, décidément vous m’aurez bien aidé.

Très cordialement.

mattrd · August 2021

Gerard0
Pour comparer les impression de changement (PGIC cotées de 1 à 7) entre un groupe placebo et un groupe expérimental, êtes-vous d'accord avec moi sur l'utilisation d'un chi-deux d'homogénéité avec une variable A (groupe) à deux modalités (placebo/expérimental) et variable B avec 7 modalités (considérablement/très/un peu amélioré/inchangé/un peu/très/considérablement aggravé). ?

J'aimerais montrer que dans le groupe expérimental la PGIC est plus basse (plus améliorée, donc). Dois-je réaliser un test unilatéral ? Si oui, comment changer mon hypothèse H1 de "la PGIC dépend du groupe" en "la PGIC est inférieure dans le groupe expérimental" ?

Merci beaucoup :-)
Cordialement.

gerard0 · August 2021

Les valeurs étant purement formelles (au lieu de coter de 1 à 7, on aurait pu coter de 0 à 6 ou de 100 à 700), il s'agit de caractères qualitatifs, et un tableau de contingence peut être utilisé (on perd l'ordre des 7 critères). Un khi-deux permettra alors de mettre en évidence (ou pas) un changement entre les deux groupes.
Mais ce test ne traite pas le sens ou l'importance des variations entre les deux groupes; ce que pourrait montrer un test de genre Mann-Whitney. Qui utiliserait les valeurs, mais ne tient en fait compte que de leur ordre.

Cordialement.

mattrd · August 2021

Bonjour gerard0,

Merci pour votre réponse. Je me suis résolu pour une meilleure compréhension à calculer le pourcentage d'améliorés (1,2,3) dans les deux groupes et de comparer les pourcentages. Je me souviens avoir vu il y a 3 ans que l'on pouvait changer l'hypothèse H1 "p1 =/= p2" en "p1>p2", mais il me semblait qu'il y avait quelque chose à diviser par 2 (ou peut-être était-ce autre chose ?) :-S. Pourriez-vous m'éclairer ?

Cordialement

gerard0 · August 2021

" Pourriez-vous m'éclairer ? "
Difficilement ! Certains tests ont des formes bilatérale et unilatérale, pas le khi-deux. Confondrais-tu ??
Attention aux comparaisons de pourcentages, la taille de la population est fondamentale. D'ailleurs le test classique de comparaison de pourcentage donne exactement les mêmes résultats qu'un khi-deux.

mattrd · August 2021

Il est effectivement très probable que j’aie mal compris quelque chose alors. Donc la meilleur réponse que je pourrais avoir à ce problème est « p1 est statistiquement différent de p2 » ? en admettant que dans mes échantillons je trouve p1>p2, puis-je conclure avec le khi-deux (ou test de comparaison de pourcentage) que p1>p2 ? ou cela n’a pas de sens ?

cordialement

gerard0 · August 2021

Ce ne sera pas le résultat d'un test, mais une bonne analyse des données (On voit que sur l'échantillon p1>p2, puis le test montre que la différence est significative).

mattrd · August 2021

D'accord, ça paraît logique. Merci !

Étude de corrélation en médecine

Réponses

Bonjour!

Catégories

In this Discussion

Qui est en ligne 7