Test Statistique comparaison de %
dans Statistiques
bonjour, a tous
Voila, j'ai un résultat de recherche qui se présente sous cette forme :
en effectuant un Test Khi2 j'obtiens :
X2= 5,1883 DDL=4, p-value=0,2685, donc non significatif
On me demande a présent la comparaison de % pour chaque cellule, par exemple:
Metabolic JOUR Vs Orthopedic JOUR afin de voir si la différence est significatif:
Pourriez vous me donnez la formule statistique à utiliser pour ce test ? De quel test s'agit-il ? Et le développement "pas à pas" pour une seule comparaison cellule à cellule afin que je refasse la même chose avec les autres ?
On m'a dit que cela etait faisable mais sous "statistica", que je n'ai pas... Je fais donc les calculs sous Excel
D'avance merci pour votre aide
Voila, j'ai un résultat de recherche qui se présente sous cette forme :
Ages..............Metabolic...............Orthopedic...................Skin.....................Digestive..............Autre=Other+N....................total NUIT...........15,82% / (50)...........43,99% / (139)..........16,14% / (51)..............19,3% / (61)............4,75% / (15)................100% / (316) JOUR...........14,78% / (30)..........40,39% / (82)............24,14% / (49).............16,75% / (34)............3,94% / (8)................100% / (203) total...................(80).................(221)......................(100)....................(95)...............(23)..................(519)nombre de patients entre ( )
en effectuant un Test Khi2 j'obtiens :
X2= 5,1883 DDL=4, p-value=0,2685, donc non significatif
On me demande a présent la comparaison de % pour chaque cellule, par exemple:
Metabolic JOUR Vs Orthopedic JOUR afin de voir si la différence est significatif:
Pourriez vous me donnez la formule statistique à utiliser pour ce test ? De quel test s'agit-il ? Et le développement "pas à pas" pour une seule comparaison cellule à cellule afin que je refasse la même chose avec les autres ?
On m'a dit que cela etait faisable mais sous "statistica", que je n'ai pas... Je fais donc les calculs sous Excel
D'avance merci pour votre aide
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
La comparaison de deux proportions est généralement décevante si les effectifs ne sont pas importants. Et quand ils sont importants, ils n'ont pas d'utilité si les effectifs sont nettement différents. Mais allons-y pour le cas que tu donnes : Metabolic JOUR Vs Orthopedic JOUR;
Les effectifs sont 50 et 139 (*). Donc dans ce cas, il y a une différence évidente d'effectifs. Aucun test n'est vraiment nécessaire pour dire que c'est différent, mais mettons en un en place : On prend comme modèle Metabolic JOUR, et on suppose que le hasard seul fait varier l'effectif (donc le pourcentage) de Orthopedic JOUR autour de la valeur moyenne 15,82% (hypothèse H0. Ceci se traduit par le fait que le nombre de cas pour Orthopedic JOUR suit une loi binomiale B(316;0,1582). Avec cet effectif, on peut approximer par une loi Normale N(50; 6,52). Donc sous H0, il y a 95% de chances que le nombre de cas pour Orthopedic JOUR soit compris entre 37 et 63 (50 - 2*6,5 / 50 + 2*6.5). Comme l'effectif est 139, le test est très significatif.
Par contre, la différence jour/nuit est à regarder d'assez près (même méthode).
La mise en forme de ce que je viens de faire est classiquement le "test de Fischer", qu'on peut trouver tout fait sur le Web. Mais il s'applique à des situations de comparaison de 2 variables. Par exemple, on comparera Orthopedic JOUR à Orthopedic nuit et en référence total jour à total nuit, pour essayer de mettre en évidence une différence entre la répartition jour/nuit entre orthopédie et l'ensemble. On trouve (**) alors que la différence jour/nuit n'est pas significative.
Cordialement.
(*) En fait, j'ai confondu les lignes, c'est donc NUIT qui est concerné.
(**) J'ai utilisé jussieu
Je ne comprends pas ton tableau. Peux-tu expliquer comment est-il obtenu , que signifient les titres des lignes et colonnes dans un khi2on a qu'une vleur et non 2 comme ici : 15.824 (50)
cordialement
Koniev
J'ai appris que le khi2 travaille sur des nb entiers : nb de malades et de sains dans plusieurs populations. Certains logiciels comme MINITAB refusent le calcul quand on entre des nb comme 12.36.
J'ai donc fait le calcul sur les populations ( ) khi2 = 4.99 ddl=4 P=0.173 non significatif.
Cordialement
Koniev
Koniev: j'ai écrit le % de chaque cellule et entre parentheses le nombre de patients correspondant
Gerard0:
-comment as-tu fait pour approximer par une loi Normale N(50; 6,52)? Je suis pas très à l'aise avec la loi Normale, le 6,52 c'est l'écart-type ? Comment l'as tu calculé, peux-tu développer un peu cette partie ?
Ensuite je ne reconnais pas la formule que tu utilises " (50 - 2*6,5 / 50 + 2*6.5)" . Pour un Fisher ne faut-il pas faire (ecart-type1 au carré/ecart-type2 au carré) qui donne Fobs à comparer sur une table de Fisher ?
D'avance merci
On approxime la loi binomiale par une Normale de même moyenne (np) et de même variance (np(1-p)). 6,52 est effectivement l'écart type.
C'est le classique intervalle de confiance à 95% sur les valeurs d'une loi Normale. Rien à voir avec quelque test de Fischer que ce soit. La formule que tu donnes correspond à la "loi de Fischer" et aux tests de comparaison de variances; pas au test de Fischer, que je n'ai pas utilisé au départ.
Cordialement
J'ai une toute dernière question :
Ce tableau fait partie des 16 qui doivent être analysés toute de cette façon là (celui-ci étant le plus petit). Certains sont au format 8*7 ou 5*7(colonne/ligne). J'ai donc beaucoup d'analyses à faire. Toutes ces information seront inclues dans un article scientifique type IMRAD.
-Pourrais-tu me dire s'il est possible de formaliser un peu la procédure sous forme d'une formule, que je puisse ensuite intégrer à excel et de façon à obtenir un résultat unique type p-value plutôt qu'un intervalle de confiance ?
Si oui pourrais-tu me la donner ?
J'ai trouvé celle-ci :
|Xa-Xb|/ (racine carré de[ (Xa*(100-Xa)/Na)+(Xb*(100-Xb)/Nb)])
avec par exemple pour metabolic nuit VS orthopedic nuit :
Xa=139
Xb=50
Na=316
Nb=316
qui donne Z=8,126 soit une valeur dans la table de N de 1,000000000 et p-value=1-(valeur dans table)= 0,00000000... donc significatif
Davance merci de ton aide
Il est par contre tout à fait adapté (pas de biais) aux comparaisons jour/nuit.
Cordialement
topic clos pour moi
je voudrais de l'aide a propos des resultats de ma these en medecine, on me demande de comparer mes resultats a d'autres resultats pour les quels je dispose que d'un pourcentage isolé pris dans un document quelque.
merci d'avance
Avec une donnée isolée, les seules comparaisons possibles sont celles de bon sens. Au mieux, si tu as fait une enquête avec de nombreuses données, tu peux essayer de calculer un intervalle de confiance sur le résultat isolé pour savoir s'il est cohérent avec tes données.
Cordialement.