diminution du seuil de signification
dans Statistiques
Bonjour,
Je suis en train de comparer des effectifs d’acariens dans différents types d’enherbements (6 au total)
J’ai effectué un test de Kruskal Wallis pour voir s’il y avait des différences. Pour ensuite comparer 2 à 2 mes échantillons, je devrais faire un test de Mann-Whitney. Cependant, on m’a dit qu’il fallait dans ce cas, diminuer le seuil de signification : le diviser par le nombre de tests effectués.
Je souhaiterais comprendre pourquoi nous devons diminuer ce seuil… ?
Merci d’avance pour votre aide !
Je suis en train de comparer des effectifs d’acariens dans différents types d’enherbements (6 au total)
J’ai effectué un test de Kruskal Wallis pour voir s’il y avait des différences. Pour ensuite comparer 2 à 2 mes échantillons, je devrais faire un test de Mann-Whitney. Cependant, on m’a dit qu’il fallait dans ce cas, diminuer le seuil de signification : le diviser par le nombre de tests effectués.
Je souhaiterais comprendre pourquoi nous devons diminuer ce seuil… ?
Merci d’avance pour votre aide !
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Qui est ce "on" ?
Qu'appelles-tu "seuil de signification" ? Le risque associé au test, ou bien la valeur limite de ce risque qui fait basculer la valeur test de rejet à acceptation (on l'inverse), que les logiciels appellent p-value ?
Dans le premier cas, c'est une vakeur arbitraire, alors la diviser ? Dans le deuxième, la trafiquer revient à trafiquer le test !
Cordialement
"on" est en fait une citation extraite d'un forum sur le logiciel R.
Je cite :" En fait le test de Wilcoxon et le test de Kruskal-Wallis sont des test de rang (non paramétriques), simplement le test de Wilcoxon se fait seulement avec 2 échantillons, le test de Kruskal avec 2 ou plus. Le test de Kruskal-Wallis est donc équivalent à celui de Wilcoxon pour 2 échantillons.
A mon avis, le plus logique est de faire une comparaison globale des 12 échantillons avec un test de Kruskal. Ensuite, s'il y a signification, voir plus en détail les différences.
Attention, si l'on multiplie les comparaisons (en faisant des comparaisons 2 par deux), il faut diminuer d'autant le seuil de signification. En pratique 0.05 divisé par le nombre de tests."
Ce que j'appelle la valeur seuil de signification est bien la p-value.
En fait, ce que je ne comprends pas c'est pourquoi on doit abaisser cette valeur lorsque l'on compare 6 échantillons plutôt que 2 ? Et cela m'embête bien de ne pas comprendre car lorsque je laisse cette valeur à 0.05, je trouve des différences. Lorsque je la divise par 15 (mes 15 tests 2 à 2), je ne trouve plus beaucoup de différences. et je ne vois pas pourquoi, car si j'avais décidé de comparer juste 2 enherbements au lieu de 6, j'aurais vu des différences....
Moi non plus, je ne comprends pas. Car il s'agit désormais de comparer deux échantillons, et donc les 4 autres n'ont rien à faire dans l'affaire.
Mon conseil : Oublie les indications trouvées sur des forums lorsqu'elles te semblent bizarres (y compris les miennes). les stats c'est d'abord du bon sens.
Cordialement
J'ai utilisé la moyenne et les écart-types dans la comparaison, le seuil de signification, était variant à 0.05 et 0.01, je me demande pourquoi en fait, on peut utilisé deux seuils pour la comparaison et pourquoi le seuil de 0.01, je ne comprends pas trop.
Merci de m'expliquer.
La plupart du temps on se contente de 0.05 c'est-à-dire que si l'écart observé a une proba de 0.05 de se réaliser on a une chance sur 20 de se tromper en affirmant qu'il est dû au seul hasard. Si on prend 0.01, on est certain à 99 pour 100 qu'il y a une cause.
C'est au spécialise de choisir 0.05 ou 0.01 ou une autre valeur.
Cordialement
Koniev
Telle qu'est présentée ta question, il est difficile de t'aider, car il semble y avoir une contradiction : "J'ai effectué une statistique", donc c'est toi qui décides ce qu'il y a à faire; puis "le seuil de signification, était variant à 0.05 et 0.01" donc ce n'est pas toi qui décides. Bizarre.
Reprenons :
* "J'ai effectué une statistique" : Que veux-tu dire ? que tu as rassemblé des résultats ? que tu as analysé avec un outil statistique ? Que tu as défini une "statistique", c'est à dire une variable aléatoire ? Et quelle statistique (il en existe des centaines) ?
* "J'ai utilisé la moyenne et les écart-types dans la comparaison". C'est souvent le cas, mais ça n'explique rien.
* "le seuil de signification, était variant à 0.05 et 0.01" ??? En général, c'est avec les test qu'on trouve des seuils de signification (?). Mais s'il y a plusieurs seuils, c'est qu'il y a plusieurs tests.
Donc je crois qu'il serait sain que tu expliques clairement ce que tu as fait, car sinon on va t'expliquer ce qu'on a traduit de ton exposé, donc probablement t'embrouiller.
Cordialement.
NB : Même si tu ne connais pas le vocabulaire, essaie de dire concrètement ce que tu as fait, on essaiera de comprendre.
je pense que Safiatou voulait parler d'une sorte de correction de Bonferroni mais pour des tests non paramétriques... car il s'agit bien dans ce cas-là de corriger le seuil alpha en fonction du nombre de comparaisons que l'on fait, non ?
En revanche, comme lui je n'ai pas trouvé de correction de ce types pour les tests non-paramétriques. Peut-on utiliser ca correction de Bonferroni ?
Par ailleurs savez-vous quels tests post-hoc nous pouvons utiliser pour définir un effet obtenu à l'aide d'une test de Kruskall Wallis ? (entre plusieurs échantillons). Des comparaisons 2 à 2 s'imposent, mais à partir de quel test ??
Par avance je vous remercie.
M