Comparaison de 3 échantillons avec pourcentage
dans Statistiques
Bonjour,
Dans le cadre d'une étude de paysage, je dois comparer plusieurs échantillons. Je ne suis pas très fort en stat mais d'après moi, je dois effectuer un test de Kruskal-Wallis. Voici mes données, pour moi il y a 3 échantillons (MV, GC et avec 3 variables (linéaire, prairie, cultures annuelles), dites moi si je me trompe :
Si quelqu'un pouvait donc m'éclairer là-dessus ou même peut-être me dire que ce test n'est pas adapté et qu'il faudrait en faire un autre.
Dernière question : Faut-il que je fasse un test de normalité avant ?
Merci d'avance
Dans le cadre d'une étude de paysage, je dois comparer plusieurs échantillons. Je ne suis pas très fort en stat mais d'après moi, je dois effectuer un test de Kruskal-Wallis. Voici mes données, pour moi il y a 3 échantillons (MV, GC et avec 3 variables (linéaire, prairie, cultures annuelles), dites moi si je me trompe :
Ruchers / Paysage / Linéaire / Prairies / Cultures annuelles B / MV / 19,43 / 17,14% / 74,63% J / MV / 36,39 / 33,05% / 62,65% D / MV / 60,53 / 32,94% / 60,51% I / MV / 79,32 / 48,61% / 47,20% G / GC / 29,05 / 21,47% / 68,82% H / GC / 65,34 / 26,12% / 68,63% F / GC / 62,78 / 61,90% / 35,11% O / GC / 95,98 / 51,92% / 44,05% L / B / 39,22 / 34,03% / 62,32% C / B / 54,57 / 38,47% / 54,66% M / B / 62,73 / 49,14% / 50,09% A / B / 95,20 / 49,24% / 48,75%Voilà, donc dans un 1er temps, je veux savoir s'il y a une différence entre les paysages (3 types de paysages : MV, GC et . Si j'ai bien compris, pour le test de KW, je dois classer toutes mes données et mettre des rangs. C'est là que je me pose la question, est-ce que pour les pourcentages je prends par exemple 17,14 (1ère données) ou 0,1714 ? Sachant que ma 1ère colonne de valeurs n'est pas en pourcentage je ne sais pas vraiment comment m'y prendre.
Si quelqu'un pouvait donc m'éclairer là-dessus ou même peut-être me dire que ce test n'est pas adapté et qu'il faudrait en faire un autre.
Dernière question : Faut-il que je fasse un test de normalité avant ?
Merci d'avance
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
On peut écrire les % ainsi : 19, 17, 74,..
les décimales n'ont pas d'importance.
Ruchers est-il une autre variable ? ou ce qu'on veut étudier ?
Que signifient B, J, D, ...
Ai-je bien compris : on veut savoir quel est le meilleur environnement pour les ruchers ?
Donne davantage d'explications.
Cordialement
Koniev
Ruchers n'est pas une variable c'est juste le nom (ici indiqué par une lettre) du lieu ou on a fait les échantillonnages.
En fait, on a classé à priori chaque rucher dans un type de paysage et maintenant, on veut voir d'abord s'il y a bien une différence entre les paysages et ensuite on essayera peut être de voir si chaque rucher est bien dans son paysage en fonction de ses données (mais là je sais pas vraiment comme faire donc si tu as une idée... )
Ce classement servira à comparer le "comportement" des abeilles en fonction du paysage.
Cordialement
Il faudrait donner un rendement du rucher. On aurait un pb classique : quel est le meilleur envirronnment pour un rucher..
Tableau de colonnes
Rendement /paysage/linéaire/prairie/ annuelle
25/12/36/42/57
36/24/15/56/45
on aurait ainsi les environnements. et les rendements des ruchers.
Cordialement
Koniev
Quand je parlais du comportement, il s'agissait par exemple que les abeilles aillent butiner préférentiellement telle ou telle plante. Mais le but ici est de classer les ruchers dans leur paysage respectif et ensuite de relier le paysage aux autres données.
Je dois donc me contenter que du linéaire, des prairies et des cultures annuelles pour séparer les ruchers en 3 catégories.
Je ne comprends pas : le total des % ne doit-il pas donner sur chaque ligne 100 % ?
Cordialement
Koniev
Si on prenait le problème sous un autre angle? En oubliant tout ce que j'ai dit avant, d'après vous, quel test statistique permettrait de voir une différence entre les 3 types de paysage (B, MV, GC)?
J'ai l'impression que tu es parti sur une fausse piste. Tu as essayé d'adapter une procédure à un tableau de données, et maintenant, tu te rends compte que ça ne fonctionne pas. C'est normal, tu n'as pas adapté la procédure à la question que tu te poses.
Donc la question est : Comment "voir une différence entre les 3 types de paysage". On parlera éventuellement de test après, si c'est nécessaire (Pas besoin de test pour "voir" que le paysage de bocage qui m'entoure est différent des plaines de la Beauce). cette question, c'est celle qu'il faut te poser, en oubliant les statistiques (avec les données que tu fournis, il serait miraculeux de trouver une différence pertinente). Autrement dit, avec ton expérience de la situation, qu'est-ce qui caractérise chacun des paysages ? Si tu es incapable de le dire, tu as peu de chances de pouvoir avancer.
Désolé de ne pouvoir te donner de méthode statistique miraculeuse, mais ça n'existe pas !
Cordialement.
NB : Les comparaisons de pourcentages sont presque toujours malsaines. Surtout si ce sont des pourcentages de populations différentes.
il est vrai que vous venez de soulever un point important!! D'après moi, utiliser des statistiques est le moyen de prouver ce que j'avance mais peut être que dans ce cas ce n'est pas nécessaire.
Ici, comme je l'ai dis, on a fait un classement a priori d'après des observations rapides sur le terrain et on voulait utiliser un test statistique afin de voir si nos classements étaient correct, c'est à dire que le test nous aurait révélé une différence entre les 3 groupes.
C'est ce qu'on m'a demandé de faire mais peut être que je pourrai simplement refaire un nouveau classement selon des connaissances plus écologique. Je sais de toute façon qu'il n'y a pas vraiment de catégorie dans le paysage mais que c'est plutôt un gradient. On le voit d'ailleurs dans mes données.
Après, on aurait tout de même voulu essayer de trancher pour chaque rucher entre tel ou tel paysage puisque sinon il y aura des ruchers à cheval entre 2 groupe et ça risque de poser problème pour la suite de notre étude... J'avais penser sinon utiliser la méthode k-means avec 2 classes (en oubliant la classe MV), vous en pensez quoi?
Sinon, que penseriez vous de faire un ACP pour avoir tout de même un graphique pour appuyer ma discussion?
En tout cas, vos remarque me font avancer, merci beaucoup
Par contre, il serait intéressant que tu oublies ces données pour revenir à ce qui fait que tu as distingués ces paysages. Formaliser les raisons subjectives, éventuellement après mesurer ce qui a été objectivé sera bien plus efficace, quitte à reprendre ces données ensuite.
Cordialement.
En regardant cela avec une vision écologique, je peux à peut près classer les ruchers cependant, je viens de redemander, on me demande vraiment de faire un classement et non un gradient... J'ai donc une idée du résultat mais certain ruchers se situant à cheval entre 2 paysages, je dois prouver statistiquement si on peut dire que tel rucher est dans tel ou tel paysage de façon sûr. Ca va un peu à l'encontre des bases de l'écologie du paysage je sais mais bon...
J'ai représenté les ruchers dans un nuage de point mais c'est vrai qu'il n'apparait pas de véritables groupes bien séparé donc c'est difficilement interprétable comme ça.
"Le % de prairies augmente tendit (sic) que le % de culture diminue " est une quasi évidence si on n'est pas à proximité d'une ville ou en montagne.
Et comme je ne sais pas ce qu'est ton critère "le linéaire", il y a peut-être une raison du même ordre (par exemple la longueur de haies augmente en même temps que le pourcentage de prairies).
Cordialement.
Tout ça semble évident sur le terrain mais il faut que je l'écrive sur le papier et surtout que je sépare tout ça en 3 catégories de paysages distinctes et c'est la que je bloque...
Aucune entre chaque groupe, j'ai fait les test... pour les 3 variables...