Test pour seulement 3 échantillons

aloé0 · January 2011

Bonjour à tous,

J'aurais besoin de votre aide pour résoudre mon gros souci. Mon niveau en statistiques est proche de nul, ce n'est pas faute d'essayer de comprendre mais ça me dépasse...

Il s'agit d'une expérience biologique, d'où le petit nombre d'échantillons. Mon objectif est de prouver que la condition LG (traitement) est différente de la condition NI (sans traitement). J'ai 3 répétitions (R) par condition, donc 2 x 3 valeurs au total.

Les valeurs que j'obtiens soutienne l'hypothèse que LG diffère de NI, mais dans des proportions tellement différentes que calculer la déviation standard (par exemple) revient à "tuer" ma démonstration en montrant que ce n'est pas statistiquement différent.

Exemple concret de valeurs :
NI : (R1)    1,00   (R2)  0,38   (R3)     1,16
LG : (R1) 4153,18   (R2) 36,25   (R3) 10369,08

Instinctivement, on voit pourtant qu'il y a des différences.

J'ai été discuter avec un statisticien, qui m'a conseillé d'utiliser le test de rang signé de Wilcoxon. Malheureusement, les tables de p-value dont je dispose ne commencent qu'à 4 valeurs par série. Alors que faire ? Y a-t-il moyen de calculer la p-value et si oui, comment ?
Ou dois-je utiliser un autre test mieux adapté ?

Merci d'avance pour votre aide précieuse !

Koniev · January 2011

Bonjour
Y a un truc !
Ai-je bien lu ?
les 3 cas témoins ont un total de 2.54 et les 3 cas qui ont le traitement un total d'environ 14 000 !
(quatorze mille)
Il n'y a pas photo ou une erreur dans le relevé des données
cordialement
Koniev

Aloe1 · January 2011

D'abord merci pour votre réponse.

Je ne comprends pas ce que le total vient faire là-dedans. Il s'agit de 3 répétitions indépendantes, qui auraient dû nous donner 3 résultats similaires mais la nature en a décidé autrement, hélas pour moi. Il n'y a donc aucune erreur de relevé.

Je cherche à pouvoir dire "les valeurs sont plus élevées avec le traitement, signe que ledit traitement fonctionne". Même si ça saute aux yeux, on me demande de le prouver de manière statistique et, de préférence, facile à comprendre.

gerard0 · January 2011

Bonsoir.

Les valeurs sont suffisamment dissemblables pour être distinguables (raisonnablement) sans justification statistique. Je ne sais pas ce que tu mesures, mais n'est-ce pas une valeur déjà connue, dont on peut trouver un intervalle de valeurs "habituelles" ?
Sinon, il n'existera que des raisonnements statistiques peu fondés, à la limite de l'escroquerie intellectuelle. Car ce qui fonde la différence, c'est l'écart de plusieurs ordres de grandeur entre les deux situations. Donc il faudrait un test qui en tient compte, en gros, un test paramétrique. le test (non paramétrique) de Wilcoxon ne tiendra pas compte de cette différence fondamentale.
Alors pour faire "statistique" à tout prix, autant employer le classique test de comparaison de moyennes, ou mieux, de faire l'hypothèse que les valeurs suivent une loi Normale dont la moyenne et l'écart type sont estimés par le premier échantillon (*), les trois valeurs 1, 0.38 et 1.16, pris comme référence. On voit alors très bien que les valeurs du deuxième échantillon sont absolument improbables.

Cordialement.

(*) attention en statistique le mot échantillon a un sens différent de celui du biologiste : C'est une série de mesures correspondant à une situation commune, ou encore l'ensemble des individus mesurés dans ce cas.

aloé0 · January 2011

Bonsoir gerard0, et merci pour votre réponse.

Malheureusement mes mesures sont originales, aucun intervalle ne peut servir de modèle.
Je me rends bien compte qu'il s'agit "d'escroquerie intellectuelle" pour reprendre vos termes, mais le problème est que je dois présenter ce travail à des personnes qui n'y connaissent pas grand-chose en statistique et qui, par conséquent, vouent une foi inébranlable aux tests statistiques qui permettent de marquer un résultat d'une petite étoile "statistiquement différent" (si vous voyez ce que je veux dire).

Cela étant, j'ai présenté des données extrêmes, mais elles ne sont pas toutes comme ça. Par exemple, un autre lot à traiter se présente ainsi (tous les lots devant être analysés indépendamment) :

NI : (R1) 0,18 (R2) 0,20 (R3) 1,41
LG : (R1) 0,47 (R2) 3,86 (R3) 1,53

C'est là qu'on risque de me tomber dessus avec la fameuse question "est-ce statistiquement différent ?"

Mais je vois ce que vous voulez dire avec l'hypothèse de distribution normale. En gros, sachant que les données pour NI sont relativement proches (et c'est le cas pour tous mes lots, sauf quelques valeurs isolées), je devrais calculer la moyenne et la variance pour NI et montrer que les données pour LG ne se retrouvent pas sous la courbe, c'est bien cela ?

tayalé.a · January 2011

Bonjour, je me retrouve dans le même cas qu'Aloe et profite donc de son sujet pour compléter.

J'ai moi aussi deux groupes de données à comparer avec seulement trois mesures dans chaque groupe (mesure de niveau d'expression d'un gène particulier dans deux tissus différents, données appariées entre elles car tissus extraits de mêmes individus).
Je ne pense pas pouvoir utiliser un test t (échantillon trop petit) et hésite à utiliser un test non paramétrique tellement mon échantillon est de taille réduite (test du signe ou Wilcoxon signé). Est-ce que j'ai raison de refuser de faire un test statistique sur un échantillon aussi réduit (question de pertinence) ou existe-t-il une possibilité qui s'offre à moi ?

J'aimerais également connaitre la taille minimale requise afin de remplir les conditions d'utilisation de certains tests statistiques. J'ai vu diverses réponses sur divers forum et aimerais avoir vos avis sur ces différentes possibilités :

Student: si je ne me trompe pas il est adapté à de petits échantillons (n<30) mais dont la distribution suis une loi normale. J'ai lu qu'il fallait un minimum de 6 individus par groupe. Est-ce exact? Si oui quel test dois-je utiliser afin de tester la normalité de tels échantillons? Est-ce que le test de SHAPIRO et WILK pourrait convenir (ok pour 5<n)? Que faire quand j'ai moins de 5 mesures par groupe?

Student pour données appariées: j'ai vu que 3 échantillons peuvent suffire pour ce test. Est-ce exact ? Si oui comment vérifier la normalité de la distribution de mes di (différence par paire) sur de si petits échantillons ? Est-ce nécessaire de le faire ?

Mann-Witney: j'ai vu qu'il fallait selon les auteurs de 4 à 8 individus minimum par groupe. Sur d'autre forum on voit que 3 échantillons suffisent. Est-ce exact ?
Quelle serait la taille minimale requise pour réaliser un test du signe ? De Wilcoxon signé ?

Existe-t-il d'autres tests adaptés à de très petits échantillons appariés ou non (n<5, n=3 comme ici) ?
Que pensez-vous de la pertinence de réaliser des tests sur de si petits échantillons.
En effet si les différences sont flagrantes, il n'y a en théorie pas besoin de faire un test (rôle et pertinence des statistiques). Si les différences sont fines, peu importe le test réalisé celui-ci risque de donner un résultat non significatif. Malheureusement et comme le souligne Aloe on nous réclame souvent des tests comme preuve.

Merci beaucoup par avance pour votre aide et vos avis.
Bien cordialement et bonne année à tous.

[Wilcoxon, Witney te remercient pour leur majuscule. AD ]
merci pour la correction

tayalé.a · January 2011

.

gerard0 · January 2011

Je reprends ma réponse à Tayalé.a, en modifiant ce qui ne le concernait pas (je mélangeais avec Aloe). Tayalé.a tu peux effacer ton message si tu veux et alors je modifierai cet en-tête.

Bonjour.

"Est-ce que j'ai raison de refuser de faire un test statistique sur un échantillon aussi réduit ou existe t-il une possibilité qui s'offre à moi?"
Oui, tu as raison de refuser. Oui des possibilités s'offrent à toi, mais ce n'est plus une démarche scientifique (ce n'est plus très sérieux).

"Je cherche également à connaitre la taille minimale requise afin de remplir les conditions d'utilisation de tests statistiques. "
Il n'y en a pas. les critères classiques (au moins 8, plus de 30, 100 ou plus,...) sont des appréciations expertes mais pas des résultats de preuves mathématiques. D'ailleurs qu'est-ce qui change fondamentalement entre 29 et 30 individus ? Classiquement : Est-ce que 3 cailloux est un tas de cailloux ? A partir de combien de cailloux as-t-on un tas ?

"J'ai lu qu'il fallait un minimum de 6 individus par groupe. Est-ce exact?"
A priori, non. Mais c'est un seuil raisonnable pour que le test ne soit pas systématiquement réussi (donc non significatif) pour des situations "non évidentes".

"Si oui quel test dois-je utiliser afin de tester la normalité de tels échantillons?"
Les tests de normalité peuvent montrer que la distribution n'est probablement pas normale, ils ne montrent pas qu'elle est normale (voir signification d'un test réussi). Donc si on a besoin de l'hypothèse de normalité, il faut des raisons non statistiques de l'affirmer.

"Student pour données appariées: "
tes données sont-elles effectivement appariées ? Reste la normalité. Si tu sais que la distribution des valeurs est gaussienne pour des raisons biologiques, tu peux faire une bête comparaison de moyennes, comme je l'ai conseillé à Aloe. Si tu n'as aucune raison de le penser, ou si la distribution est loin d'une gaussienne, c'est du bidon.

"Quelle serait la taille minimale requise pour réaliser un test du signe?

Existe-t'il d'autre test adapté à de très petits échantillons apparié ou non (n<5, n=3 comme ici)? "

Il en existe, mais ils ne donnent un résultat utile (test significatif) que dans des cas où la situation est évidente sans test. On revient à ma première réponse.

Cordialement.

NB : J'ai légèrement modifié la fin, faute de m'en souvenir exactement. Pour "Mann-Whitney", je n'ai rien à en dire.

Koniev · January 2011

Bonsoir
En faisant la somme des 2 suites de valeurs je veux montrer qu'elles ne sont pas du même ordre de grandeur ,
Je n'ai jamais vu faire un test avec ne telle disparité des data.
Par contre la seconde paire de data donne avec MINITAB une proba de 0.296 : elles sont comparables. donc non liées nécessairement par une relation.
Comparaison de 2 moyennes en tenant des ec-types; restriction

éries "un peu courtes"
Cordialement
Koniev

Test pour seulement 3 échantillons

Réponses

Lettre d'information