T-test apparié ou non? — Les-mathematiques.net The most powerful custom community solution in the world

T-test apparié ou non?

Bonjour,

Je prépare actuellement un mémoire, pour lequel j'ai des difficultés à choisir un test statistique, et la façon de l'appliquer.

J'étudie en échographie deux populations, une présentant une maladie, et une saine. J'étudie effectivement le même critère, qui est un pourcentage de déformation.
Dans le premier groupe j'ai 12 personnes, pour 10 témoins, tout en sachant que je continue à inclure des patients mais pas plus de témoins.

A priori il faudrait utiliser un test de Mann-Whitney pour savoir s'il existe une différence significative entre les deux groupes, mais mon boss me demande d'apparier les deux populations.

Est-ce possible vu que les deux populations n'ont pas le même effectif? Je ne pense pas pouvoir apparier un témoin à plusieurs patients, ca lui donnerait trop de poids non?

NB : j'utilise pour les statistiques un logiciel dédié (graphpad).

Merci.
«1

Réponses

  • Bonsoir.

    La taille des échantillons n'intervient pas dans Mann-Whitney (sauf probablement si elle est trop différente).

    S'il faut plus de valeurs témoin, tu peux utiliser une méthode de Boostrap (tirer au hasard les témoins supplémentaires dans la population des témoins), et en le faisant plusieurs fois, vérifier que ça ne fait pas trop varier les résultats.

    Cordialement
  • Au fait, je ne t'ai peut-être pas compris.

    "appareillé" veut-il dire "aparié" ?
    Si c'est le cas, tu n'as pas d'échantillons appariés (*), donc la question ne se pose pas.

    Cordialement

    (*) Appariés : (= par paires) Se dit d'échantillons de valeurs prises 2 fois sur les mêmes individus (donc les valeurs des paires ne sont pas indépendantes, contrairement à deux échantillons pris indépendamment).
  • Merci pour cette réponse rapide...
    Effectivement mes doigts ont rippé, je voulais bien écrire apparié. Donc si je mesure la même chose sur deux personnes différentes, il n'y a pas d'appariement? Pourtant on voit parfois dans les études que les témoins sont appariés sur l'âge ou le sexe non? Ou alors est ce un abus de langage? J'avoue que je m'y perds un peu...

    Merci en tout cas de votre diligence et votre précision.
  • Effectivement,

    mais c'est un abus, motivé par le fait qu'il y a bien une corrélation probable entre les valeurs. C'est d'ailleurs une difficulté technique, car autant, sur un seul individu, les résultats (par exemple) à deux périodes sont différents s'il y a eu une variation (et c'est elle qu'on teste), autant, sur des individus différents, la variabilité entre individus induit un "bruit" qui peut être bien supérieur à la variation générale.

    Cordialement
  • Merci beaucoup pour vos explications.

    Cordialement.

    Jérôme.
  • Bonjour
    On dit que 2 suites de résultats sont appairés quand on teste les individus d'une même groupe 2 fois : avant et après un traiement par exemple. Pour A on a 18 et 22, pour B on a 17 et 19, et ainsi de suite.
    Pour ce pb on peut aussi considérer un groupe témoin et un groupe qui reçoit le traitement. généralement on choisit "au hasard" les individus de chaque groupe qui sont tous dans un groupe homogène : par exemple : homme de 30 à 50 ans, de même "race", même cat socio-prof, ... Les effectifs sont proches de l'égalité. Dans ce cas on compare les moyennes de chaque groupe.
    Cordialement
    Koniev
  • Bonjour, une petite question, j'ai un test statistique à effectuer sur 10 sujets.

    Je dois comparer les valeurs des vitesses qu'ils atteignent lors de 2 tests physiques differents (pas le meme test).

    S'agit-il d'un test statistique apparié ou non apparié ?

    Merci pour vos reponses.
  • Apparié

    Cordialement
  • Merci beaucoup et bonne journée.
  • la taille de l'échantillon n'intervient pas dans le choix du test
    il faut regarder la nature de la variable ( qualitative, ordinale, proportionnelle)
    la situation( statistique bivariée ou uni variée)
    si les échantillons sont indépendant ou appariés.

    le Mann-Whitney s'applique pour deux échantillons indépendant dans une statistique uni variée et pour une variable ordinale.
  • Bonjour Franck Evina Ella

    "la taille de l'échantillon n'intervient pas dans le choix du test "
    Oh que si !

    Cordialement.
  • J'ai dit dans le choix du test pas dans le calcul des resultats du test.il est evident que si ce test est choisi la taille de l'échantillon interviendra pour les différents calculs. La taille de l'échantillon ne peut pas nous dire "guider" si c'est le test de Mann- Whitney que nous devons choisir ou non.
  • Pour Franck Evina Ella.

    Relis mon message. J'ai parfaitement choisi .. les mots.

    Cordialement.
  • Gerard a bien raison. Il est tout à fait évident que la taille de l'échantillon compte pour le choix d'un test statistique.

    - Pour faire un test de Student entre des groupes d'échantillons indépendants : il faut minimum 6 échantillons dans chaque groupe.

    - Dans le cas d'un test de Student apparié 3 échantillons suffisent.
    -Pour un test non paramétrique de Mann Whitney ou de Wilcoxon : 3 échantillons dans chaque groupe suffisent également.

    Ce la voudrait tout simplement dire que si l'on a à faire à des groupes de petite taille, il faudrait choisir plutôt un test non paramétrique (Wilcoxon ou Mann-Whitney) plutôt que de faire un test paramétrique( Student)

    Cordialement,
    Pearson
    http://123soft.franceserv.com/
  • Bonsoir
    J'aimerais bien savoir quel type de test je dois effectuer si je fais une comparaison avant et après la cotation en bourse des performances des sociétés. Et je trouve des problèmes concernant les variables à choisir dans le cadre du modèle économétrique, la variable explicative et la performance de sociétés privatisées cotées en bourse. Je ne sais pas quelle seront les variables explicatives les plus significative.
    Merci
  • Bonjour.

    "quel type de test je dois effectuer si je fais une comparaison avant et après la cotation en bourse des performances des sociétés" : Bien sûr des tests de données appariées. par contre, difficile de dire quoi que ce soit sans savoir ce qu'on compare !

    "Je ne sais pas quelle seront les variables explicatives les plus significative" : C'est à cela que sert l'étude !

    Cordialement.
  • Bonjour,

    Je souhaite faire un test non paramétriques sur deux échantillons non appariés (individus différents). La taille des échantillons peut être la même ou différente selon les fois. Dois-je utiliser Wilcoxon ou Mann-Whitney ?

    Merci

    Isabelle
  • Bonjour.

    Ces deux tests sont basés sur les mêmes idées. Donc pour des échantillons de taille petite ou moyenne, pas de différence.

    Cordialement.
  • Bonsoir,

    Petite question :
    Si j'ai par exemple, 6 patients dont je mesure des paramètres dans une position a puis dans une position b
    Et je veux voir si la position a permet un angle du genou plus grand que b par exemple.
    Est-ce que j'utilise un test t ou un test non paramétrique de Wilcoxon et pourquoi ?

    J'ai lu dans le forum, que nous pouvions utiliser un test de Wilcoxon à partir de 3 échantillons dans chaque groupe alors que je pensais qu'il fallait au moins 6 mesures différentes (soit 6 personnes si les mesures en a et en b sont différentes)...
    Est-ce que quelqu'un peut me répondre et m'éclairer ?
    Merci

    [Wilcoxon, en toute occasion, prend une majuscule. AD]
  • Bonjour.

    Si tu as de bonnes raisons de considérer que la répartition des valeurs possibles est gaussienne (pas le 6 de l'échantillon, mais toutes les valeurs possibles), le T-test convient. Sinon, tu peux tenter Wilcoxon, mais c'est assez peu fiable : 6 individus, c'est vraiment un tout petit échantillon. Quant à 3, ce n'est plus du tout sérieux (même si les tables commencent parfois à 3).

    Par contre, j'espère que j'ai bien interprété ce que tu veux faire.

    Cordialement.
  • Bonjour,

    J'ai une question concernant la taille des échantillons.
    Je veux réaliser un test de Mann-Whitney afin de voir si mes 2 populations peuvent être considérées comme ''homogènes'' sur un critère défini.
    Ma population A contient 14 individus et ma population B en contient 72.
    A priori le test de M-W ne requiert pas que les 2 populations soient de même taille mais là, le gap est quand même gros...

    J'ai réalisé le test 14 vs 72 et ai réalisé 100 tests 14 vs 14 en tirant aléatoirement les 14 individus parmi les 72 de la famille B.

    Ensuite, j'ai moyenné les p-values des 100 tests pour définir si oui ou non le test était réussi, j'ai testé en prenant le mode des 100 tests...

    Dans tous les cas, je ne trouve pas du tout les mêmes résultats en faisant 14 vs 72 et 14 vs 14.

    Ma question est donc, que faire ?! et surtout, pourquoi.

    D'avance merci pour vos conseils éclairés.

    Bonne journée,
  • Bonjour.

    A priori le test 14/72 est plus puissant (*) que chacun des tests 14/14. On doit donc le préférer.
    "oui, mais j'ai fait une moyenne !" Et alors ? Que peut signifier cette moyenne ? Que vaut la somme de 2 p-values ?
    La p-value est une borne; pas une mesure. Si tu as deux rues en impasse, l'une de 100 m, l'autre de 300 m, que signifie la moyenne 200 m ?

    Donc on fait le test 14/72 et on oublie le reste.

    Cordialement.

    (*) très intuitivement : Plus on a de connaissances, mieux on peut conclure.
  • Bonjour gerard0,

    Merci pour votre réponse.

    En effet, faire la moyenne des p-values n'a pas de sens.

    Pour ce qu'il en est de ma question, elle était surtout motivée par le fait que le test de M-W est basée sur la comparaison du rang des individus de chacune des deux populations donc si une des deux familles est plus représentée que l'autre, il y aura, de fait, une disparité au niveau de ces classements de rang.

    Bien cordialement.
  • En fait, c'est plus subtil : On regarde si les valeurs d'une série sont "bien réparties" parmi celles de l'autre. Si les valeurs proviennent de la même population (ou de populations suivant la même loi), la statistique de Mann-Whithney suit une loi approximativement Normale de moyenne et variances connus. Le test est basé là dessus. la taille des échantillons intervient, qu'elle soit la même ou non. Et prend justement en compte " une disparité au niveau de ces classements de rang".

    Evidemment, si une des séries va de 5 à 8 et l'autre, la plus nombreuse, de 0 à 20, le test va échouer. mais c'est bien ce qu'on veut : les séries ne sont pas comparables !!

    Cordialement.
  • Merci Gerard0.
  • bonsoir;

    Je désire tester la différence de la performance entre les entreprises familiales cotées et les entreprises non familiales cotées en bourse. bien entendue ces entreprises ne sont pas du même secteur d'activité ni de la même taille. un deuxième test c'est la différence de performance entre les entreprises à majorité familiale et une autre à minorité familiale. comment je peux procéder?

    Est ce qu'il s'agit des échantillons appariés ou non appariées?
    et c'est quoi le test que je pourrai utiliser?

    est ce quelqu'un pourrait m'aider?
    Merci.
  • Bonjour.

    Pourquoi poser cette question ici ? Il n'y a pas appariement !

    Sinon, les tests que tu peux utiliser sont nombreux et dépendent des hypothèses que tu peux faire sur les populations dont tu as tiré un échantillon.
    D'ailleurs le fait que tes échantillons soient non biaisés est fondamental. S'ils n'ont pas été tirés correctement, les résultats des tests sont sans utilité. Si tu n'as pas encore collationné les données, il va falloir voir comment faire.

    Donc explicite un peu plus ce que tu as fait.

    Cordialement.
  • bonjour ;

    Je tiens tout d'abord à vous remercier pour votre réponse, en fait j'ai réussi à les apparier en utilisant les critères de la taille et le secteur d'activité, et ça m'a donné 27 paires, est ce suffisant pour procéder à des teste de moyenne?

    Merci
  • Je ne comprends pas.

    dans les tests appariés, ce ne sont pas les individus qui sont appariés (mis par paires), mais les données (une paire de données pour chaque individu).

    Cordialement.
  • re-bonjour;

    Je vous explique. j'ai fais cette assemblement entre entreprises familiales et entreprises non familiales pour les rendre un seul individu. par la suite, la performance prend deux valeurs (celle de l'entreprise familiale et l'autre pour l'entreprise non familiale). Mais après, je ne sais pas comment je peux vérifier la différence?

    Merci
  • Mais ce n'est pas le même individu, puisque ce n'est pas la même entreprise !

    pourquoi vouloir apparier, alors qu'on sait très bien comparer des échantillons sans apparier. Le t-test de base est d'ailleurs une comparaison sans appariement.
  • Je vous remercie de vos explications, mais j'ai trouvé un article qui traite la même problématique que moi; et on a fait un appariement des entreprises familiales et non familiales. Je vous envoie cet article en pièces jointe.

    Merci
  • Eh bien,

    si tu veux utiliser une méthodologie malsaine employée par d'autres, fais-le. Mais ne me demande pas d'être d'accord avec la méthode. En gros, elle correspond à analyser des différences sur un point entre individus qui "se ressemblent" sur certains autres points. Comme la justification de la significativité des ressemblances ne peut être scientifiquement étayée, les échantillons sont biaisés.

    Mais comme beaucoup font comme toi (employer une méthode sous prétexte qu'elle a été employée par d'autres), des méthodes malsaines sont employées de bonne foi par ceux qui ne réfléchissent pas suffisamment à la scientificité des méthodes.

    Cordialement.
  • ce que je vais faire, c'est de laisser tomber cette méthode et comparer des échantillons indépendants. Je vous remercie de vos conseils, mais je veux savoir il me faut combien d'entreprises pour le faire? est ce qu'un petit échantillon peut faire les test?
  • Tout dépend des situations.

    Avec une variable gaussienne, on peut tenter un test de Student avec un tout petit échantillon (disons 8 à 10). Si la variable n'est pas gaussienne, on peut le faire avec des échantillons de plus de 30. Sinon, il existe des tests non paramétriques (Wilcoxon non apparié, ou Mann-Whithney, par exemple).

    Cordialement.

    NB : Tu devrais prendre le temps de lire un bon bouquin de statistiques.
  • Bonjour Gerard0
    Merci pour tes éclaircissements que tu ne cesses de nous donner au jour le jour. je veux savoir quel test utiliser pour mon étude en fait je cherche à savoir quelle est l'impact de la distance sur la densité de trois espèces forestières, je sais déjà que ces espèces ne suivent pas la loi normal quel est le test que je peux utiliser ici pour le montrer
    Merci d'avance
    Ronald
  • Bonjour.

    Ce que tu dis n'est pas très clair. En particulier "la distance" ??? la distance à quoi ? Ou entre quoi et quoi ?. Si c'est la distance moyenne entre deux arbres de cette espèce, la réponse est évidente !
    De même : "ces espèces ne suivent pas la loi normale" est une évidence, une espèce n'est ni une variable aléatoire, ni une variable statistique continue. Mais il est difficile de savoir ce qui pourrait bien suivre une loi Normale.

    Donc éclaircis complètement ta problématique.

    Cordialement.
  • Bonsoir,

    J'ai lu toutes les réponses que vous avez données, mais je n'arrive pas à trouver une réponse à mon problème et j'aimerais savoir si vous pouviez m'aider.
    J'étudie des scanners de crâne ayant des déformations macroscopiques unilatérale. Le but de mon étude est de voir s'il y a des différences microscopiques entre les côtés homo et controlatéral à la déformation. J'ai donc mesuré des distances au sein de chaque côté puis utilisé le test T de Student afin de savoir s'il était possible d’émettre une différence entre les 2 côtés. Mon problème est de savoir s'il faut utiliser le test apparié ou non. En effet, les données comparées sont sur le même individu mais ne correspondent pas au même côté. J'espère que mon explication est claire, n'hésitez pas à me demander des informations complémentaires.

    Merci et bonne soirée.
  • Bonjour.

    pas le même côté : 2 mesures à comparer
    sur le même individu.

    C'est typiquement un cas d'appariement (mot construit sur "paire").

    Cordialement.
  • Merci beaucoup pour la réponse !

    Bonne soirée,

    Cordialement
  • Bonjour, j'ai posté un sujet sur le forum mais il est un peu vague je vous l'accorde.

    Je profite de ce sujet-ci pour vous préciser mon problème.

    Pour mon mémoire j'ai effectué des tests physiques sur 2 échantillons de 11 personnes (groupe test et groupe placebo).
    J'ai effectué ces tests 4 fois dans le temps avec chaque fois un traitement différent avant.

    Je souhaiterais savoir si les différents traitement que j'ai réalisés sur les patients ont amélioré les tests physiques.

    On m'a conseillé de faire un test de Student pour échantillons appariés.

    Étant donné que j'aimerais savoir si ça a amélioré ou non, je présume que je dois faire un test unilatéral ?

    Je ne suis pas sûr que les valeurs suivent une loi normale, comment pourrais-je en être sûr ? Afin de voir si je ne dois pas utiliser de préférence un Wilcoxon

    Merci et bonne soirée.
  • Bonjour Mr
    Dans la cadre d'un travail de fin d’étude sur l'effet d'une substance sur plasma par apport à un témoin, à 3 répétitions.
    Je pose la question Mr est-ce que le test t apparié ou non apparié qu'on doit utiliser ? Ou bien il faut choisir autre test ? Merci d'avance ?
  • Bonjour.

    Comme tu ne décris pas le test, on ne peut pas savoir ...
    Si ce sont les mêmes sujets qui sont en cause, le test sera apparié.

    Cordialement.

    NB : pas de Mr sur ce forum.
  • Bonjour,
    J'aurais besoin d'un éclaircissement concernant une étude.

    Je réalise une étude où l'on dose une molécule chez des gens à un moment donné et 3ans après. Je cherche à comparer la variation des résultats entre ces 2 prélèvements par personne. il faut donc un test apparié pour étudier des valeurs quantitatives, donc soit un test de Wilcoxon soit un t-test apparié (si je ne me trompe pas). Mon effectif est de 36 personnes, quel est le test le plus adapté entre les 2 pour cet effectif ? Y a-t-il une différence entre ces 2 tests et dans quel cas utiliser plutôt l'un ou plutôt l'autre ?

    Merci de vos réponses.
  • Bonjour,
    J'ai 3 groupes de 10 individus (non appariés) et je voudrais savoir quels tests statisitiques non paramétriques utiliser.
    Il me semble qu'il faut d'abord faire un test pour les 3 groupes pour voir s'il existe une différence stat et que je ne peux faire ensuite des comparaisons 2 à 2 que si j'ai mis en évidence une différence statistique avec le premier test.
    Est-ce que mes souvenirs sont bons et pourriez-vous me rappeler les noms de ces tests ?

    Merci beaucoup pour votre réponse.
  • Bonjour
    je suis en train de travailler un sujet de thèse , jai un petit probleme concenrnant:

    jai quatre traitement differents , et jai plusieurs critères à controler (10), je veux savoir quel quel critère (s) de controle parmi les 10 a une influence significatif et sur quel traitement. y til svp une solution stastique pour répondre à cette question.
  • Bonjour.

    Quel rapport avec le t-test ?

    Sinon, suivant les circonstances, il y a peut-être une réponse à ta question, mais comme ton nexplication est très floue, difficile de savoir. A vue de nez, tu trouveras peut-être ton bonheur dans l'analyse de la variance. En tout cas, ne te lance pas sans avoir étudié un bon bouquin de statistiques : En les faisant sans connaissances sérieuses, on aboutit à des résultats absurdes.

    Cordialement.
  • Bonjour, merci pour votre réponse,
    pour bien éclaircir les choses , j-ai réalisé quatre traitements sur un textile, et je contrôle leurs influences sur 10 paramètres caractéristiques de mon textile. je veux donc savoir statistiquement, est ce que un ou les traitements a une influence significative sur le paramètre.( c-est pour pouvoir dire enfin que le traitement X peut etre évalué seulement en fonction de tel ou tel paramètre , et de rejeter les autres )
  • Avec 4 traitements, je ne vois pas où sont les statistiques. Je ne sais d'ailleurs pas ce que peut vouloir dire ici "influence significative". En statistiques, le mot significatif correspond à l'usage d'un test qui rejette l'hypothèse H0. Tu sembles l'utiliser d'une façon bien plus générale.

    Je renouvelle mon conseil : Etudie un ouvrage de statistiques inférentielles.

    Cordialement.
  • Bonjour,
    j'ai un groupe qui a répondu a 2 reprises (temps 2 est 6 mois plus tard) au même questionnaire. Le groupe totalise 50 personne. Toutefois, 43 ont répondu au temps 1 et 25 au temps 2. De cela, seulement 15 personnes ont pu être appariés. Je me demande donc s'il est plus juste de faire mes anlayses test t appariés (puisqu'il s'agit de 14 personnes et que j'ai l'impression de laisser tomber mes autres réponses ainsi) ou de faire un test t pour groupe indépendants (mais alors je m'interroge à savoir si c'est ok statistiquement de dire qu'ils sont indépendants même s'il s'agit en réalité du même groupe...)
    Merci infiniment!
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!