Tests khi2, Fisher, ...

Bonjour à tous
Tout d'abord je m'excuse pour ma question qui est je pense très basique... Mais je me perds complètement dans toutes les informations que je trouve sur internet et je suis prise pas le temps.

Pour un exercice, je dois notamment analyser l'impact de la langue des personnes interrogées sur leur consommation de viande. Je travaille avec R. Je suis partie sur un test de khi-carré, puisque que la consommation est une variable qualitative. Cependant, mon échantillonnage est trop faible, je reçois le message "Warning message:In chisq.test(lan_ins) : l'approximation du Chi-2 est peut-être incorrecte". Je ne souhaite pas rassembler les langues en catégories différentes (ça n'aurait pas de sens), mais je ne sais pas si je dois utiliser un test de [large]F[/large]isher ou refaire un test de khi carré avec la simulation de Monte Carlo : chisq.test(lan_ins, simulate.p.value=TRUE) ? Ou faire carrément autre chose ?
En plus, au cours de mes recherches, j'ai été prise d'un doute, est-ce que je peux faire le test de khi carré et de Fisher avec des tableaux plus grands que 2x2 ?

J'ai cet effectif :
0 1
Langue 1 10 1
Langue 2 1 3
Langue 3 3 0
Langue 4 13 26
Langue 5 2 0
Langue 6 5 13
Langue 7 8 7
Langue 8 1 24
Langue 9 2 0

Voilà, je m'excuse encore pour la simplicité de ma question, je ne maîtrise pas du tout les statistiques mais j'ai absolument besoin de résoudre ce problème pour mon stage.
Merci d'avance à tout ceux qui prendrons le temps de m'aider,
Belle journée à vous,
Louisa

[Ronald Aylmer Fisher (1890-1962) prend toujours une majuscule. AD]

Réponses

  • Le test du khi-deux comme celui de Fischer se font sur des tableaux de contingence à plus de 2 lignes et 2 colonnes. le khi-deux est un test "asymptotique", qui suppose que dans le tableau modèle, les effectifs soient suffisants (en général on demande plus de 5), mais les logiciels préviennent dès qu'il y a des effectifs très inférieurs dans le tableau réel, en particulier lorsqu'il y a des classes vides. Dans ton cas, la faiblesse des effectifs pour certaines langues fait que le tableau modèle sera incorrect.
    Il te reste alors le test exact de Fischer.

    Mais il y a quand même un gros problème méthodologique : le très faible effectif pour certaines langues fait que tu ne peux avoir aucune confiance dans ce qui sortira. Rencontrer un locuteur de la langue 5 qui est dans la deuxième catégorie fait changer de 33% la fréquence des deux classes !!!

    Et finalement, pourquoi faire un test (*) ? La faiblesse de certains effectifs fait que l'échantillon est très probablement biaisé, qu'on ne peut pas tirer de ces résultats des renseignements à caractère général.

    Cordialement.


    (*) sauf si c'est explicitement demandé, dans ce cas tu le fais, puis tu rajoutes l'indication que les effectifs sont trop faibles pour que ça ait une signification utile.
  • Tout d'abord, merci beaucoup pour votre réponse.

    Je suis tout à fait consciente que mon échantillonnage est biaisé... Ce sont des données qui ont été récoltées dans une université d'un pays africain où plus de 50 langues différentes sont parlées. Au total 119 personnes ont été interrogées, et j'ai déjà rassemblé certaines langues très proches pour augmenter les effectifs.

    J'indiquerai bien entendu dans le rapport que les effectifs sont trop faibles pour pouvoir tirer des conclusions générales pour la majorité des ethnies...

    Merci encore pour votre aide et bonne soirée.
Connectez-vous ou Inscrivez-vous pour répondre.