Test du $\chi^2$
Bonsoir
J'ai découvert le test du Chi 2 il y a très peu de temps et j'aurais besoin de quelques conseils de personnes avisées.
Je voudrais l'appliquer à une variable aléatoire qui suivrait une loi de la forme : P(X=0) = P(X=1) = 1/2 et P(X=2)=P(X=3) = 0. Cependant, dans le calcul de Q (je ne connais pas son nom exact, c'est celle qui ressemble à une distance euclidienne), nous devons diviser par P(X=2) et P(X=3), ce qui est impossible.
Est-ce que je passe à côté de quelque chose ? Certaines hypothèses pour le test ne sont pas vérifiées ? Comment puis-je y remédier ?
Merci de votre aide
J'ai découvert le test du Chi 2 il y a très peu de temps et j'aurais besoin de quelques conseils de personnes avisées.
Je voudrais l'appliquer à une variable aléatoire qui suivrait une loi de la forme : P(X=0) = P(X=1) = 1/2 et P(X=2)=P(X=3) = 0. Cependant, dans le calcul de Q (je ne connais pas son nom exact, c'est celle qui ressemble à une distance euclidienne), nous devons diviser par P(X=2) et P(X=3), ce qui est impossible.
Est-ce que je passe à côté de quelque chose ? Certaines hypothèses pour le test ne sont pas vérifiées ? Comment puis-je y remédier ?
Merci de votre aide
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Le test du khi-deux ne concerne pas les variables aléatoires, mais les statistiques (*). Cependant, rien n'interdit de simuler une variable aléatoire discrète, et de comparer le tirage au modèle. Dans ce cas, les valeurs pour lesquelles la probabilité de réalisation est nulle n'apparaîtront pas, donc il n'y aura pas de division par 0. Dans la réalité statistique, il est évident qu'on ne va pas faire des modèles qui donnent une probabilité nulle.
En fait, ta variable aléatoire n'est pas seulement nulle pour 2 et 3, mais aussi pour 4, 5, ... 0,2, 0,3, ...$\pi,\sqrt 2$, etc. Pourquoi parler de 2 et 3 spécifiquement ??
Cordialement.
NB : On peut, en probas, avoir besoin d'une distance du khi-deux; bien évidemment, pour des effectifs non nuls.
(*) et ce ne sont pas des probabilités qu'on utilise, mais des effectifs de classes.
J'ai voulu simplifier et me raccrocher à ce que je connaissais, c'est pour ça que j'ai parlé de probabilité. Cependant, le "problème" que j'étudie relève plus de la statistique que des probabilités. Je vais l'expliquer plus en profondeur.
Le Blackjack fait partie des jeux de cartes les plus populaires dans les casinos. Cependant, le joueur est désavantagé par rapport au casino. Pour pallier cela, certains joueurs "comptent" les cartes. C'est-à-dire, ils attribuent à chaque carte une certaine valeur qui correspond à l'avantage ou le désavantage que la présence de cette carte procure au joueur, puis, au fur et à mesure de la partie, il garde en tête le score total correspondant à la somme des cartes passées multipliées par leurs valeurs. Alors, si le compte est positif, le joueur est avantagé, sinon, il est désavantagé.
Mon objectif est de réfuter ou non si un joueur compte. Pour cela, avec un modèle un peu naïf, je voulais définir les classes suivantes :
- (Compte positif ; Mise > 50 (où 50 est la mise moyenne) ) : Classe 1
- (Compte positif ; Mise <= 50 ) : Classe 2
- (Compte négatif ; Mise > 50) : Classe 3
- (Compte négatif ; Mise <= 50) : Classe 4
Théoriquement, les probabilités des classes 2 et 3 sont nulles : le compteur ne devrait pas miser moins s'il est avantagé, et il ne devrait pas miser plus s'il est désavantagé.
De plus, pour plusieurs autres raisons, les probabilités des classes 1 et 4 sont toutes deux égales à 1/2.
En récoltant les données de plusieurs parties, nous pouvons avoir accès aux effectifs expérimentaux.
Je voulais alors appliquer le test du Chi 2 à ses échantillons mais les probabilités théoriques des classes 2 et 3 sont nulles.
Comment pallier ce problème ?
J'espère avoir été assez clair,
Cordialement,
Arnaud
Cordialement.
(*) S'il y a des individus qui font partie d'une classe de probabilité nulle, pas besoin de test statistique pour réfuter le modèle ! Évident, non ?