anova déséquilibrée à 2 facteurs
Bonjour,
Lors d'une ANOVA à 2 facteurs (sans interaction), la projection des données sur le facteur A n'est pas indépendante de celle sur le facteur B lorsque le plan est désiquilibré.
On introduit alors 2 types de source de variation expliquée par un facteur (somme des carrés) :
- séquentielle : on projette sur A puis sur l'orthogonal de A dans A+B ; les sources de variation SC_A et SC_B dépendent alors de l'ordre des facteurs ; si on met A en premier on interprète SC_B comme la variation restante expliquée par B du fait que A fait déjà partie du modèle
- ajustée : la source de variation SC_A due au facteur A est celle obtenue en faisant la méthode séquentielle avec B en premier (i.e. orthogonal de B dans A+B), et vice-versa pour SC_B (i.e. orthogonal de A dans A+B)
Je ne parviens pas à trouver une interprétation du fait que dans le cas équilibré, la variation restante expliquée par B du fait que A fait déjà partie du modèle ne dépend pas du fait que A est déjà dans le modèle (il y a orthogonalité dans ce cas).
Lors d'une ANOVA à 2 facteurs (sans interaction), la projection des données sur le facteur A n'est pas indépendante de celle sur le facteur B lorsque le plan est désiquilibré.
On introduit alors 2 types de source de variation expliquée par un facteur (somme des carrés) :
- séquentielle : on projette sur A puis sur l'orthogonal de A dans A+B ; les sources de variation SC_A et SC_B dépendent alors de l'ordre des facteurs ; si on met A en premier on interprète SC_B comme la variation restante expliquée par B du fait que A fait déjà partie du modèle
- ajustée : la source de variation SC_A due au facteur A est celle obtenue en faisant la méthode séquentielle avec B en premier (i.e. orthogonal de B dans A+B), et vice-versa pour SC_B (i.e. orthogonal de A dans A+B)
Je ne parviens pas à trouver une interprétation du fait que dans le cas équilibré, la variation restante expliquée par B du fait que A fait déjà partie du modèle ne dépend pas du fait que A est déjà dans le modèle (il y a orthogonalité dans ce cas).
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Si c'est une question d'orthogonalité, c'est probablement une propriété des projections orthogonales. Cela m'évoque le "théorème des trois perpendiculaires" de la géométrie dans l'espace. Ou encore l'image suivante : On projette un point de l'espace sur deux plans perpendiculaires. Puis chaque projeté sur l'autre plan (donc on arrive au même point, le projeté sur la droite intersection des deux plans. Les distances de projections sont les mêmes, qu'on passe par l'un ou l'autre des plans en premier.
Cordialement.
Je vais illustrer ma question avec un exemple, en espérant la rendre plus séduisante.
On fait un test de QI à des enfants. Il y a deux facteurs, qui concernent la mère de ces enfants : si elle a fait des hautes études ou pas ('mom.hs') et sa présence lors des 3 premières années du bébé (facteur 'mom.work', qui a 4 modalités, selon que la mère était plus ou moins présente). Inteprétation : le facteur 'mom.hs' a un effet significatif sur le QI des enfants, mais une fois que ce facteur a été inclus dans le modèle, le facteur 'mom.work' n'a pas d'effet significatif ("sur la variation restante") Interprétation: le facteur 'mom.work' a un effet significatif sur le QI des enfants, et quand on ajoute le facteur 'mom.hs', il a un effet significatif "sur la variation restante".
Ma question suit. Lorsque les données sont équilibrées, l'ordre des facteurs n'a pas d'importance, contrairement au cas ci-dessus. Je connais les mathématiques qui causent ce phénomène, c'est une histoire d'orthogonalité entre espaces sur lesquels on projette, comme évoqué par Gérard. Mais je ne parviens pas à trouver une interprétation sans (trop de) mathématiques.
Je ne sais pas si ca va t'aider mais ca ne coute rien:
Voila comment j'interpretterais les résultats:
Le facteur mom.hs a un effet significatif dans tous les cas mais pour mom.work, il doit y avoir un effet du niveau d'étude sur la présence de la mère et il y a ausii surement un effet de la mère sur le niveau d'etude. Lorsque l'on introduit d'abord le facteur présence il a un effet significatif ce qui ne m'étonne pas et lorsque l'on introduit d'abord le facteur niveau d'étude on tiens deja compt de la présence ou pas de la mère et on dilue en quelque sorte ses effet. En gros je dirais que les variation restantes lorsque l'on a deja introduit mom.hs dans le modèle sont moins importante que lorsque introduits d'abord mom.work.
A mon avis, dans ce cas un modèle avec effet aléatoire correspondrais peut être mieux a la réalitée puisque les mère sont choisie parmis un échantillon de mère ayant fait différentes études et ayant été plus ou moins présente mais pas moyen a priori de décider si les fréquence de présence des mère correspondant a chaque facteur sont due a l'échantillon ou si elle corresponde a une réalitée.
Cordialement,
bd.
Je me fiche complétement de cet exemple, je pose la question de : comment interpréter, en général, le fait que l'ordre des facteurs n'a pas d'importance lorsque le plan est équilibré ?
Peut être comme une certaine indépendance, si je note $A_i$ et $B_i$ les niveau de tes facteur et si je construit un tableau de contingence avec le tableau du plan d'experience on a:
$\mathbb{P}(A_i \bigcap B_i) = \mathbb{P}(A_i)\mathbb{P}(B_i)$ dans le cas équilibré alors que si le plan ne l'ai plus, ce n'est plus le cas donc pas étonnant que $\mathbb{P}(A \vert = \mathbb{P}(B \vert A)$.
Cordialement,
bd.