Matrice des liaisons
dans Statistiques
Bonjour,
Je souhaiterais avoir l'avis de spécialistes en statistiques sur la pertinence de "la matrice des liaisons" https://fr.wikipedia.org/wiki/Matrice_des_liaisons. C'est la première fois que je vois "un outil" qui généralise la matrice de corrélation à tous types de variables néanmoins est-ce que l'on peut comparer de tels indicateurs ?
Par exemple le phi^2 avant d'être normalisé (V de Cramer par exemple) ne tombe pas entre 0 et 1 et n'est pas comparable à un coefficient de corrélation entre deux variables numériques : on ne peut donc pas dire les variables numériques N1 et N2 (qui ont par exemple un R^2 égale à 0.9) sont moins "liés" que les variables Q1 et Q2 (qui auraient un phi^2 de 2.8).
Malgré une approche intéressante je ne suis pas sûr que coder un tel outil aurait un intérêt...
Je souhaiterais avoir l'avis de spécialistes en statistiques sur la pertinence de "la matrice des liaisons" https://fr.wikipedia.org/wiki/Matrice_des_liaisons. C'est la première fois que je vois "un outil" qui généralise la matrice de corrélation à tous types de variables néanmoins est-ce que l'on peut comparer de tels indicateurs ?
Par exemple le phi^2 avant d'être normalisé (V de Cramer par exemple) ne tombe pas entre 0 et 1 et n'est pas comparable à un coefficient de corrélation entre deux variables numériques : on ne peut donc pas dire les variables numériques N1 et N2 (qui ont par exemple un R^2 égale à 0.9) sont moins "liés" que les variables Q1 et Q2 (qui auraient un phi^2 de 2.8).
Malgré une approche intéressante je ne suis pas sûr que coder un tel outil aurait un intérêt...
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Le lien que tu donnes montre comment lire un tel tableau en prenant en compte les trois mesures de liaison. Outre, la possibilité d'avoir sous les yeux ces liaisons, il y a au moins un traitement de ce tableau L'AFDM.
Corfialement.
Cependant existe t'il une manière de le faire ? Peut être que l'AFDM me donnera la solution... En fait çe serait super intéressant dans un contexte supervisé, pour étudier l'importance de la liaison entre un feature donné et la variable à prédire $Y$. Ca me permetterait de faire une sélection de variable sans tenir compte de la nature du feature considéré, ce qui permettrait une automatisation facile (même si ce procédé ne considérerait que les features isolément et non leur intéraction qui pourrait avoir une importance pour la prédiction.
N'ayant jamais vu d'étude prenant cette direction j'imagine que cette démarche n'est pas pertinente (où impossible), pourquoi ?
Bonne journée.
Je n'ai pas trouvé d'apllications de l'AFDM dans un contexte supervisé à l'instar de la régression sur composantes principales donc à suivre...
Cordialement.