Matrice des liaisons

Bonjour,

Je souhaiterais avoir l'avis de spécialistes en statistiques sur la pertinence de "la matrice des liaisons" https://fr.wikipedia.org/wiki/Matrice_des_liaisons. C'est la première fois que je vois "un outil" qui généralise la matrice de corrélation à tous types de variables néanmoins est-ce que l'on peut comparer de tels indicateurs ?

Par exemple le phi^2 avant d'être normalisé (V de Cramer par exemple) ne tombe pas entre 0 et 1 et n'est pas comparable à un coefficient de corrélation entre deux variables numériques : on ne peut donc pas dire les variables numériques N1 et N2 (qui ont par exemple un R^2 égale à 0.9) sont moins "liés" que les variables Q1 et Q2 (qui auraient un phi^2 de 2.8).

Malgré une approche intéressante je ne suis pas sûr que coder un tel outil aurait un intérêt...

Réponses

  • Bonjour,
    Le lien que tu donnes montre comment lire un tel tableau en prenant en compte les trois mesures de liaison. Outre, la possibilité d'avoir sous les yeux ces liaisons, il y a au moins un traitement de ce tableau L'AFDM.
    Corfialement.
  • Effectivement le lien ne prétends pas comparer des couples de variables de types distincts. Par exemple si l'on a $C1,C2$ des variables atégorielles et $Q1,Q2$ des variables quantitatives l'article ne prétends pas qu'une valeur de lien $L(Q1,Q2)$ plus élevée que $L(Q1,C1)$ indique que "l'importance" de la liaison entre les variables Q1 et Q2 est plus grande qu'entre les variables Q1 et C1 (car on ne mesure pas 2 à 2 des couples de variables de même nature).

    Cependant existe t'il une manière de le faire ? Peut être que l'AFDM me donnera la solution... En fait çe serait super intéressant dans un contexte supervisé, pour étudier l'importance de la liaison entre un feature donné et la variable à prédire $Y$. Ca me permetterait de faire une sélection de variable sans tenir compte de la nature du feature considéré, ce qui permettrait une automatisation facile (même si ce procédé ne considérerait que les features isolément et non leur intéraction qui pourrait avoir une importance pour la prédiction.

    N'ayant jamais vu d'étude prenant cette direction j'imagine que cette démarche n'est pas pertinente (où impossible), pourquoi ?
  • A vif, je me demande si il n'y a pas quelque chose à faire dans un contexte supervisé mais je m'avance un peu. Je pense à l'ACP dans le contexte de la régression linéaire. Je vais me renseigner et revenir vers toi si je trouve quelque chose.
    Bonne journée.
  • Bonjour,

    Je n'ai pas trouvé d'apllications de l'AFDM dans un contexte supervisé à l'instar de la régression sur composantes principales donc à suivre...

    Cordialement.
  • Merci d'avoir regardé.
Connectez-vous ou Inscrivez-vous pour répondre.