Matrice des liaisons
dans Statistiques
Bonjour
Je viens de tomber sur cette page: https://fr.wikipedia.org/wiki/Matrice_des_liaisons qui est une sorte de "généralisation" de la matrice des corrélations à tous types de variables (d'ailleurs dans le Tuffery il mentionne le caractère comparable entre un V de [large]C[/large]ramer et un rapport de corrélation) . Je me suis donc dit "génial" je vais l'implémenter pour avoir une forme d'automatisation du calcul des intensités des liaisons de mes différentes variables.
Cependant je reste assez sceptique :
1) Si je fais un filtre "me donner toutes les variables dont la "corrélation généralisée" est en valeur absolue supérieur à 30%" pour obtenir les corrélations principales n'est-ce pas une grosse erreur ? Est-ce qu'un rapport de corrélation $\eta^2$ "significatif" est du même ordre de grandeur qu'un $\phi^2$ où un coefficient de corrélation $r^2$ ? En mettant un filtre à 0.3 ne risquè-je pas d'occulter tous les rapports de corrélations ?
2) Est-ce que certains de ces indicateurs sont plus ou moins sensibles au volume des données ? Dans le document ci contre http://www.pacea.u-bordeaux1.fr/IMG/pdf/rapport_correl.pdf l'auteur indique que son rapport de corrélation $\nu^2=0.2$ est faible... Qu'est-ce que ça veut dire ? Comment juger d'un tel indicateur et en conclure que mes variables sont pas ou peu corrélées ?
Merci pour votre aide je suis très confus...
[Les noms propres prennent toujours une majuscule. AD]
Je viens de tomber sur cette page: https://fr.wikipedia.org/wiki/Matrice_des_liaisons qui est une sorte de "généralisation" de la matrice des corrélations à tous types de variables (d'ailleurs dans le Tuffery il mentionne le caractère comparable entre un V de [large]C[/large]ramer et un rapport de corrélation) . Je me suis donc dit "génial" je vais l'implémenter pour avoir une forme d'automatisation du calcul des intensités des liaisons de mes différentes variables.
Cependant je reste assez sceptique :
1) Si je fais un filtre "me donner toutes les variables dont la "corrélation généralisée" est en valeur absolue supérieur à 30%" pour obtenir les corrélations principales n'est-ce pas une grosse erreur ? Est-ce qu'un rapport de corrélation $\eta^2$ "significatif" est du même ordre de grandeur qu'un $\phi^2$ où un coefficient de corrélation $r^2$ ? En mettant un filtre à 0.3 ne risquè-je pas d'occulter tous les rapports de corrélations ?
2) Est-ce que certains de ces indicateurs sont plus ou moins sensibles au volume des données ? Dans le document ci contre http://www.pacea.u-bordeaux1.fr/IMG/pdf/rapport_correl.pdf l'auteur indique que son rapport de corrélation $\nu^2=0.2$ est faible... Qu'est-ce que ça veut dire ? Comment juger d'un tel indicateur et en conclure que mes variables sont pas ou peu corrélées ?
Merci pour votre aide je suis très confus...
[Les noms propres prennent toujours une majuscule. AD]
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.2K Toutes les catégories
- 9 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 65 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 314 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 773 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres