Tests et big data
dans Statistiques
Bonjour,
Que signifie ceci: "Almost any statistical test you run will be so powerful that it's almost sure to identify a "significant" effect. You have to focus much more on statistical importance, such as effect size, rather than significance."
https://stats.stackexchange.com/questions/7815/what-skills-are-required-to-perform-large-scale-statistical-analyses
Avez-vous des exemples?
Que signifie ceci: "Almost any statistical test you run will be so powerful that it's almost sure to identify a "significant" effect. You have to focus much more on statistical importance, such as effect size, rather than significance."
https://stats.stackexchange.com/questions/7815/what-skills-are-required-to-perform-large-scale-statistical-analyses
Avez-vous des exemples?
Réponses
-
Bonjour.
Hors contexte, cette phrase n'a pas de sens. Pourquoi n'importe quel test devrait-il avoir une très grande puissance ?
parlerais-tu encore de test sur de très grands échantillons ? -
Oui tout à fait. Grosso modo j'ai compris que les modèles ne collent jamais exactement la réalité et que cet écart à la réalité et beaucoup plus pénalisé avec un grand échantillon qu'un petit échantillon.
Mais je pense que j'ai besoin d'exemples concret pour vraiment comprendre -
Bonjour
Cela peut peut-être t'aider pour une partie de tes questions.
La puissance d'un test est directement liée à la taille de l'échantillon. Lorsque n est extrêmement grand, l'hypothèse nulle est systématiquement acceptée. Ainsi, un rapport de corrélation entre deux variables de 0.001 sera considéré comme significatif dans un contexte Big Data mais quel est le sens de ce résultat ?
Heureusement des stratégies commencent à émerger mais c'est un grand défi que de faire de l'inférentiel sur des données massives. Un autre exemple vu, pour tester un régime alimentaire, l'échantillon traité perd en moyenne 10 g par rapport à l'échantillon de contrôle. L'hypothèse du bien-fait du régime va être acceptée mais c'est ridicule 10 g.
Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 7 Collège/Lycée
- 21.8K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 52 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres