Renormalisation
Bonjour,
JE dispose d'un jeu de données et d'une variable note en principe bornée dans l'intervalle [0,100]. Or en pratique je constate que cette variable peut prendre des valeurs allant de 8 à 140 . En regardant de plus près je vois que la médiane et la moyenne tournent autour de 75 (/100). De plus l'histogramme des notes présentent une tête en cloche type Gaussienne. Je me dis qu'il y a peut être moyen de normaliser ces notes de manière à garder une borne supérieure de 100, en respectant la distribution et en essayant de conserver la "distance" entre les notes. Que feriez vous ? Est ce que multiplier les notes par un facteur 100/140 est une bonne idée ? Y a-t-il plus malin ?
JE dispose d'un jeu de données et d'une variable note en principe bornée dans l'intervalle [0,100]. Or en pratique je constate que cette variable peut prendre des valeurs allant de 8 à 140 . En regardant de plus près je vois que la médiane et la moyenne tournent autour de 75 (/100). De plus l'histogramme des notes présentent une tête en cloche type Gaussienne. Je me dis qu'il y a peut être moyen de normaliser ces notes de manière à garder une borne supérieure de 100, en respectant la distribution et en essayant de conserver la "distance" entre les notes. Que feriez vous ? Est ce que multiplier les notes par un facteur 100/140 est une bonne idée ? Y a-t-il plus malin ?
Réponses
-
Bonjour.
Avant toute transformation des données, il faut comprendre pourquoi ces valeurs, "en principe bornée dans l'intervalle [0,100]" vont de 8 à 140.
Pour l'allure gaussienne de la répartition des valeurs, à toi de comprendre pourquoi. C'est fréquent pour des notes obtenues par sommation de notes indépendantes (donc aussi par moyenne).
"Est ce que multiplier les notes par un facteur 100/140 est une bonne idée ?" toi seul peut savoir. Pour nous, qu'elles aillent de 0 à 100 ou de 8 à 140, ça ne change rien.
Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 7 Collège/Lycée
- 21.8K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 52 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres