Renormalisation

Bonjour,

JE dispose d'un jeu de données et d'une variable note en principe bornée dans l'intervalle [0,100]. Or en pratique je constate que cette variable peut prendre des valeurs allant de 8 à 140 . En regardant de plus près je vois que la médiane et la moyenne tournent autour de 75 (/100). De plus l'histogramme des notes présentent une tête en cloche type Gaussienne. Je me dis qu'il y a peut être moyen de normaliser ces notes de manière à garder une borne supérieure de 100, en respectant la distribution et en essayant de conserver la "distance" entre les notes. Que feriez vous ? Est ce que multiplier les notes par un facteur 100/140 est une bonne idée ? Y a-t-il plus malin ?

Réponses

  • Bonjour.

    Avant toute transformation des données, il faut comprendre pourquoi ces valeurs, "en principe bornée dans l'intervalle [0,100]" vont de 8 à 140.

    Pour l'allure gaussienne de la répartition des valeurs, à toi de comprendre pourquoi. C'est fréquent pour des notes obtenues par sommation de notes indépendantes (donc aussi par moyenne).

    "Est ce que multiplier les notes par un facteur 100/140 est une bonne idée ?" toi seul peut savoir. Pour nous, qu'elles aillent de 0 à 100 ou de 8 à 140, ça ne change rien.

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.