Critère d'impureté de Gini
dans Statistiques
Bonjour,
Dans le cas d'un arbre de segmentation avec la méthode CART, le critère de division d'un segment est le critère de Gini. Je peux appliquer ce dernier mais je ne comprends pas sa signification en regard de sa formulation que je souhaiterais retrouver de manière "propre" avec les formules de base des probabilités.
- $t$ est un segment
- les individus sont répartis en $k$ groupes
- $p(r/t)$ la probabilité d'appartenir au groupe $G_{r}$ dans le segment $t$
Le critère de Gini $i\left( t\right) ~$ pour le segment $t$ est donné par :
\[
i(t)=\underset{r\neq s}{\sum }p(r/t)p(s/t)\]
avec l'indication que $i(t)$ représente la probabilité de mauvais classement pour un individu tiré au hasard parmi les individus du segment.
Cordialement.
Dans le cas d'un arbre de segmentation avec la méthode CART, le critère de division d'un segment est le critère de Gini. Je peux appliquer ce dernier mais je ne comprends pas sa signification en regard de sa formulation que je souhaiterais retrouver de manière "propre" avec les formules de base des probabilités.
- $t$ est un segment
- les individus sont répartis en $k$ groupes
- $p(r/t)$ la probabilité d'appartenir au groupe $G_{r}$ dans le segment $t$
Le critère de Gini $i\left( t\right) ~$ pour le segment $t$ est donné par :
\[
i(t)=\underset{r\neq s}{\sum }p(r/t)p(s/t)\]
avec l'indication que $i(t)$ représente la probabilité de mauvais classement pour un individu tiré au hasard parmi les individus du segment.
Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Tu as bien compris la question et ta réponse l'a éclairée.
Merci.
Cordialement.