Pondération de relations
Bonjour,
Je travaille sur des données représentant la fréquence des mariages entre cinq familles.
Je cherche à identifier d'éventuelles préférences dans les choix matrimoniaux. Or, ces familles ne représentent pas des populations de taille similaire. Dans les données d'observation les mariages entre familles plus nombreuses seront donc nécessairement plus nombreux.
N'étant ni statisticien, ni mathématicien, j'ai tout de même compris que pour faire "ressortir" des préférences, il me fallait "pondérer" les observations selon le poids de chaque famille, donc "faire comme si" elles pesaient le même poids, dans mon cas 0.25. Tous les exemples que je trouve ont trait à la pondération d'une variable en fonction de la taille de la population considérée. Or, si deux populations sont concernées, comment procéder ? J'ai choisi simplement, pour chaque paire de familles, de multiplier les deux coefficients de pondération concernés et d'appliquer le résultat à la fréquence observée de mariages. Mon raisonnement est qu'il faut non seulement corriger la sur-représentation éventuelle de la famille A mais aussi la probabilité de ses mariages avec B, qui dépend de la taille de la population B.
Est-ce la bonne façon de procéder ? J'ai le sentiment au vu des résultats que les mariages entre grosses familles restent sur-représentées.
Je travaille sur des données représentant la fréquence des mariages entre cinq familles.
Je cherche à identifier d'éventuelles préférences dans les choix matrimoniaux. Or, ces familles ne représentent pas des populations de taille similaire. Dans les données d'observation les mariages entre familles plus nombreuses seront donc nécessairement plus nombreux.
N'étant ni statisticien, ni mathématicien, j'ai tout de même compris que pour faire "ressortir" des préférences, il me fallait "pondérer" les observations selon le poids de chaque famille, donc "faire comme si" elles pesaient le même poids, dans mon cas 0.25. Tous les exemples que je trouve ont trait à la pondération d'une variable en fonction de la taille de la population considérée. Or, si deux populations sont concernées, comment procéder ? J'ai choisi simplement, pour chaque paire de familles, de multiplier les deux coefficients de pondération concernés et d'appliquer le résultat à la fréquence observée de mariages. Mon raisonnement est qu'il faut non seulement corriger la sur-représentation éventuelle de la famille A mais aussi la probabilité de ses mariages avec B, qui dépend de la taille de la population B.
Est-ce la bonne façon de procéder ? J'ai le sentiment au vu des résultats que les mariages entre grosses familles restent sur-représentées.
Connectez-vous ou Inscrivez-vous pour répondre.