Estimation de données manquantes

Bonjour

À partir des données du tableau, je cherche à lisser les données par tranche de 200.000€ de chiffre d'affaires.

Par exemple, j'aimerais connaître ces même données (effectif total, effectif boucherie, effectif supérette) mais pour les tranches de chiffre d'affaires suivantes:
1.000.000
1.200.000
1.400.000
1.600.000
1.800.000
2.000.000
etc... jusqu'à 3.700.000€.

Merci d'avance pour votre aide71178

Réponses

  • Bonjour.

    J'imaginais qu'il s'agit d'effectifs cumulés. Mais comme la valeur diminue au début pour les supérettes, et en cours de route pour les boucheries, je ne sais pas ce que signifie ton tableau. D'ailleurs, par principe, en statistiques, des données sans explications, des tableaux non référencés, ça ne sert à rien.
    Donc quelles sont tes données ?

    NB : Pourquoi dans le forum "combinatoire et graphes" ???
    [Transféré dans le forum "Statistiques". AD]
  • Bonjour,

    C'est vrai qu'une fois relu ça manque peut être un peu d'explication ;-)

    Alors, ces données proviennent d'observation sur 11 magasins existant.
    Pour chacun d'entre eux, on a relevé le chiffre d'affaires (colonne 1), l'effectif total (colonne) qui lui même est divisé en effectif affecté à la supérette (colonne 4) et à la boucherie (colonne 3).

    Les données ont été classé dans l'ordre croissant de réalisation de chiffre d'affaires.

    L'idée est de faire ressortir une moyenne d'effectif selon le CA réalisé.

    On distingue bien la proportionnalité entre l'effectif et le CA.

    En fait j'aurais voulu savoir, à partir des ces données relevées, pour 1.000.000€ (puis 1.200.000 ; 1.400.000 etc jusqu'à 3.700.000) de CA, quelle effectif devrait être nécessaire si l'on se base sur ces données.

    J'avoue avoir un peu de mal a expliquer :-S
  • Ok.

    Une technique classique est de modéliser par un modèle linéaire, de la forme Y=aX+b où Y est l'effectif et X le CA. Dans ton cas ça marche très bien, le coefficient de corrélation est excellent (0,993, très proche de 1). On obtient le modèle Y = 0,0000042845 X+1,4815
    A partir de ce modèle tu peux interpoler pour les valeurs entre 1 et 3 millions de Y, mais il serait dangereux d'aller bien au delà de 3 millions, rien ne dit que la "proportionnalité " comme tu dis sera conservée. Donc si tu donnes des valeurs, ce sera très spéculatif.

    Tu peux faire la même chose pour les deux autres séries, avec la méthode de "régression linéaire".

    Cordialement.
  • Merci Gerard0,

    C'est exactement ce qu'il me fallait.

    Peux-tu me donner le détail du calcul pour essayer de comprendre comment tu as pu déterminer la a et le b.

    Comment ça marche la régression linéaire :-S
  • Trop long à expliquer ici. Tu peux consulter ce document, au moins le 1, puis utiliser une calculette statistique, ou un tableur (fonctions COEFFICIENT.REGRESSION, PENTE et ORDONNEE.ORIGINE).

    Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.