Influence de variables sur un prix (Compta)
dans Statistiques
Bonjour,
Actuellement stagiaire informatique dans un cabinet comptable, je dois créer une application de devis et pour cela il me faut identifier les variables qui influent sur le prix d’un dossier.
Je possède plusieurs « outils » de devis sur Excel, qui consistent en des tableaux de variables (ex : Nombre de salariés de l’entreprise, Chiffre d’affaire de l’entreprise, …) et face à chaque critère se trouve un prix fixe ou à l’unité. Pour chaque outil j’ai un jeu de tests (qui sont en fait des vrais dossiers dont le prix a été estimé avec ces outils) qui varie de 5 à 60 dossiers.
Ma problématique actuelle est d’identifier les variables qui ont un poids dans le prix du dossier de façon « scientifique » mais les quelques notions de statistiques que j’ai s’arrêtent à modéliser des lois binomiales ou de poisson en python.
J’ai trouvé une méthode qui permettrait de déterminer la contribution de la variable x à l'explication de la variance de y (Scherrer, 1984) :
x = a * Covariance(y x) / Variance(y)
(Avec a le « coefficient de régression/corrélation »)
Le problème étant que je ne comprends pas vraiment cet aspect de régression même après avoir lu plusieurs articles sur le sujet, et si j’applique simplement la formule sans me poser de questions j’obtiens ce genre résultats (avec le poids en %) :
Pensez-vous que la méthode utilisée est la bonne dans mon cas ?
Si oui, ces résultats ont-ils une cohérence ? Si non, sauriez-vous m’indiquer une méthode adaptée ?
Merci !
(J’ai essayé d’être le plus précis possible mais la plupart des données utilisées et les variables elles sont confidentielles, mon patron a bien insisté là-dessus, si vous manquez d’informations je pourrai essayer de détailler encore un peu plus !)
Actuellement stagiaire informatique dans un cabinet comptable, je dois créer une application de devis et pour cela il me faut identifier les variables qui influent sur le prix d’un dossier.
Je possède plusieurs « outils » de devis sur Excel, qui consistent en des tableaux de variables (ex : Nombre de salariés de l’entreprise, Chiffre d’affaire de l’entreprise, …) et face à chaque critère se trouve un prix fixe ou à l’unité. Pour chaque outil j’ai un jeu de tests (qui sont en fait des vrais dossiers dont le prix a été estimé avec ces outils) qui varie de 5 à 60 dossiers.
Ma problématique actuelle est d’identifier les variables qui ont un poids dans le prix du dossier de façon « scientifique » mais les quelques notions de statistiques que j’ai s’arrêtent à modéliser des lois binomiales ou de poisson en python.
J’ai trouvé une méthode qui permettrait de déterminer la contribution de la variable x à l'explication de la variance de y (Scherrer, 1984) :
x = a * Covariance(y x) / Variance(y)
(Avec a le « coefficient de régression/corrélation »)
Le problème étant que je ne comprends pas vraiment cet aspect de régression même après avoir lu plusieurs articles sur le sujet, et si j’applique simplement la formule sans me poser de questions j’obtiens ce genre résultats (avec le poids en %) :
Pensez-vous que la méthode utilisée est la bonne dans mon cas ?
Si oui, ces résultats ont-ils une cohérence ? Si non, sauriez-vous m’indiquer une méthode adaptée ?
Merci !
(J’ai essayé d’être le plus précis possible mais la plupart des données utilisées et les variables elles sont confidentielles, mon patron a bien insisté là-dessus, si vous manquez d’informations je pourrai essayer de détailler encore un peu plus !)
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.1K Toutes les catégories
- 8 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 62 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 312 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 772 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres