Test d'embauche
dans Statistiques
Bonjour
Je serai très curieux par votre approche pour résoudre la partie statistique du test d'embauche que j'ai réalisé récemment.
PS1 : il faut changer l'extension du fichier .tex en .ipynb pour lancer test_Python_Only avec jupytre notebook (petit hack pour partager le fichier).
PS2 : je pense que les échanges seront plus constructifs si vous faites le test sans lire avant ce que j'ai produit.
Je serai très curieux par votre approche pour résoudre la partie statistique du test d'embauche que j'ai réalisé récemment.
PS1 : il faut changer l'extension du fichier .tex en .ipynb pour lancer test_Python_Only avec jupytre notebook (petit hack pour partager le fichier).
PS2 : je pense que les échanges seront plus constructifs si vous faites le test sans lire avant ce que j'ai produit.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Le problème est assez ouvert pour ne pas être trop rebutant, non ? Je n'ai pas trouvé le temps de jouer avec, donc je m’étais abstenu de commenter. Faute de mieux j'ai parcouru le .ipynb et j'ai trouvé ça plutôt sympa.
Sur la relation de salaire et expérience avec l'embauche. Si légère association il y a, c'est plutôt de favoriser ceux qui sont "dans la moyenne", ni trop haut ni trop bas. Cela ne ressortirait pas très bien avec une statistique de rang. Pour résumer visuellement les corrélations entre toutes les paires de variables (dans un tableau), j'aime bien l'indice U de Theil (Theil's U) aussi, qui quantifie l'information contenue dans une variable sur une autre. C'est normalisé entre $0$ et $1$ en plus.
Sinon le problème est sympa parce qu'il y a beaucoup d'associations qui peuvent être indirectes (faussement causales), via des variables confondantes. Par exemple l'âge joue sur l’expérience et parfois (dieux du ciel, est-ce possible?) sur l'embauche (bon, je dis pas que l’expérience ne joue pas sur l'embauche :-D). L'exemple entre couleur des cheveux, diplôme et embauche est plutôt rigolo. En complément, peut-être visualiser des paires de variables en stratifiant/fixant la troisième ?
Quant à l'apprentissage automatique, il y a assez de données pour qu'on ait du grain à moudre, mais qu'on ne puisse pas "brutaliser" le problème en aveugle. Un autre point positif est qu'il n'y a pas a priori de problème de biais d'échantillonnage, on peut penser que les entretiens sont rapportés de façon quasi-exhaustive.
Je ne comprends sincèrement pas la démarche de cette Société à moins qu'ils aient des profils de "data scientist" auto-proclamés et, qu'ils cherchent à écrémer à la louche. Quelle type d'entreprise intègre cela dans son processus de recrutement ?
Cordialement.
@talbon: merci pour ta relecture
Cordialement.
@student2 : est-ce que tu vas essayer de les relancer ?
Cordialement.