Science de la donnée

Bonjour,

Formation
intégration X2012 - spécialisation en mathématiques appliquées
master aux US en Computer Science option machine learning
data scientist depuis 2 ans à Paris

Situation
Après toutes ces "expériences", je suis resté sur ma faim. Je souhaite me faire une idée la plus exhaustive possible du domaine du machine learning afin de sentir une maîtrise sereine. J'ai beaucoup aimé les polycopiés lors de ma formation en France, offrant un contenu riche, synthétique et efficace. Naturellement, les cours, plus à vocation d'introduction, ne pouvaient être exhaustifs. Les ouvrages des classes préparatoires (tout en un) furent un modèle de cohérence et d'exhaustivité dans les frontières délimitée du programme. J'ai beaucoup moins apprécié la partie internationale de ma formation, troquant systématiquement rigueur et synthèse mathématique pour une logorrhée se voulant plus "accessible", mais en réalité méandreuse et sans parvenir à aboutir. Aussi, je vous prie de bien vouloir m'aider à trouver des ouvrages efficaces composant la base d'un bon data scientist. Ouvrages en français et en anglais bienvenus.

Thèmes
probabilités
statistiques (fréquentiste, bayesien, estimation ponctuelle, région de confiance, test, tests multiples, estimation fonctionnelle, etc…)
apprentissage statistique
causalité (une synthèse mathématique de Causality de Peal ?)
théorie de l’information
optimisation
apprentissage par renforcement
“machine learning” (apprentissage qui ne serait pas dans apprentissage statistique)
traitement du signal
réseaux de neurones
collection de données (données manquantes, imputation, etc…)
etc...

operating systems
linux
python, R
shell
etc...

Ouvrages repérés pour l'instant
Aléatoire (Le Gall)
cours de statistique mathématique (Monfort)
cours MVA reinforcement learning (que j’ai trouvé bien plus rapide que Sutton & Barto)

En vous remerciant beaucoup d'avance
Connectez-vous ou Inscrivez-vous pour répondre.