Cette formation couvrira les notions de base de l’apprentissage statistique (machine learning) et leur réalisation avec scikit-learn. Nous étudierons comment charger un jeu de données pour l’exposer à scikit-learn, quels sont les types de questions auxquelles l’apprentissage statistique peut répondre, et comment utiliser scikit-learn pour y répondre. Spécifiquement, nous couvrirons l’apprentissage supervisé, avec la sélection et la validation des modèles. Nous étudierons aussi de façon plus détaillée l’assemblage de pipelines de mise en forme de données, et quelques modèles en particulier, tels que les modèles linéaires et les ensembles d’arbres de décision. La formation sera avant tout pratique, axée sur des exemples d’applications avec du code exécuté par les participants.