Nouveau module ! Masterclass executive education Transition vers une cryptographie sûre dans un monde post-quantique le 24 avril

Prochaine session deeptech SOFA, le moteur de simulation multiphysique débutant le 25 avril

Nouveau module ! Formation état de l’art La sécurité informatique face aux menaces quantiques le 25 avril

Prochaine session deeptech Machine Learning and Cybersecurity: Why and How with scikit-learn avancé les 29 avril et 6 mai

Nouveau module ! Formation état de l’art La cybersécurité des systèmes de contrôle industriel le 29 avril

Toutes nos formations
apprentissage automatique Intelligence artificielle

Scikit-learn, la boîte à outils de l’apprentissage automatique

 Module deeptech 
Le but de la formation est d’apprendre à bien utiliser la bibliothèque scikit-learn tout en donnant une compréhension intuitive de l’apprentissage automatique (machine learning) afin d’éviter les écueils méthodologiques. © Inria / Photo É. Garault

Session:

Aucune session disponible actuellement.

Contactez-nous !

Objectifs

Cette formation couvrira les notions de base de l’apprentissage statistique (machine learning) et leur réalisation avec scikit-learn. Nous étudierons comment charger un jeu de données pour l’exposer à scikit-learn, quels sont les types de questions auxquelles l’apprentissage statistique peut répondre, et comment utiliser scikit-learn pour y répondre. Spécifiquement, nous couvrirons l’apprentissage supervisé, avec la sélection et la validation des modèles. Nous étudierons aussi de façon plus détaillée l’assemblage de pipelines de mise en forme de données, et quelques modèles en particulier, tels que les modèles linéaires et les ensembles d’arbres de décision. La formation sera avant tout pratique, axée sur des exemples d’applications avec du code exécuté par les participants.

Public cible : ingénieurs R&D et développeurs en informatique.

Pré-requis

  • programmation de base en Python ;
  • familiarité souhaitable avec l’utilisation de notebooks Jupyter ;
  • connaissances de bases en Numpy et Pandas utiles.

Programme

  • notions de base de l’apprentissage statistique (machine learning) supervisé,
  • chargement d’un jeu de données pour l’exposer à scikit-learn et analyse exploratoire de données,
  • entrainement d’un modèle à partir de données purement numériques,
  • traitement des données catégorielles,
  • assemblage d’une pipeline scikit-learn pour chaîner mise en forme des données et apprentissage,
  • évaluation de modèles, notamment par validation croisée,
  • sélection de modèles avec réglage des hyper-paramètres.

Intervenant(s)

  • Laure Bourgois

    Ingénieure-formatrice spécialisée en intelligence artificielle

    Docteure en Intelligence Artificielle, experte en IA symbolique et simulations numériques, Laure Bourgois est ingénieure-formatrice spécialisée en intelligence artificielle. Avec 20 ans d’expérience en R&D (Orange Labs, IFSTTAR …) et un ensemble de missions pour des organismes de formations/universités, son expertise couvre un large éventail.

Les prochaines sessions

1 jour

Session:

Aucune session disponible actuellement.

Contactez-nous !

Objectifs

  • Maîtriser le fonctionnement intuitif des modèles suivants et leur mise en oeuvre avec scikit-learn: modèles linéaires, modèles d’arbre, modèles d’ensemble, notamment les forêts aléatoires et les modèles à base de boosting ;
  • Comprendre en détail les différents aspects de l’évaluation de modèle, notamment les choix de stratégies de validation croisée et de métrique d’évaluation.

Public cible : ingénieurs R&D et développeurs en informatique.

Pré-requis

  • Connaissances équivalentes au contenu du module niveau débutant, en particulier connaître les concepts suivants : distinction entre régression et classification, savoir faire une validation croisée d’une pipeline de classification avec preprocessing, savoir utiliser les outils de sélection d’hyper-paramètres.

Programme

Premier jour :

  • modèles linéaires pour la régression et la classification ;
  • régularisation de modèles linéaires ;
  • modèles d’arbres de décision pour la régression et la classification.

Deuxième jour :

  • ensemble de modèles à base d’arbre : forêt aléatoires et modèles à base de boosting ;
  • évaluation de modèles : stratégies de validation croisée et métriques d’évaluation.

Intervenant(s)

  • Laure Bourgois

    Ingénieure-formatrice spécialisée en intelligence artificielle

    Docteure en Intelligence Artificielle, experte en IA symbolique et simulations numériques, Laure Bourgois est ingénieure-formatrice spécialisée en intelligence artificielle. Avec 20 ans d’expérience en R&D (Orange Labs, IFSTTAR …) et un ensemble de missions pour des organismes de formations/universités, son expertise couvre un large éventail.

Les prochaines sessions

2 jours

Témoignages

Scikit-learn est LA référence en Machine Learning que de nombreuses entreprises utilisent. Chez OVHcloud, il est notamment utilisé pour le monitoring des 21 000 et quelques équipements réseaux présents dans nos data centers.

Olivier Nicol

Lead Data Scientist, OVHcloud, France

© OVHcloud

À propos des tarifs

  • Tarif PME : dans le cadre du projet SME4DD, les PME européennes bénéficient d’un tarif privilégié de 500 € pour le module débutant du 12 avril 2024 ;
  • Partenariat avec le pôle Systematic et le pôle SCS : les entreprises membres du pôle bénéficient d’un tarif privilégié (non cumulable avec le tarif PME) ;
  • Module débutant (1 jour) : 930 € par personne (740 € pour les entreprises membres du pôle Systematic et du pôle SCS) ;
  • Module avancé (2 jours) : 1300 € par personne (1040 € pour les entreprises membres du pôle Systematic et du pôle SCS) ;
  • Tarifs dégressifs à partir de 5 personnes (-10% de 5 à 9 inscrits, -20% plus de 10 inscrits) et en cas d’achat groupé des modules débutant et avancé (-20%) ;
  • Sauf précision, toutes les sessions en dehors de l’intra-entreprise se déroulent en distanciel.
Plus d'informations sur le projet SME4DD