Machine Learning avancé avec Python Mixte : présentiel / à distance

Dernière mise à jour : 29/04/2025

Description

Synthèse :

Approfondissez votre connaissance du Machine Learning pour rendre vos modèles plus performants et maîtrisez les meilleurs algorithmes actuels.

Description :

Apprenez à utiliser les techniques actuelles de modélisation prédictive les plus performantes, employées par les meilleurs compétiteurs dans les challenges de Machine Learning. Au travers de cette formation, vous mettrez en pratique la théorie sur divers types de données structurées — y compris sur de très gros volumes (plusieurs Go) — au travers de challenges Kaggle, en utilisant les librairies Python pandas, scikit-learn, XGBoost et Hyperopt. À la fin des 2 jours, vous disposerez de connaissances avancées et pratiques vous permettant de sélectionner les meilleurs algorithmes pour vos problèmes de ML, d'optimiser vos modèles de façon intelligente, et de les mettre à jour en continu.

La formation est principalement destinée aux développeurs et ingénieurs informaticiens expérimentés en Machine Learning. Elle sera également d'intérêt aux statisticiens et data scientists souhaitant approfondir et mettre en pratique leurs connaissances de Machine Learning avec les outils Python. Si vous êtes débutant, consultez notre formation Machine Learning niveau 1. Si votre priorité est de développer des applications perceptives — qui “comprennent” l'image ou le son, par exemple — ou si vous êtes déjà à l'aise avec les sujets abordés ici, notre formation Deep Learning est faite pour vous.

JOUR 1 :

Module 1 : Rappels et/ou explications des principaux algorithmes de Machine Learning : ce contenu sera adapté en séance en fonction des connaissances des participants et de leurs attentes :

Rappels théoriques et description des principaux hyper-paramètres de :
- Régression linéaire, polynomiale et logistique
- K-plus proches voisins (KNN)
- Machines à vecteur de support (SVM)
- Arbres de décision, forêts aléatoires
- Réseaux de neurones
Avantages et inconvénients : comment et pourquoi sélectionner un type de modèl
Méthodologie projet : workflow complet et best-practices
Ecueils à éviter (et comment les éviter) : fuite de données (data leak), surapprentissage (overfitting)
Mise en pratique avec scikit-learn

Module 2 : Boosting

Principe du boosting, classe d'algorithmes souvent plus performants que les random forests (XGBoost, CatBoost, LightGBM…)
Description de leurs principaux paramètres, délicats à prendre en main et importants à maîtriser
Principe des techniques avancées d'optimisation intelligente des hyper-paramètre
Mise en pratique avec Hyperopt

JOUR 2 :

Module 3 : Apprentissage sur gros volumes de données et Online Learning

Présentation de l'algorithme de descente de gradient (stochastique, mini-batch) ; intuition de ses principaux paramètres
Mise à jour de modèles en flux continu et apprentissage hors-mémoire
Mise en pratique avec scikit-learn sur un jeu de données qui ne tient pas en mémoire vive
Considérations supplémentaires : hashing trick, dilemme exploration/exploitation

Module 4 : Stacking

Principe du stacking et état de l'art des architectures d'ensembles de modèles prédictifs
Explication des systèmes les plus performants sur les concours Kaggle sur des données structurées
Exercice final mettant en pratique une architecture de stacking utilisant les types de modèles vus dans la formation

Objectifs de la formation

Savoir choisir les bons algorithmes d'apprentissage en fonction du problème à résoudre (ensembles d'arbres de décision, modélisation linéaire / non linéaire, régularisation)
Créer des modèles prédictifs qui peuvent se mettre à jour en continu, et ingérer de gros volumes de données (Online Learning)
Trouver les meilleurs compromis entre temps de calcul et qualité des prédictions
Comprendre et mettre en pratique la technique du Boosting, utilisée dans les meilleures solutions aux compétitions de Machine Learning
Optimiser ses modèles prédictifs, grâce aux techniques intelligentes d'optimisation du choix d'hyperparamètres (“AutoML”) et aux architectures complexes d'ensembles de modèles (Stacking)

Public visé

Data scientist, data engineer, data analyst, chercheur, ingénieur R&D, statisticien, et toute personne travaillant dans la data et ayant une première expérience des modèles prédictifs

Prérequis

Avoir suivi une formation Machine Learning niveau 1, ou un MOOC en ligne (par exemple le MOOC d'Andrew Ng sur Coursera), ou avoir une première expérience dans la création de modèles prédictif et leur évaluation
Expérience de Python et de scikit-learn

Modalités pédagogiques

Session dispensée en présentiel ou téléprésentiel, selon la modalité inter-entreprises ou intra-entreprises sur mesure.

La formation est animée par un(e) formateur(trice) durant toute la durée de la session et présentant une suite de modules théoriques clôturés par des ateliers pratiques validant l'acquisition des connaissances. Les ateliers peuvent être accompagnés de Quizz.

L'animateur(trice) présente la partie théorique à l'aide de support de présentation, d'animation réalisée sur un environnement de démonstration.

En présentiel comme en téléprésentiel, l'animateur(trice) accompagne les participants durant la réalisation des ateliers.

Moyens et supports pédagogiques

Cadre présentiel

Salles de formation équipées et accessibles aux personnes à mobilité réduite.

- Un poste de travail par participant

- Un support de cours numérique ou papier (au choix)

- Un bloc-notes + stylo

- Vidéoprojection sur tableau blanc

- Connexion Internet

- Accès extranet pour partage de documents et émargement électronique

Cadre téléprésentiel

Session dispensée via notre solution iClassroom s'appuyant sur Microsoft Teams.

- Un compte Office 365 par participant

- Un poste virtuel par participant

- Un support numérique (PDF ou Web)

- Accès extranet pour partage de documents et émargement électronique

Modalités d'évaluation et de suivi

Avant

Afin de valider le choix d'un programme de formation, une évaluation des prérequis est réalisée à l'aide d'un questionnaire en ligne ou lors d'un échange avec le formateur(trice) qui validera la base de connaissances nécessaires.

Pendant

Après chaque module théorique, un ou des ateliers pratiques permettent la validation de l'acquisition des connaissances. Un Quizz peut accompagner l'atelier pratique.

Après

Un examen de certification si le programme de formation le prévoit dans les conditions de l'éditeur ou du centre de test (TOSA, Pearson Vue, ENI, PeopleCert)

Enfin

Un questionnaire de satisfaction permet au participant d'évaluer la qualité de la prestation.

M'inscrire à la formation

Veuillez décrire votre situation

Choix de la session

Mixte : présentiel / à distance

du 31/08/26 au 01/09/26
3 places restantes

Mixte : présentiel / à distance

du 03/11/26 au 04/11/26
3 places restantes

Mixte : présentiel / à distance

du 01/03/27 au 02/03/27
3 places restantes

Mixte : présentiel / à distance

du 14/06/27 au 15/06/27
3 places restantes

Ajouter au panier

Catégorie : Informatique
Sous-Catégorie : Big Data, Data Science et IA
Durée : 14h
Prix : 1 550 € HT
Référence : IF-PyML2
Satisfaction :
★★★★★
★★★★★
Taux de réussite : - %
Télécharger le programme

Prochaines Sessions

31/08/26 → 01/09/26 Nouveauté Présentiel / à distance 3 places restantes
03/11/26 → 04/11/26 Nouveauté Présentiel / à distance 3 places restantes
01/03/27 → 02/03/27 Nouveauté Présentiel / à distance 3 places restantes
14/06/27 → 15/06/27 Nouveauté Présentiel / à distance 3 places restantes

Dans la même catégorie

Acculturation à l'IA Nouveauté Présentiel / à distance
Acculturation à l'IA & prise en main de ChatGPT Nouveauté Présentiel / à distance
Administrer des bases de données relationnelles sur Microsoft Azure Nouveauté Présentiel / à distance
Analyste de données Microsoft Power BI Nouveauté CPF Présentiel / à distance
Cas d'usage de Microsoft 365 Copilot pour les utilisateurs métier Présentiel / à distance

Voir toutes les formations

Partager cette formation

Catalogue de formation propulsé par Dendreo,
ERP spécialisé pour les OF

Catalogue de formations

Machine Learning avancé avec Python Mixte : présentiel / à distance

Description

Objectifs de la formation

Public visé

Prérequis

Modalités pédagogiques

Moyens et supports pédagogiques

Modalités d'évaluation et de suivi

M'inscrire à la formation

Session sélectionnée

Prochaines Sessions

Dans la même catégorie

Partager cette formation

A venir…

Nous rejoindre

Autres liens

IFORM