Accueil > Notions fondamentales Décisionnel / Big Data

 > Formation à distance : Machine Learning avec scikit-learn

null

Notions fondamentales Décisionnel / Big Data

Formation à distance : Machine Learning avec scikit-learn

Objectif

Mettre en oeuvre scikit-learn pour de l'apprentissage machine et l'analyse de données

Certifications

Durée : 4 jours

Dates :
-11/05/26
-14/09/26
-14/12/26

Connaissance de python et d'une bibliothèque de calcul telle que numpy ou pandas

Programme de la formation

1. Introduction et fondamentaux

  • Présentation et historique
  • Fonctionnalités principales
  • Lien avec Numpy et Scipy

2. Manipulation et préparation des données

  • Manipulation et chargement de données
  • Pré-traitement : standardisation, transformations non linéaires, discrétisation
  • Génération de données

3. Analyse des données et modèles d’apprentissage

  • Analyse des données et classification
  • Modèles : linéaires, quadratiques, descente de gradient
  • Algorithmes et choix d’un estimateur

4. Méthodes de classification

  • k plus proches voisins (k-NN)
  • Régression logistique
  • Classification naïve bayésienne
  • Arbres de décision et forêts aléatoires
  • SVC (Support Vector Classification)

5. Méthodes de régression

  • Régression linéaire
  • Lasso
  • SGD Regressor (SGDr)
  • SVR (Support Vector Regression)

6. Détection de groupes et analyse globale

  • k-moyennes
  • Spectral Clustering / GMM
  • Randomized PCA
  • Kernel approximation

7. Ateliers pratiques

  • Classification automatique d’un jeu de données avec régression logistique
  • Mise en évidence des erreurs d’apprentissage selon les hyper-paramètres

8. Entraînement, évaluation et optimisation

  • Création de jeux d’essai et construction de modèles
  • Prévisions à partir de données réelles
  • Mesure de l’efficacité des algorithmes (courbes ROC)
  • Parallélisation et choix automatique d’algorithmes

9. Approfondissements

  • Recherche de clusters : modélisations, algorithmes et méthodes d’évaluation
  • Réseaux de neurones et modèles d’apprentissage
  • Chargement, enregistrement et génération de modèles
  • Estimation et mesures de performance
  • Optimisation par modification des hyper-paramètres
  • Application pratique avec courbes d’évaluation
Menu