null

Technologies, état de l'art

Machine Learning

Objectif

Comprendre comment organiser le traitement des données et structurer les processus de Machine Learning.

Durée : 2 jours (14 heures)

Dates :
-06/02/23
-04/04/23
-29/06/23
-02/10/23
-04/12/23

Posséder une culture informatique de base.

Programme de la formation

Introduction au machine learning

  • Le Big Data et le machine learning.
  • Zoom sur les données et les requêtes, attentes, des utilisateurs
  • Les étapes de la préparation des données.
  • le data munging/wrangling
  • Le rôle du data scientist

Le Machine Learning

  • Définition, les attentes par rapport au Machine Learning
  • Les valeurs d’observation, et les variables cibles.
  • Ingénierie des variables
  • Comment choisir l'algorithme et les variables de l'algorithme.

Apprentissage automatique

  • Les algorithmes d'apprentissage supervisés, non supervisés
  • Classification des données
  • Les étapes de construction d'un modèle prédictif.
  • Détecter les valeurs aberrantes et traiter les données manquantes.
  • Algorithmes : régression linéaire, k-voisins, classification naïve bayésienne, arbres de décision, etc ..

Les risques et écueils

  • Importance de la préparation des données.
  • L’écueil du « surapprentissage ».
  • Les limites du Machine Learning

La visualisation des donnés

  • L’intérêt de la visualisation.
  • Outils disponibles,

Machine learning en production

  • Les spécificités liées au développement d'un modèle en environnement distribué.
  • Le déploiement Big Data avec Spark et la MLlib.
  • Le Cloud : Amazon, Microsoft Azure ML, IBM Bluemix...
  • La maintenance du modèle

Exemples de visualisation avec R et Python

Menu