> Formation à distance : Machine Learning avec scikit-learn
Notions fondamentales Décisionnel / Big Data
Formation à distance : Machine Learning avec scikit-learn
Objectif
Mettre en oeuvre scikit-learn pour de l'apprentissage machine et l'analyse de données
Certifications
Connaissance de python et d'une bibliothèque de calcul telle que numpy ou pandas
Moyens pédagogiques
Réflexion de groupe et apports théoriques du formateur
Travail d'échange avec les participants sous forme de réunion-discussion
Utilisation de cas concrets issus de l'expérience professionnelle
Validation des acquis par des questionnaires, des tests d'évaluation, des mises en situation et des jeux pédagogiques.
Remise d'un support de cours.
Moyens techniques
Modalités d'évaluation
Feuille de présence signée en demi-journée,
Evaluation des acquis tout au long de la formation,
Questionnaire de satisfaction,
Attestation de stage à chaque apprenant,
Positionnement préalable oral ou écrit,
Evaluation formative tout au long de la formation,
Evaluation sommative faite par le formateur ou à l'aide des certifications disponibles
Modalités distance
A l'aide d'un logiciel comme Teams, Zoom etc... un micro et éventuellement une caméra pour l'apprenant,
suivez une formation en temps réel et entièrement à distance. Lors de la classe en ligne, les apprenants interagissent et comuniquent entre eux et avec le formateur.
Les formations en distanciel sont organisées en Inter-Entreprise comme en Intra-Entreprise.
L'accès à l'environnement d'apprentissage (support de cours, labs) ainsi qu'aux preuves de suivi et d'assiduité (émargement, évaluation) est assuré.
Profil formateur
Nos formateur sont des experts dans leurs domaines d'intervention
Leur expérience de terrain et leurs qualités pédagogiques constituent un gage de qualité.
Accessibilité
Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d'étudier ensemble les possibilités de suivre la formation.
Cette formation s'adresse au profil métier orienté Data Scientist
Compte personnel de formation
La formation n'est pas compatible avec le Compte personnel de formation
Sessions inter-entreprises
La formation est compatible avec l’organisation en session inter-entreprises
Programme de la formation
1. Introduction et fondamentaux
- Présentation et historique
- Fonctionnalités principales
- Lien avec Numpy et Scipy
2. Manipulation et préparation des données
- Manipulation et chargement de données
- Pré-traitement : standardisation, transformations non linéaires, discrétisation
- Génération de données
3. Analyse des données et modèles d’apprentissage
- Analyse des données et classification
- Modèles : linéaires, quadratiques, descente de gradient
- Algorithmes et choix d’un estimateur
4. Méthodes de classification
- k plus proches voisins (k-NN)
- Régression logistique
- Classification naïve bayésienne
- Arbres de décision et forêts aléatoires
- SVC (Support Vector Classification)
5. Méthodes de régression
- Régression linéaire
- Lasso
- SGD Regressor (SGDr)
- SVR (Support Vector Regression)
6. Détection de groupes et analyse globale
- k-moyennes
- Spectral Clustering / GMM
- Randomized PCA
- Kernel approximation
7. Ateliers pratiques
- Classification automatique d’un jeu de données avec régression logistique
- Mise en évidence des erreurs d’apprentissage selon les hyper-paramètres
8. Entraînement, évaluation et optimisation
- Création de jeux d’essai et construction de modèles
- Prévisions à partir de données réelles
- Mesure de l’efficacité des algorithmes (courbes ROC)
- Parallélisation et choix automatique d’algorithmes
9. Approfondissements
- Recherche de clusters : modélisations, algorithmes et méthodes d’évaluation
- Réseaux de neurones et modèles d’apprentissage
- Chargement, enregistrement et génération de modèles
- Estimation et mesures de performance
- Optimisation par modification des hyper-paramètres
- Application pratique avec courbes d’évaluation

