Accueil > Notions fondamentales Décisionnel / Big Data

> Formation à distance : Machine Learning avec scikit-learn

Notions fondamentales Décisionnel / Big Data

Formation à distance : Machine Learning avec scikit-learn

Objectif

Mettre en oeuvre scikit-learn pour de l'apprentissage machine et l'analyse de données

Certifications

Durée : 4 jours

Dates :
-11/05/26
-14/09/26
-14/12/26

S'inscrire

Pré-requis Moyens pédagogiques Participants Financement & organisation

Connaissance de python et d'une bibliothèque de calcul telle que numpy ou pandas

Moyens pédagogiques

Réflexion de groupe et apports théoriques du formateur
Travail d'échange avec les participants sous forme de réunion-discussion
Utilisation de cas concrets issus de l'expérience professionnelle
Validation des acquis par des questionnaires, des tests d'évaluation, des mises en situation et des jeux pédagogiques.
Remise d'un support de cours.

Moyens techniques

Accueil des stagiaires dans une salle dédiée à la formation, équipée d'ordinateurs, d'un vidéo projecteur d'un tableau blan et de paperboard.

Modalités d'évaluation

Feuille de présence signée en demi-journée,
Evaluation des acquis tout au long de la formation,
Questionnaire de satisfaction,
Attestation de stage à chaque apprenant,
Positionnement préalable oral ou écrit,
Evaluation formative tout au long de la formation,
Evaluation sommative faite par le formateur ou à l'aide des certifications disponibles

Modalités distance

A l'aide d'un logiciel comme Teams, Zoom etc... un micro et éventuellement une caméra pour l'apprenant,
suivez une formation en temps réel et entièrement à distance. Lors de la classe en ligne, les apprenants interagissent et comuniquent entre eux et avec le formateur.
Les formations en distanciel sont organisées en Inter-Entreprise comme en Intra-Entreprise.
L'accès à l'environnement d'apprentissage (support de cours, labs) ainsi qu'aux preuves de suivi et d'assiduité (émargement, évaluation) est assuré.

Profil formateur

Nos formateur sont des experts dans leurs domaines d'intervention
Leur expérience de terrain et leurs qualités pédagogiques constituent un gage de qualité.

Accessibilité

Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d'étudier ensemble les possibilités de suivre la formation.

Cette formation s'adresse au profil métier orienté Data Scientist

Compte personnel de formation

La formation n'est pas compatible avec le Compte personnel de formation

Sessions inter-entreprises

La formation est compatible avec l’organisation en session inter-entreprises

Programme de la formation

1. Introduction et fondamentaux

Présentation et historique
Fonctionnalités principales
Lien avec Numpy et Scipy

2. Manipulation et préparation des données

Manipulation et chargement de données
Pré-traitement : standardisation, transformations non linéaires, discrétisation
Génération de données

3. Analyse des données et modèles d’apprentissage

Analyse des données et classification
Modèles : linéaires, quadratiques, descente de gradient
Algorithmes et choix d’un estimateur

4. Méthodes de classification

k plus proches voisins (k-NN)
Régression logistique
Classification naïve bayésienne
Arbres de décision et forêts aléatoires
SVC (Support Vector Classification)

5. Méthodes de régression

Régression linéaire
Lasso
SGD Regressor (SGDr)
SVR (Support Vector Regression)

6. Détection de groupes et analyse globale

k-moyennes
Spectral Clustering / GMM
Randomized PCA
Kernel approximation

7. Ateliers pratiques

Classification automatique d’un jeu de données avec régression logistique
Mise en évidence des erreurs d’apprentissage selon les hyper-paramètres

8. Entraînement, évaluation et optimisation

Création de jeux d’essai et construction de modèles
Prévisions à partir de données réelles
Mesure de l’efficacité des algorithmes (courbes ROC)
Parallélisation et choix automatique d’algorithmes

9. Approfondissements

Recherche de clusters : modélisations, algorithmes et méthodes d’évaluation
Réseaux de neurones et modèles d’apprentissage
Chargement, enregistrement et génération de modèles
Estimation et mesures de performance
Optimisation par modification des hyper-paramètres
Application pratique avec courbes d’évaluation

Cookie	Durée	Description
_GRECAPTCHA	5 mois 27 jours	Ce cookie est défini par Google. En plus de certains cookies standards de Google, reCAPTCHA définit un cookie nécessaire (_GRECAPTCHA) lorsqu'il est exécuté dans le but de fournir son analyse des risques.
cookielawinfo-checkbox-advertisement	1 an	Le cookie est défini par le consentement des cookies GDPR pour enregistrer le consentement de l'utilisateur pour les cookies dans la catégorie « Publicité ».
cookielawinfo-checkbox-analytics	1 an	Ce cookie est défini par le plugin GDPR Cookie Consent. Le cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie «Analytiques».
cookielawinfo-checkbox-functional	1 an	Le cookie est défini par le consentement du cookie GDPR pour enregistrer le consentement de l'utilisateur pour les cookies de la catégorie «Fonctionnel».
cookielawinfo-checkbox-necessary	1 an	Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies de la catégorie «Nécessaire».
cookielawinfo-checkbox-others	1 an	Ce cookie est défini par le plugin GDPR Cookie Consent. Le cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie «Autres».
cookielawinfo-checkbox-performance	1 an	Ce cookie est défini par le plugin GDPR Cookie Consent. Le cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie «Performance».
CookieLawInfoConsent	1 an	Enregistre l'état du bouton par défaut de la catégorie correspondante et l'état du CCPA. Il fonctionne uniquement en coordination avec le cookie principal.

Cookie	Durée	Description
_ga	2 ans	Ce cookie est installé par Google Analytics. Le cookie est utilisé pour calculer les données de visiteur, de session, de campagne et pour suivre l'utilisation du site pour le rapport d'analyse du site. Les cookies stockent des informations de manière anonyme et attribuent un numéro généré de manière aléatoire pour identifier les visiteurs uniques.
_ga_3KCBMEXTJ8	2 ans	Ce cookie est installé par Google Analytics. Le cookie est utilisé pour calculer les données de visiteur, de session, de campagne et pour suivre l'utilisation du site pour le rapport d'analyse du site. Les cookies stockent des informations de manière anonyme et attribuent un numéro généré de manière aléatoire pour identifier les visiteurs uniques.