Python
Formation à distance : Python avancé pour data-scientists
Objectif
Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python, savoir extraire des données d'un fichier et les manipuler, mettre en place un modèle d'apprentissage simple
Certifications
Bonne connaissance de la programmation Python.
Moyens pédagogiques
Réflexion de groupe et apports théoriques du formateur
Travail d'échange avec les participants sous forme de réunion-discussion
Utilisation de cas concrets issus de l'expérience professionnelle
Validation des acquis par des questionnaires, des tests d'évaluation, des mises en situation et des jeux pédagogiques.
Remise d'un support de cours.
Moyens techniques
Modalités d'évaluation
Feuille de présence signée en demi-journée,
Evaluation des acquis tout au long de la formation,
Questionnaire de satisfaction,
Attestation de stage à chaque apprenant,
Positionnement préalable oral ou écrit,
Evaluation formative tout au long de la formation,
Evaluation sommative faite par le formateur ou à l'aide des certifications disponibles
Modalités distance
A l'aide d'un logiciel comme Teams, Zoom etc... un micro et éventuellement une caméra pour l'apprenant,
suivez une formation en temps réel et entièrement à distance. Lors de la classe en ligne, les apprenants interagissent et comuniquent entre eux et avec le formateur.
Les formations en distanciel sont organisées en Inter-Entreprise comme en Intra-Entreprise.
L'accès à l'environnement d'apprentissage (support de cours, labs) ainsi qu'aux preuves de suivi et d'assiduité (émargement, évaluation) est assuré.
Profil formateur
Nos formateur sont des experts dans leurs domaines d'intervention
Leur expérience de terrain et leurs qualités pédagogiques constituent un gage de qualité.
Accessibilité
Les personnes atteintes de handicap souhaitant suivre cette formation sont invitées à nous contacter directement, afin d'étudier ensemble les possibilités de suivre la formation.
Développeurs en Python, Développeurs de logiciels, programmeurs, Data analysts, Data scientists.
Compte personnel de formation
La formation n'est pas compatible avec le Compte personnel de formation
Sessions inter-entreprises
La formation est compatible avec l’organisation en session inter-entreprises
Programme de la formation
1. Positionnement de Python dans l'analyse de données
- Besoins des data-scientists : calculs, analyse d'images, machine learning, interface avec les bases de données
- Apports de Python : grande variété d'outils, expertise dans le calcul scientifique
- Tour d'horizon des outils : pandas, pyarrow, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe, Pytorch
- Calculs et graphiques :
- NumPy : base du calcul sur tableaux
- SciPy : Scientific Tools for Python, couche scientifique
- Manipulation de tableaux et fonctions mathématiques
- Représentation graphique avec basemap et matplotlib
Atelier : Mise en œuvre de SciPy/NumPy : manipulation d'images, détection de contours
2. Extraction et manipulation de données
- Pandas : manipulation de tables de données, notion de dataframe
- Manipulation de données relationnelles : indexation, opérations, algèbre relationnelle
- Stockage dans des fichiers : CSV, JSON
- Comparaison et performances Pandas / pyarrow / NumPy
Atelier : Construction d’un ETL de base entre JSON et CSV
3. Interconnexion avec les bases de données
- Définitions : pilotes, connexions, curseurs, CRUD, transactions
- Les pilotes : PostgreSQL, MySQL, MariaDB, présentation de SQLAlchemy
- Opérations : gestion du curseur, chargement de données, insertion et modification d’enregistrements
Atelier : Mise en œuvre avec PostgreSQL : construction d’ETL SQL/JSON
4. Outils de traitement et d'analyse de données
- Présentation des outils Python pour l’apprentissage : scikit-learn, pybrain, TensorFlow/Keras, mxnet, caffe
Atelier : Mise en œuvre de scikit-learn
5. Sélections, classements et tendances
- Présentation de PySpark
- Machine learning et deep learning avec Python
- TensorFlow : principe de fonctionnement, plateformes supportées, distribution
- Sites de référence data-sciences : Kaggle, data-puzzles.com, HuggingFace.co
6. Optimisation des développements Python
- Outils actuels et futurs : Jupyter Notebook, vérification du code, respect des recommandations PEP8
- Exemples avec pycodestyle, Pylint, Black
- Analyse et production de code avec IA
- Génération de code avec OpenAI : démonstrations ChatGPT, bonnes pratiques
Atelier : Utilisation de la génération de code et de snippets Python avec ChatGPT

