Accueil > Python

 > Formation à distance : Python avancé pour data-scientists

null

Python

Formation à distance : Python avancé pour data-scientists

Objectif

Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python, savoir extraire des données d'un fichier et les manipuler, mettre en place un modèle d'apprentissage simple

Certifications

Durée : 4 jours (28 h)

Dates :
-20/04/26
-21/09/26
-30/11/26

Bonne connaissance de la programmation Python.

Programme de la formation

1. Positionnement de Python dans l'analyse de données

  • Besoins des data-scientists : calculs, analyse d'images, machine learning, interface avec les bases de données
  • Apports de Python : grande variété d'outils, expertise dans le calcul scientifique
  • Tour d'horizon des outils : pandas, pyarrow, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe, Pytorch
  • Calculs et graphiques :
    • NumPy : base du calcul sur tableaux
    • SciPy : Scientific Tools for Python, couche scientifique
    • Manipulation de tableaux et fonctions mathématiques
    • Représentation graphique avec basemap et matplotlib

Atelier : Mise en œuvre de SciPy/NumPy : manipulation d'images, détection de contours

2. Extraction et manipulation de données

  • Pandas : manipulation de tables de données, notion de dataframe
  • Manipulation de données relationnelles : indexation, opérations, algèbre relationnelle
  • Stockage dans des fichiers : CSV, JSON
  • Comparaison et performances Pandas / pyarrow / NumPy

Atelier : Construction d’un ETL de base entre JSON et CSV

3. Interconnexion avec les bases de données

  • Définitions : pilotes, connexions, curseurs, CRUD, transactions
  • Les pilotes : PostgreSQL, MySQL, MariaDB, présentation de SQLAlchemy
  • Opérations : gestion du curseur, chargement de données, insertion et modification d’enregistrements

Atelier : Mise en œuvre avec PostgreSQL : construction d’ETL SQL/JSON

4. Outils de traitement et d'analyse de données

  • Présentation des outils Python pour l’apprentissage : scikit-learn, pybrain, TensorFlow/Keras, mxnet, caffe

Atelier : Mise en œuvre de scikit-learn

5. Sélections, classements et tendances

  • Présentation de PySpark
  • Machine learning et deep learning avec Python
  • TensorFlow : principe de fonctionnement, plateformes supportées, distribution
  • Sites de référence data-sciences : Kaggle, data-puzzles.com, HuggingFace.co

6. Optimisation des développements Python

  • Outils actuels et futurs : Jupyter Notebook, vérification du code, respect des recommandations PEP8
  • Exemples avec pycodestyle, Pylint, Black
  • Analyse et production de code avec IA
  • Génération de code avec OpenAI : démonstrations ChatGPT, bonnes pratiques

Atelier : Utilisation de la génération de code et de snippets Python avec ChatGPT

Menu