I/ Introduction à Python
Fondamentaux de Python
- Découverte des différentes variables, listes et Tuples
- Présentation des divers opérateurs et structures de contrôle
- Initiation au concept de boucle et ses différents types
- Introduction aux fonctions et leurs documentations
- Instanciation de classes et utilisation de modules
Numpy
- Création et manipulation d’un NumPy Array
- Présentation des opérations matricielles et manipulation d’un NumPy Array
- Création d’un indicateur statistique et opérations sur le NumPy Array
Pandas
- Introduction à la bibliothèque Pandas
- Chargement et première exploration d’un jeu de données
- Introduction au Data Cleaning
- Introduction au Data Processing
Data quality (Optionnel)
- Présentation des principes essentiels à la Data Quality
- Traitement des variables numériques et textuelles
- Introduction au nettoyage de données
- Initiation à la gestion des valeurs manquantes
II/ Data Visualisation
Matplotlib
- Présentation de différents types de graphes
- Introduction à la personnalisation de graphique
Seaborn
- Maîtrise de l’analyse de distribution
- Mise en place de l’analyse statistique
- Initiation à l’analyse multivariée
Bokeh (Optionnel)
- Formation à tous types de graphiques interactifs et intégrables sur page Web
- Visualisation de données géographiques
- Découverte des Widgets et création
III/ Machine Learning
A. Machine Learning Supervisé
Classification simple de modèles
- Introduction à SciKit Learn
- Présentation de la Classification SVM
- Application de la méthode K-Nearest neighbors
Classification avancée de modèles
- Sélection de modèles
- Classification semi-supervisée
B. Machine Learning Non Supervisé
Méthodes de Clustering
- Présentation des algorithmes K-moyenne
- Découvertes des algorithmes de mean shift
Méthdode de Régression
- Introduction à la régression linéaire simple et multiple
- Introduction à la régression linéaire régularisé
Méthodes de réduction de dimension
- Feature selection process
- Initiation aux analyses en composantes principales
- Application de l’approche Manifold Learning
IV/ Machine Learning Avancé
Séries temporelles avec Statsmodels
- Découverte des modèles de base
- Découverte des modèles ARIMA
Text Mining
- Introduction aux expressions régulières
- Gestion de données textuelles
- Création de Worldclouds
Machine Learning et théorie des graphes avec Network X
- Introduction à la théorie des graphes
- Application des algorithmes fondamentaux : Krustal et Dijkstra
- Détection de communautés
- Application de l’algorithme PageRank au classement de page Web
V/ Big Data/Database
Introduction au Data Engineering et Big Data
- Introduction aux 3V du Big Data (Volume, variété, vélocité)
- Présentation des bases de données et Architectures
- Mise en production de données
Data Processing et Machine Learning sur des grandes bases de données
- Introduction à PySpark
- Découverte des différentes fonctions de PySpark
▪ Le Data Processing
▪ Les Data Frames
▪ La Régression avec PySpark
▪ Le ML pipelines
▪ Le Model Turning
VI/ Deep Learning
Deep Learning avec le framework Keras
- Découverte des concepts fondamentaux :
▪ Dense Neural Networks
▪ Convolutional Neural Networks
▪ Architecture LeNet
▪ Transfer Learning
Introduction à Tensorflow 2.0
- Mise en relation de Tensorlfow et Keras
- Application du Word Embedding avec Word2vec
- Présentation du Recurent Neural Network
- Présentation du Generative adversial Network
VII/ Système complexe et IA
Introduction au reinforcement learning
- Définition des éléments de l’apprentissage par renforcement
- Mise au point sur les fondamentaux mathématiques pour le reinforcement learning
- Présentation de la principale famille d’algorithmes de reinforcement learning : Monte Carlo o Application des algorithmes d’apprentissage par différence temporelle : SARSA
- Application des algorithmes d’apprentissage par différence temporelle : Q-Learning
- Comparaison entre Temporal Difference Learning et Monte Carlo
Deep Reinforcement Learning
- Introduction au Deep Reinforcement Learning
- Compréhension des fondements des méthodes basées sur la valeur
- Compréhension des problèmes de variances élevés, des risques de surestimations et application des méthodes de résolution
- Introduction à la méthode de Policy Gradient
- Compréhension des principes fondamentaux de la structure Acteur-Critique utilisée dans l’apprentissage en Deep Reinforcement Learning
- Application à des Business Cases