I/ Introduction à Python
Fondamentaux de Python
- Découverte des différentes variables, listes et Tuples
- Présentation des divers opérateurs et structures de contrôle
- Initiation au concept de boucle et ses différents types
- Introduction aux fonctions et leurs documentations
- Instanciation de classes et utilisation de modules
Numpy
- Création et manipulation d’un Numpy array
- Présentation des opérations matricielles
- Création d’un indicateur statistique et applications
Pandas
- Chargement et première exploration d’un jeu de données
- Introduction au Data Cleaning
- Introduction au Data Processing
Data quality (Optionnel)
- Présentation des principes essentiels à la Data Quality
- Traitement des variables numériques et textuelles
- Introduction au nettoyage de données
- Initiation à la gestion des valeurs manquantes
II/ Data Visualisation
Matplotlib
- Présentation de différents types de graphes
- Introduction à la personnalisation de graphique
Seaborn
- Initiation à l’analyse de distribution
- Découverte de l’analyse statistique
- Initiation à l’analyse multivariée
Bokeh (Optionnel)
- Formation à tous types de graphiques interactifs et intégrables sur page Web
Matplotlib complément (Optionnel)
- Présentation de graphiques avancés avec Matplotlib
- Création de figures avec classes et objets
III/ Machine Learning
Algorithme et méthodologie de classification avec Scikit-Learn
- Présentation des algorithmes de classification (Régression logistique, KNN, Arbre de décision, forêt aléatoire, SVM…)
- Initiation aux algorithmes de Boosting et de Bagging
- Découverte des différents modèles et sélections
- Classification des données déséquilibrées
Méthode de réduction de dimension
- Introduction à l’analyse en composantes principales
- Présentation de l’algorithme T-SNE
- Introduction à l’analyse discriminante linéaire
- Découverte du clustering avec l’algorithme des K-means
Méthode de régression
- Introduction à la régression linéaire simple
- Introduction à la régression linéaire multiple
IV/ Extraction et gestion de données textes
Text Mining
- Introduction aux expressions régulières
- Mise au point à la gestion de données textuelles
- Création de Worldclouds
- Présentation de l’analyse de sentiments
WebScraping
- Introduction au langage web (HTML, CSS)
- Extraction de contenu Web avec BeautifulSoup
- Application du scrapping sur Google
V Big Data/Database
Introduction au Data Engineering et Big Data
- Introduction aux 3V du Big Data (Volume, variété, vélocité)
- Présentation des bases de données et Architectures
- Mise en production de données
Data Processing et Machine Learning sur des grandes bases de données
- Introduction à PySpark
- Découverte des différentes fonctions de PySpark
- Le Data Processing
Les Data Frames
La Régression avec PySpark
Le ML pipelines
Le Model Turning
VI/ Business Intelligence
Business Intelligence
- Introduction à la BI : concepts et usage
Power BI
- Connexion aux sources de données
- Data visualisation avec Power Query
- Relations et Modélisation de données transformées o Introduction au langage DAX
- Création d’un tableau de bord approfondi et étude de cas
Tableau
- Connexion aux sources de données
- Mise en forme des données
- Présentation de la Data Visualisation