Data Scientist + AWS Cloud Practitioner

Cette formation complète pour Data Scientist vous permettra de traiter efficacement les données et élaborer des modèles prédictifs, ce qui nécessite des compétences en génie informatique et en statistique. A l’issue de cette formation, vous maîtriserez les fondamentaux de Python et de Data Visualisation. Surtout, vous aurez acquis de fortes compétences en Machine Learning, Deep Learning et systèmes complexes.

5 890 € HT

Modalités de la formation Data Scientist + AWS Cloud Practitioner

E-LEARNING + DISTANCIEL

Durée

400 heures

Tarifs

5 890 € HT/pers

Tarif Intra sur demande

Public visé

Personnes ayant une appétence pour la Data souhaitant se reconvertir ou faire évoluer ses compétences.

Prérequis

Avoir déjà suivi une formation Data Scientist ou occupé un poste de Data Scientist depuis 2 ans.

Objectifs pédagogiques

Étudier les données de l’entreprise qui permettront de définir celles qui seront extraites et traitées.
Récupérer et analyser des données pertinentes liées au processus de production de l’entreprise, à la vente ou encore liées aux données clients
Élaborer des modèles prédictifs afin d’anticiper l’évolution des données et tendances relatives à l’activité de l’entreprise
Modéliser des résultats d’analyse des données pour les rendre lisibles et exploitables par les managers
Mener un projet concret de Data Science permettant d’attester des compétences acquises.
D’obtenir la certification AWS Cloud Practitionner

Méthodes pédagogiques

Cette formation est en format 100% distanciel en format hybride :

Pendant 20 % du temps, vous êtes accompagnés par votre professeur et votre cohorte pour des sessions de visioconférence. Vous aurez ainsi des points collectifs (masterclass live, cours de soutien) et des points plus individuels avec votre mentor projet.
Pour les 85 % restants, vous travaillez sur notre plateforme prête-à-coder avec le soutien d’une cellule support disponible par messagerie instantanée et d’un forum disponible à tout moment.

Modalités d’évaluation

Test d’entrée et de sortie pour valider les compétences acquises.
L’évaluation est réalisée tout au long de la formation grâce à des Use cases métiers permettant de vous mettre en situation.
A l’issue de la formation, vous devez également soutenir votre projet devant un jury de 3 personnes qui validera vos compétences.
Certification académique : Les Mines ParisTech
Certification Etatique : validation du bloc de compétences RNCP niveau 7 « Développer une solution d’intelligence artificielle (Machine et Deep Learning) » du titre 36129.

Délais d’accès

10 jours ouvrés minimum entre la demande du bénéficiaire et le début de la formation.

Accessibilité

Formation accessible aux personnes en situation de handicap.

Programme de la formation Data Scientist + AWS Cloud Practitioner

I/ Introduction à Python

Fondamentaux de Python

Découverte des différentes variables, listes et Tuples
Présentation des divers opérateurs et structures de contrôle
Initiation au concept de boucle et ses différents types
Introduction aux fonctions et leurs documentations
Instanciation de classes et utilisation de modules

Numpy

Création et manipulation d’un NumPy Array
Présentation des opérations matricielles et manipulation d’un NumPy Array
Création d’un indicateur statistique et opérations sur le NumPy Array

Pandas

Introduction à la bibliothèque Pandas
Chargement et première exploration d’un jeu de données
Introduction au Data Cleaning
Introduction au Data Processing

Data quality (Optionnel)

Présentation des principes essentiels à la Data Quality
Traitement des variables numériques et textuelles
Introduction au nettoyage de données
Initiation à la gestion des valeurs manquantes

II/ Data Visualisation

Matplotlib

Présentation de différents types de graphes
Introduction à la personnalisation de graphique

Seaborn

Maîtrise de l’analyse de distribution
Mise en place de l’analyse statistique
Initiation à l’analyse multivariée

Bokeh (Optionnel)

Formation à tous types de graphiques interactifs et intégrables sur page Web
Visualisation de données géographiques
Découverte des Widgets et création

III/ Machine Learning

A. Machine Learning Supervisé

Classification simple de modèles

Introduction à SciKit Learn
Présentation de la Classification SVM
Application de la méthode K-Nearest neighbors

Classification avancée de modèles

Sélection de modèles
Classification semi-supervisée

B. Machine Learning Non Supervisé

Méthodes de Clustering

Présentation des algorithmes K-moyenne
Découvertes des algorithmes de mean shift

Méthdode de Régression

Introduction à la régression linéaire simple et multiple
Introduction à la régression linéaire régularisé

Méthodes de réduction de dimension

Feature selection process
Initiation aux analyses en composantes principales
Application de l’approche Manifold Learning

IV/ Machine Learning Avancé

Séries temporelles avec Statsmodels

Découverte des modèles de base
Découverte des modèles ARIMA

Text Mining

Introduction aux expressions régulières
Gestion de données textuelles
Création de Worldclouds

Machine Learning et théorie des graphes avec Network X

Introduction à la théorie des graphes
Application des algorithmes fondamentaux : Krustal et Dijkstra
Détection de communautés
Application de l’algorithme PageRank au classement de page Web

V/ Big Data/Database

Introduction au Data Engineering et Big Data

Introduction aux 3V du Big Data (Volume, variété, vélocité)
Présentation des bases de données et Architectures
Mise en production de données

Data Processing et Machine Learning sur des grandes bases de données

Introduction à PySpark
Découverte des différentes fonctions de PySpark
▪ Le Data Processing
▪ Les Data Frames
▪ La Régression avec PySpark
▪ Le ML pipelines
▪ Le Model Turning

VI/ Deep Learning

Deep Learning avec le framework Keras

Découverte des concepts fondamentaux :
▪ Dense Neural Networks
▪ Convolutional Neural Networks
▪ Architecture LeNet
▪ Transfer Learning

Introduction à Tensorflow 2.0

Mise en relation de Tensorlfow et Keras
Application du Word Embedding avec Word2vec
Présentation du Recurent Neural Network
Présentation du Generative adversial Network

VII/ Système complexe et IA

Introduction au reinforcement learning

Définition des éléments de l’apprentissage par renforcement
Mise au point sur les fondamentaux mathématiques pour le reinforcement learning
Présentation de la principale famille d’algorithmes de reinforcement learning : Monte Carlo o Application des algorithmes d’apprentissage par différence temporelle : SARSA
Application des algorithmes d’apprentissage par différence temporelle : Q-Learning
Comparaison entre Temporal Difference Learning et Monte Carlo

Deep Reinforcement Learning

Introduction au Deep Reinforcement Learning
Compréhension des fondements des méthodes basées sur la valeur
Compréhension des problèmes de variances élevés, des risques de surestimations et application des méthodes de résolution
Introduction à la méthode de Policy Gradient
Compréhension des principes fondamentaux de la structure Acteur-Critique utilisée dans l’apprentissage en Deep Reinforcement Learning
Application à des Business Cases

Ces formations pourraient aussi vous intéresser

Data Engineer + AZ 900 Azure Fundamentals

Data Manager + Certification PL 900 Microsoft Power Platform

Data Analyst + Certification PL 900 Microsoft Power Platform

110

Stagiaires formés

1 514

heures de formation dispensées

90%

de taux de satisfaction

chiffres obtenues sur le dernier trimestre 2022