• Accueil /
  • Data Scientist + AWS Cloud Practitioner

Data Scientist + AWS Cloud Practitioner

Cette formation complète pour Data Scientist vous permettra de traiter efficacement les données et élaborer des modèles prédictifs, ce qui nécessite des compétences en génie informatique et en statistique. A l’issue de cette formation, vous maîtriserez les fondamentaux de Python et de Data Visualisation. Surtout, vous aurez acquis de fortes compétences en Machine Learning, Deep Learning et systèmes complexes.

5 890 € HT

Modalités de la formation Data Scientist + AWS Cloud Practitioner

E-LEARNING + DISTANCIEL
Durée

400 heures

Tarifs

5 890 € HT/pers

Tarif Intra sur demande

Public visé

Personnes ayant une appétence pour la Data souhaitant se reconvertir ou faire évoluer ses compétences.

Prérequis​
  • Avoir déjà suivi une formation Data Scientist ou occupé un poste de Data Scientist depuis 2 ans.
Objectifs pédagogiques​​
  • Étudier les données de l’entreprise qui permettront de définir celles qui seront extraites et traitées.
  • Récupérer et analyser des données pertinentes liées au processus de production de l’entreprise, à la vente ou encore liées aux données clients
  • Élaborer des modèles prédictifs afin d’anticiper l’évolution des données et tendances relatives à l’activité de l’entreprise
  • Modéliser des résultats d’analyse des données pour les rendre lisibles et exploitables par les managers
  • Mener un projet concret de Data Science permettant d’attester des compétences acquises.
  • D’obtenir la certification AWS Cloud Practitionner
Méthodes pédagogiques

Cette formation est en format 100% distanciel en format hybride :

  • Pendant 20 % du temps, vous êtes accompagnés par votre professeur et votre cohorte pour des sessions de visioconférence. Vous aurez ainsi des points collectifs (masterclass live, cours de soutien) et des points plus individuels avec votre mentor projet.
  • Pour les 85 % restants, vous travaillez sur notre plateforme prête-à-coder avec le soutien d’une cellule support disponible par messagerie instantanée et d’un forum disponible à tout moment.
Modalités d’évaluation
  • Test d’entrée et de sortie pour valider les compétences acquises.
  • L’évaluation est réalisée tout au long de la formation grâce à des Use cases métiers permettant de vous mettre en situation.
  • A l’issue de la formation, vous devez également soutenir votre projet devant un jury de 3 personnes qui validera vos compétences.
  • Certification académique : Les Mines ParisTech
  • Certification Etatique : validation du bloc de compétences RNCP niveau 7 « Développer une solution d’intelligence artificielle (Machine et Deep Learning) » du titre 36129.
Délais d’accès

10 jours ouvrés minimum entre la demande du bénéficiaire et le début de la formation.

Accessibilité

Formation accessible aux personnes en situation de handicap.

Programme de la formation Data Scientist + AWS Cloud Practitioner

I/ Introduction à Python

Fondamentaux de Python 

  • Découverte des différentes variables, listes et Tuples
  • Présentation des divers opérateurs et structures de contrôle
  • Initiation au concept de boucle et ses différents types
  • Introduction aux fonctions et leurs documentations
  • Instanciation de classes et utilisation de modules

Numpy  

  • Création et manipulation d’un NumPy Array
  • Présentation des opérations matricielles et manipulation d’un NumPy Array
  • Création d’un indicateur statistique et opérations sur le NumPy Array

Pandas 

  • Introduction à la bibliothèque Pandas
  • Chargement et première exploration d’un jeu de données
  • Introduction au Data Cleaning
  • Introduction au Data Processing

Data quality (Optionnel) 

  • Présentation des principes essentiels à la Data Quality
  • Traitement des variables numériques et textuelles
  • Introduction au nettoyage de données
  • Initiation à la gestion des valeurs manquantes

II/ Data Visualisation

Matplotlib 

  • Présentation de différents types de graphes
  • Introduction à la personnalisation de graphique

Seaborn 

  • Maîtrise de l’analyse de distribution
  • Mise en place de l’analyse statistique
  • Initiation à l’analyse multivariée

Bokeh (Optionnel) 

  • Formation à tous types de graphiques interactifs et intégrables sur page Web
  • Visualisation de données géographiques
  • Découverte des Widgets et création

III/ Machine Learning

A. Machine Learning Supervisé

Classification simple de modèles 

  • Introduction à SciKit Learn
  • Présentation de la Classification SVM
  • Application de la méthode K-Nearest neighbors

Classification avancée de modèles 

  • Sélection de modèles
  • Classification semi-supervisée

B. Machine Learning Non Supervisé

Méthodes de Clustering 

  • Présentation des algorithmes K-moyenne
  • Découvertes des algorithmes de mean shift

Méthdode de Régression 

  • Introduction à la régression linéaire simple et multiple
  • Introduction à la régression linéaire régularisé

Méthodes de réduction de dimension 

  • Feature selection process
  • Initiation aux analyses en composantes principales
  • Application de l’approche Manifold Learning

IV/ Machine Learning Avancé

Séries temporelles avec Statsmodels

  • Découverte des modèles de base
  • Découverte des modèles ARIMA

Text Mining 

  • Introduction aux expressions régulières
  • Gestion de données textuelles
  • Création de Worldclouds

Machine Learning et théorie des graphes avec Network X

  • Introduction à la théorie des graphes
  • Application des algorithmes fondamentaux : Krustal et Dijkstra
  • Détection de communautés
  • Application de l’algorithme PageRank au classement de page Web

V/ Big Data/Database

Introduction au Data Engineering et Big Data 

  • Introduction aux 3V du Big Data (Volume, variété, vélocité)
  • Présentation des bases de données et Architectures
  • Mise en production de données

Data Processing et Machine Learning sur des grandes bases de données 

  • Introduction à PySpark
  • Découverte des différentes fonctions de PySpark
    ▪ Le Data Processing
    ▪ Les Data Frames
    ▪ La Régression avec PySpark
    ▪ Le ML pipelines
    ▪ Le Model Turning

VI/ Deep Learning

Deep Learning avec le framework Keras 

  • Découverte des concepts fondamentaux :
    ▪ Dense Neural Networks
    ▪ Convolutional Neural Networks
    ▪ Architecture LeNet
    ▪ Transfer Learning

Introduction à Tensorflow 2.0 

  • Mise en relation de Tensorlfow et Keras
  • Application du Word Embedding avec Word2vec
  • Présentation du Recurent Neural Network
  • Présentation du Generative adversial Network

VII/ Système complexe et IA

Introduction au reinforcement learning 

  • Définition des éléments de l’apprentissage par renforcement
  • Mise au point sur les fondamentaux mathématiques pour le reinforcement learning
  • Présentation de la principale famille d’algorithmes de reinforcement learning : Monte Carlo o Application des algorithmes d’apprentissage par différence temporelle : SARSA
  • Application des algorithmes d’apprentissage par différence temporelle : Q-Learning
  • Comparaison entre Temporal Difference Learning et Monte Carlo

Deep Reinforcement Learning 

  • Introduction au Deep Reinforcement Learning
  • Compréhension des fondements des méthodes basées sur la valeur
  • Compréhension des problèmes de variances élevés, des risques de surestimations et application des  méthodes de résolution
  • Introduction à la méthode de Policy Gradient
  • Compréhension des principes fondamentaux de la structure Acteur-Critique utilisée dans l’apprentissage en  Deep Reinforcement Learning
  • Application à des Business Cases
Demande d'information

Aïe ! Nous n’avons pas retrouvé votre formulaire.