Trouver votre formation
Trouver ma formation
Je veux me former en
sélectionner
Achats et Supply Chain
Lean Management & Lean Six Sigma, Excellence Opérationnelle
Projets, Leadership et Management de la transformation
Systèmes d'information et Technologies du digital
Technologies et Systèmes
?
Dans quel domaine ?
et plus précisément en
sélectionner
?
Dans quel sous domaine ?
Achats
Agilité
Architecture des Systèmes d'Information
Automatique/signaux
Big Data
Cloud Computing
Cybersécurité
Électronique de Puissance
Électronique et instrumentation
Énergie électrique et thermique
Industrie 4.0
Ingénierie Durable
Ingénierie Systèmes
Innovation et Intrapreneuriat
Intelligence Artificielle
Lean Management
Lean Six Sigma
Management de projets, leadership
Mécanique
Négociation
Objets connectés
PLM
Risk Management
Supply chain management
Technologies du digital
Télécommunications
Transformation digitale
grâce à une
sélectionner
?
Quel type de formation ?
Formation certifiante
Formation diplômante
Formation courte
DécouvrIR les formations

Contexte

Ce module aborde le traitement distribué des données. Hadoop est la technologie la plus connue dans l'univers des BigData.

L’objectif de ce module est d’apprendre à utiliser cet outil et son écosystème qui est le moyen le plus robuste de lancer de larges calculs distribués sur un ensemble de machines. L'écosystème Hadoop est vaste et riche.

Ce module a pour but de délivrer la connaissance, sur le plan théorique et pratique, nécessaire pour être en mesure de faire les bons choix dans son utilisation.
Le module donne ainsi la capacité de mener à bien un projet "Big Data".

ObjectifS

COMPRENDRE les outils techniques permettant les calculs distribués à grande échelle.
POSITIONNER ET MANIPULER les outils de l'écosystème Hadoop (Hive, Pig, Spark).
ÊTRE EN MESURE de savoir quand et comment utiliser ces outils.

PROGRAMME

  • Système distribué
    - Tour d'horizon de l'écosystème Hadoop.
    - Motivations et introduction de la révolution "Hadoop" et son lien avec le big data.
  • Hadoop et MapReduce
    - Définitions.
    - Présentation Hadoop Core : HDFS et Map/Reduce.
  • Programmation Hadoop
    - Création de programmes utilisant le Framework MapReduce.
  • Pig et Hive pour l'analyse de données
    - Manipulation Pig et Hive.
    - Création de programmes en Pig et Hive en utilisant le framework Hadoop.
  • Architecture
    - Les questions à se poser lors de la mise en place d'un cluster Hadoop.
    - L'organisation des données.
  • Spark (introduction)
    - Définition et positionnement de Spark par rapport à Hadoop MapReduce.
    - Les caractéristiques des RDD (Resilient Distributed Dataset).
    - Présentation des éléments clés du framework et mise en pratique.
  • Scalabilité
    - Packager ses applications avec Docker.
    - Distribuer la charge avec Kubernetes / Docker Swarm.
    - Exercices pratiques.
    - Tirer parti du cloud.

public concerné

Managers des systèmes d’information
Ingénieurs recherche et développement
Experts en business intelligence
Chefs de projet
Consultants techniques, dataminers

en pratique

Méthodes pédagogiques

Méthode de formation «Learning by doing ».
Apports théoriques.
Utilisation de cas réels des participants.
Cas pratiques.
Travaux dirigés.

Moyens pédagogiques

Se prémunir d’un ordinateur portable (avec au moins 8GB de RAM).
Séance de formation en salle.
Séance pratique sur ordinateur.
Hortonworks sandbox HDP 2.6.4 https://hortonworks.com/downloads/#sandbox
VirtualBox 5.2.8 https://www.virtualbox.org/wiki/Download_Old_Builds_5_2.
Un éditeur de texte d(sublim text, emacs, vi, atom)
Si l’OS est windows, un client SSH (ex: putty https://putty.org/).
Navigateur internet chrome ou firefox.
Filezila.

Modalités d'évaluation

L'évaluation des connaissances acquises en formation s'appuie sur la réalisation de mise en situation et des études de cas mises en oeuvre par le formateur.

Statistiques

3500
cadres formés par an

6
campus en France et dans le monde

1
centre de formation au coeur de Paris

89%
de nos participants recommandent nos formations
(*source 1er semestre 2019)

Votre contact pour cette formation

Laetitia Vigneron-Field
Chargée d'affaires

+33 (0)1 75 31 68 97

laetitia.vigneron-field@centralesupelec.fr

Ils vous en parlent

La valorisation des données est un enjeu stratégique pour les entreprises, quel que soit leur secteur d’activité. La compréhension des enjeux des technologies sous-jacentes est un levier fondamental. Nos programmes permettent de comprendre et maitriser les différentes facettes du « big data » : comment cadrer les projets, gérer la sécurité et les aspects juridiques, définir des usages, des architectures et aborder les technologies de stockage distribué, de traitement distribué ou encore d’analyse de données et de machine learning. Cette approche mêlant technologie, métier et juridique permet de prendre en compte toute la diversité du sujet des big data.

Marie-Aude Aufaure
Responsable des programmes Big Data

Pour moi comme pour mon employeur, comprendre et mettre à profit le Big Data n’était pas une option, mais une obligation. Depuis ma formation à CentraleSupélec Exed, j’ai intégré l’équipe Big Data et ce changement d’affectation me place aux premières loges de son intégration progressive dans les activités de l’entreprise. Suivre cette formation a été un tremplin pour aller plus loin encore dans la création de valeur pour mon entreprise et pour moi-même. J’ai vraiment pris conscience de l’importance de maintenir mon employabilité.

Damien Droisy, Promo 2016

Traitement distribué pour les Big Data

Référence :
SI33-20
Prix :
2 490€ (HT)
(Restauration offerte)
contact
  • Du 07/12/2020 au 09/12/2020
    Du 01/03/2021 au 03/03/2021
    Formation programmée à la demande. Nous consulter.
    + Plus de dates
  • 3 jours - 21 heures
  • Paris (75015)

Ils parlent de cette formation

Vidéos
articles

Formations sur le même thème

Définition du projet d’architecture

2 955€ (HT)
  • 14 jours - 98 heures
  • Campus Paris-Saclay (Gif-sur-Yvette)
En savoir +
https://www.moncompteformation.gouv.fr/espace-prive/html/#/formation/recherche/33468834800070_AT01B1/33468834800070_AT01B1?q=%7B%22nombreOccurences%22:10,%22debutPagination%22:1,%22displayName%22:%22D%C3%A9finition%20du%20projet%20d'architecture%22,%22sort%22:%22SCORE%22,%22filters%22:%7B%22price%22:%7B%22minValue%22:0,%22maxValue%22:10000,%22step%22:500,%22value%22:10000%7D,%22distance%22:%7B%22minValue%22:0,%22maxValue%22:1000,%22defaultValue%22:500,%22step%22:20,%22value%22:500%7D%7D,%22where%22:%7B%22area%22:0,%22aroundMe%22:false,%22modality%22:%221%22,%22value%22:%7B%22city%22:%22GIF%20SUR%20YVETTE%22,%22postalCode%22:%2291190%22,%22coordinates%22:%7B%22longitude%22:2.1276655,%22latitude%22:48.709663%7D%7D%7D,%22_what%22:%22D%C3%A9finition%20du%20projet%20d'architecture%22%7D
https://app.agendize.com/book/26999222?staff=27000811&service=26999533
toutes nos formations

Télécharger la brochure

Aller au contenu principal