Objectifs de la formation
-
Comprendre le concept du Big Data
-
Identifier l’écosystème et comprendre les technologies associées
-
Anticiper son intégration dans les activités informatiques de l’entreprise
-
Initiation à l’utilisation de l’outil Hadoop
Programme :
Environnement Big Data
-
Big data
-
Réaliser des calculs massivement parallèle MapReduce
-
Effectuez des calculs distribués sous forme de graphs avec spark
-
Construire une stratégie Big Data
Processus Big Data
-
Acquisition de données
-
Exploration des données
-
Données de prétraitement
-
Analyse des données
-
Communiquer les résultats
-
Transformer les connaissances en action
Premiers pas avec Hadoop
-
L'écosystème Hadoop
-
Le système de fichiers distribué Hadoop
-
YARN : un gestionnaire de ressources pour Hadoop
-
MapReduce : une programmation simple pour de grands résultats
-
Cloud Computing : un important catalyseur de Big Data
-
Modèles de services cloud : une exploration des choix
-
Valeur de Hadoop et des images Hadoop pré-construites
-
Copiez vos données dans le système de fichiers distribué Hadoop (HDFS)
-
Exécutez le programme WordCount