Module 1 : Introduction – L'argument en faveur d'Apache Hadoop
- Pourquoi Hadoop ?
- Concepts fondamentaux
- Composants Core Hadoop
Module 2 : Installation du cluster Hadoop
- Caractéristiques de Cloudera Manager
- Installation de Cloudera Manager
- Installation de Hadoop (CDH)
Module 3 : Le système de fichiers distribué Hadoop (HDFS)
- Caractéristiques de HDFS
- Ecrire et lire des fichiers
- Gestion de la mémoire du NameNode
- Présentation de la sécurité HDFS
- UI Web pour HDFS
- Utilisation d'Hadoop File Shell
Module 4 : MapReduce et Spark sur YARN
- YARN : le gestionnaire de ressources de cluster
- Concepts MapReduce
- Concepts Apache Spark
- Exécution des traitements sur YARN
- Explorer les applications YARN à travers les interfaces utilisateurs Web et le Shell
- Journaux d'application YARN
Module 5 : Configuration Hadoop et Daemon Logs
- Gestion des configurations avec Cloudera Manager
- Gestion des nœuds et ajout de services
- Configuration du service HDFS
- Configuration des Hadoop Daemon Logs
- Configuration du service YARN
Module 6 : Obtenir des données dans HDFS
- Sqoop : Ingestion des données issues des bases relationnelles
- Interfaces REST
- Les meilleures pratiques pour l'importation des données
Module 7 : Planification de votre cluster Hadoop
- Considérations générales
- Choisir le bon matériel
- Options de virtualisation
- Considérations sur le réseau
- Configurations des nœuds
Module 8 : Installation et configuration de Hive, Impala et Pig
Module 9 : Clients Hadoop incluant Hue
- Les clients Hadoop
- Installation et configuration des clients Hadoop
- Installation et configuration de Hue
- Authentification et autorisation de Hue
Module 10 : Configuration avancée du cluster
- Paramètres de configurations avancés
- Configuration des ports Hadoop
- Data locality : Configuration de HDFS
- Configuration de la haute disponibilité HDFS
Module 11 : Sécurité Hadoop
- Concepts du système de sécurité Hadoop
- Qu'est ce que Kerberos et comment ça marche ?
- Sécurisation d'un cluster Hadoop avec Kerberos
- Autres concepts de sécurité
Module 12 : Gestion des ressources
- Configuration des cgroups
- Le Fair Scheduler
- Configuration du Dynamique Resource Pools
- Configuration de la RAM et CPU pour YARN
- Gestion des requêtes Impala