Paris, Toulouse, Biarritz, Bordeaux, Aix-en-Provence
+33 5 61 34 39 80
contact@iform.fr

Catalogue de formations

Apprendre sous un autre angle.

Hadoop Cloudera - Administration

Dernière mise à jour : 01/01/2020

Description
Module 1 : Introduction – L'argument en faveur d'Apache Hadoop
  • Pourquoi Hadoop ?
  • Concepts fondamentaux
  • Composants Core Hadoop  

Module 2 : Installation du cluster Hadoop
  • Caractéristiques de Cloudera Manager
  • Installation de Cloudera Manager
  • Installation de Hadoop (CDH)

Module 3 : Le système de fichiers distribué Hadoop (HDFS)
  • Caractéristiques de HDFS 
  • Ecrire et lire des fichiers
  • Gestion de la mémoire du NameNode
  • Présentation de la sécurité HDFS
  • UI Web pour HDFS
  • Utilisation d'Hadoop File Shell
 
Module 4 : MapReduce et Spark sur YARN
  • YARN : le gestionnaire de ressources de cluster
  • Concepts MapReduce
  • Concepts Apache Spark
  • Exécution des traitements sur YARN
  • Explorer les applications YARN à travers les interfaces utilisateurs Web et le Shell
  • Journaux d'application YARN

Module 5 : Configuration Hadoop et Daemon Logs
  • Gestion des configurations avec Cloudera Manager
  • Gestion des nœuds et ajout de services
  • Configuration du service HDFS
  • Configuration des Hadoop Daemon Logs
  • Configuration du service YARN

Module 6 : Obtenir des données dans HDFS
  • Sqoop : Ingestion des données issues des bases relationnelles
  • Interfaces REST
  • Les meilleures pratiques pour l'importation des données

Module 7 : Planification de votre cluster Hadoop
  • Considérations générales 
  • Choisir le bon matériel
  • Options de virtualisation
  • Considérations sur le réseau
  • Configurations des nœuds

Module 8 : Installation et configuration de Hive, Impala et Pig
  • Hive
  • Impala
  • Pig

Module 9 : Clients Hadoop incluant Hue
  • Les clients Hadoop 
  • Installation et configuration des clients Hadoop
  • Installation et configuration de Hue
  • Authentification et autorisation de Hue

Module 10 : Configuration avancée du cluster
  • Paramètres de configurations avancés
  • Configuration des ports Hadoop
  • Data locality : Configuration de HDFS 
  • Configuration de la haute disponibilité HDFS

Module 11 : Sécurité Hadoop
  • Concepts du système de sécurité Hadoop
  • Qu'est ce que Kerberos et comment ça marche ?
  • Sécurisation d'un cluster Hadoop avec Kerberos
  • Autres concepts de sécurité

Module 12 : Gestion des ressources
  • Configuration des cgroups 
  • Le Fair Scheduler
  • Configuration du Dynamique Resource Pools
  • Configuration de la RAM et CPU pour YARN
  • Gestion des requêtes Impala
Objectifs de la formation
  • Poser les bases des clusters Hadoop : choix du matériel, configuration des noeuds
  • Configurer, déployer et gérer des Clusters : utiliser "Cloudera Manager for Easy Installation", "Configuration Management Tools" 
  • Ajout et suppression des noeuds, rebalancing et optimisation d'un cluster.
  • Gestion des ressources : Le "FIFO Scheduler", Le "FairScheduler"
  • Gérer les "Log files" d'Hadoop
  • Utiliser le "NameNode" et "Job Tracker Web UI"
  • Troubleshooting
  • Comment « Benchmarker » son cluster dans le temps
  • Poser les bases de l'environnement Hadoop et HDFS
Public visé
  • Administrateurs systèmes et toutes personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.
Prérequis
  • Avoir une expérience dans l'administration système Linux.
  • Aucune expérience avec Hadoop n'est nécessaire
Modalités pédagogiques
Inter-Entreprises
Intra-Entreprises et sur-mesure
Moyens et supports pédagogiques
Salle de formation équipée :
- un poste informatique par apprenant
- un bloc-notes + stylo
- un support de cours
- un espace de partage en ligne
- un vidéoprojecteur
- un tableau blanc
- connexion Internet
Modalités d'évaluation et de suivi
Questionnaire en ligne permettant l'évaluation des pré-requis.
Questionnaire de satisfaction de fin de stage.






 

M'inscrire à la formation

Ajouter au panier
Prochaines Sessions
  • Désolé, cette formation n'est pas programmée pour le moment.
    Si vous êtes responsable formation, vous pouvez faire une requête pour l'organiser en INTRA dans votre entreprise.

Catalogue de formation propulsé par Dendreo
Logiciel spécialisé pour centres et organismes de formation