Paris, Toulouse, Biarritz, Bordeaux, Aix-en-Provence
+33 5 61 34 39 80
contact@iform.fr

Catalogue de formations

Apprendre sous un autre angle.

Hadoop Cloudera - Administration Mixte : présentiel / à distance

Dernière mise à jour : 08/07/2025

Description

Module 1 : Introduction – L'argument en faveur d'Apache Hadoop

  • Pourquoi Hadoop ?
  • Concepts fondamentaux
  • Composants Core Hadoop  

 

Module 2 : Installation du cluster Hadoop

  • Caractéristiques de Cloudera Manager
  • Installation de Cloudera Manager
  • Installation de Hadoop (CDH)

 

Module 3 : Le système de fichiers distribué Hadoop (HDFS)

  • Caractéristiques de HDFS 
  • Ecrire et lire des fichiers
  • Gestion de la mémoire du NameNode
  • Présentation de la sécurité HDFS
  • UI Web pour HDFS
  • Utilisation d'Hadoop File Shell

 

Module 4 : MapReduce et Spark sur YARN

  • YARN : le gestionnaire de ressources de cluster
  • Concepts MapReduce
  • Concepts Apache Spark
  • Exécution des traitements sur YARN
  • Explorer les applications YARN à travers les interfaces utilisateurs Web et le Shell
  • Journaux d'application YARN

 

Module 5 : Configuration Hadoop et Daemon Logs

  • Gestion des configurations avec Cloudera Manager
  • Gestion des nœuds et ajout de services
  • Configuration du service HDFS
  • Configuration des Hadoop Daemon Logs
  • Configuration du service YARN

 

Module 6 : Obtenir des données dans HDFS

  • Sqoop : Ingestion des données issues des bases relationnelles
  • Interfaces REST
  • Les meilleures pratiques pour l'importation des données

 

Module 7 : Planification de votre cluster Hadoop

  • Considérations générales 
  • Choisir le bon matériel
  • Options de virtualisation
  • Considérations sur le réseau
  • Configurations des nœuds

 

Module 8 : Installation et configuration de Hive, Impala et Pig

  • Hive
  • Impala
  • Pig

 

Module 9 : Clients Hadoop incluant Hue

  • Les clients Hadoop 
  • Installation et configuration des clients Hadoop
  • Installation et configuration de Hue
  • Authentification et autorisation de Hue

 

Module 10 : Configuration avancée du cluster

  • Paramètres de configurations avancés
  • Configuration des ports Hadoop
  • Data locality : Configuration de HDFS 
  • Configuration de la haute disponibilité HDFS

 

Module 11 : Sécurité Hadoop

  • Concepts du système de sécurité Hadoop
  • Qu'est ce que Kerberos et comment ça marche ?
  • Sécurisation d'un cluster Hadoop avec Kerberos
  • Autres concepts de sécurité

 

Module 12 : Gestion des ressources

  • Configuration des cgroups 
  • Le Fair Scheduler
  • Configuration du Dynamique Resource Pools
  • Configuration de la RAM et CPU pour YARN
  • Gestion des requêtes Impala

Objectifs de la formation

  • Poser les bases des clusters Hadoop : choix du matériel, configuration des noeuds
  • Configurer, déployer et gérer des Clusters : utiliser "Cloudera Manager for Easy Installation", "Configuration Management Tools" 
  • Ajout et suppression des noeuds, rebalancing et optimisation d'un cluster.
  • Gestion des ressources : Le "FIFO Scheduler", Le "FairScheduler"
  • Gérer les "Log files" d'Hadoop
  • Utiliser le "NameNode" et "Job Tracker Web UI"
  • Troubleshooting
  • Comment « Benchmarker » son cluster dans le temps
  • Poser les bases de l'environnement Hadoop et HDFS

Public visé

  • Administrateurs systèmes et toutes personnes qui gèrent et maintiennent les clusters Apache Hadoop en production ou qui évoluent dans un environnement de développement.

Prérequis

  • Avoir une expérience dans l'administration système Linux.
  • Aucune expérience avec Hadoop n'est nécessaire

Modalités pédagogiques

Inter-Entreprises

Intra-Entreprises et sur-mesure

Moyens et supports pédagogiques

Salle de formation équipée :

- un poste informatique par apprenant

- un bloc-notes + stylo

- un support de cours

- un espace de partage en ligne

- un vidéoprojecteur

- un tableau blanc

- connexion Internet

Modalités d'évaluation et de suivi

Questionnaire en ligne permettant l'évaluation des pré-requis.

Questionnaire de satisfaction de fin de stage.

M'inscrire à la formation

Ajouter au panier

Prochaines Sessions

  • Pour connaître les dates des prochaines sessions de formation inter-entreprises, veuillez nous contacter par téléphone au 05 61 34 39 80 ou par courriel à l'adresse contact@iform.fr

Partager cette formation

Catalogue de formation propulsé par Dendreo,
ERP spécialisé pour les OF