SlideShare uma empresa Scribd logo
1 de 2
Baixar para ler offline
CERTYOU, 37 rue des Mathurins, 75008 PARIS - SAS au capital de 10 000 Euros
Tél : 01 42 93 52 72 - Fax : 01 70 72 02 72 - contact@certyou.com - www.certyou.com
RCS de Paris n° 804 509 461- TVA intracommunautaire FR03 804509461 - APE 8559A
Déclaration d’activité enregistrée sous le N° 11 75 52524 75 auprès du préfet de région d’Ile-de-France
Cloudera Developer Training for Apache Hadoop
Formation Informatique / Virtualisation et Cloud / Cloudera
Cette formation officielle Cloudera Developer Training for Apache Hadoop permet d'acquérir les concepts clés et l'expertise
pour créer des applications de traitement de données solides avec Apache Hadoop.
De la mise en œuvre du Workflow au travail avec les APIs via l'écriture du code MapReduce et de l'exécution des jointures,
la formation Cloudera est la meilleure préparation pour aborder les cas concrets rencontrés par les développeurs Hadoop.
Cette formation prépare en partie à la certification CCDH (Cloudera Certified Developer for Apache Hadoop).
OBJECTIFS
• MapReduce et HDFS. Comment écrire le code mapReduce
• Meilleures pratiques pour le développement et le débogage de Hadoop et la mise en œuvre des Workflows et des
algorithmes courants
• Comment utiliser efficacement les autres projets tels que Hive, Pig, Sqoop, Flume, Oozie, Mahout et les autres projets
Hadoop
• Configuration matérielle optimale et besoins réseaux pour l'intégration d'un cluster Hadoop dans le data center
• Ecrire et exécuter les jointures pour lier les sets de données dans MapReduce
• Problèmes à prendre en compte dans le développement de travaux Mapreduce
• Sujets avancés Hadoop nécessaires pour l'analyse des données en temps réel
PUBLIC
Cette formation s'adresse aux développeurs et ingénieurs ayant une expérience en programmation. Des connaissances en
Java sont fortement recommandées et sont nécessaires pour compléter les exercices pratiques.
PRE-REQUIS
Une expérience en programmation est souhaitable (Java de préférence).
PROGRAMME
Pourquoi choisir Hadoop ?
Problèmes avec les systèmes traditionnels à grande échelle
Introduction à Hadoop
Problèmes liés à Hadoop
Hadoop : Concepts de base et HDFS
Projet Hadoop
Composants Hadoop
HDFS (Hadoop Distributed File System)
Introduction à MapReduce
Vue d'ensemble de MapReduce
Exemple: Wordcount
«Mappers»
«Reducers»
Clusters Hadoop et Ecosystème Hadoop
Vue d'ensemble du cluster Hadoop
Jobs Hadoop et tâches
Autres composants de l'écosystème Hadoop
Ecriture d'un programme MapReduce dans java
Concepts de base API MapReduce
Ecrire des drivers, des «mappers» et des «reducers» dans Java
Accélérer le développement Hadoop avec Eclipse
Différences entre les nouveaux et les anciens APIs MapReduce
Ecriture d'un programme MapReduce dans Streaming
Ecrire des «Mappers» et des «Reducers» avec le streaming API
Tests des programmes MapReduce
Test
Frameworks de tests JUnit et MRUnit
Ecrire des tests avec MRUnit
Activer les tests
Approfondir les APIs Hadoop
A retenir
Durée : 4 jours soit 28h.
Réf. CY3902
Dates des sessions
Paris
07/04/2015
12/10/2015
Cette
formation est
également
proposée en
formule
INTRA-ENTREPRISE.
Inclus dans cette formation
EXAMEN Cloudera COMPRIS
DANS LE TARIF
Pour toutes nos formations
certifiantes, nous incluons les frais de
certification dans le tarif de la
formation. Comparez bien les offres
de formation du marché : notre offre
étant la plus complète, vous serez
alors plus serein dans la préparation
de vos certifications.
Coaching Après-COURS
Pendant 30 jours, votre formateur
CERTYOU, 37 rue des Mathurins, 75008 PARIS - SAS au capital de 10 000 Euros
Tél : 01 42 93 52 72 - Fax : 01 70 72 02 72 - contact@certyou.com - www.certyou.com
RCS de Paris n° 804 509 461- TVA intracommunautaire FR03 804509461 - APE 8559A
Déclaration d’activité enregistrée sous le N° 11 75 52524 75 auprès du préfet de région d’Ile-de-France
Cloudera Developer Training for Apache Hadoop
Formation Informatique / Virtualisation et Cloud / Cloudera
Utiliser la classe ToolRunner
Installer et «démonter» les «Mappers» et les «Reducers»
Diminution de la quantité de données intermédiaires avec les multiplexeurs
Accès à la programmation HDFS
Utiliser le cache distribué
Utiliser la bibliothèque de «Mappers», des «Reducers» et des «Partitioners» des APIs Hadoop
Sujets pratiques de développement et techniques
Stratégies de débugging du code MapRecuce
Tester le code MapReduce localement avec LocalJobRunner
Récupérer les informations avec les compteurs
Réutiliser des objets
Travaux de Map-only MapReduce
Partitionneurs et «Reducers»
Comment les partitionneurs et les «Reducers» travaillent ensemble
Déterminer le nombre optimal de «Reducers» pour un job
Ecrire les partitionneurs clients
Données en entrée et en sortie
Créer des mises en œuvre personnalisées «writable» et «writable-comparable»
Sauvegarder des données binaires avec SequenceFile et les fichiers de données Avro
Quand savoir qu'il faut utiliser la compression des fichiers?
Mettre en œuvre les formats d'entrée et les formats de sortie personnalisés
Algorithmes courants MapReduce
Trier et rechercher un ensemble de données important
Indexer les données
Fréquence des termes
Fréquence de documents inverses
Co-occurrence Word
Améliorer le tri secondaire
Jointure de de données dans les jobs MapReduce
Ecrire une une jointure «Map-Side»
Réduire les jointures
Intégration de Hadoop dans le Workflow de l'entreprise
Intégrer Hadoop dans une entreprise existante
Charger des données d'un RDBMS dans HDFS avec Sqoop
Gérer les données en temps rééel avec Flume
Accéder à HDFS à partir des systèmes légaux avec FuseDFS et HttpFS
Introduction à Hive, Imapala et Pig
Pourquoi Hive, Impala et Pig?
Vue d'ensemble de Hive
Vue d'ensemble de Impala
Vue d'ensemble de Pig
Choisir entre Hive, Impala et Pig
Introduction à Oozie
Introduction à Oozie
Créer des Workflows Oozie
sera disponible pour vous aider.
CERTyou s'engage dans la réalisation
de vos objectifs.
Votre garantie 100%
SATISFACTION
Notre engagement 100% satisfaction
vous garantit la plus grande qualité
de formation.

Mais conteúdo relacionado

Semelhante a Cy3902 formation-cloudera-developer-training-for-apache-hadoop

TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureTIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureThe Incredible Automation Day
 
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows AzureBig Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows AzureMicrosoft
 
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopCasablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopBenoît de CHATEAUVIEUX
 
Aqui hadoop draft
Aqui hadoop draftAqui hadoop draft
Aqui hadoop draftEric Papet
 
SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …
SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …
SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …GUSS
 
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !OCTO Technology
 
Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...
Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...
Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...Hadjer BENHADJ DJILALI
 
Annexe Big Data
Annexe Big DataAnnexe Big Data
Annexe Big DataAmal Abid
 
Vplstpfr formation-visualage-pacbase-son-langage-de-programmation
Vplstpfr formation-visualage-pacbase-son-langage-de-programmationVplstpfr formation-visualage-pacbase-son-langage-de-programmation
Vplstpfr formation-visualage-pacbase-son-langage-de-programmationCERTyou Formation
 
PHP dans le cloud
PHP dans le cloudPHP dans le cloud
PHP dans le cloudMicrosoft
 
SQL Saturday 323 Paris 2014 - HDInsight
SQL Saturday 323 Paris 2014 - HDInsightSQL Saturday 323 Paris 2014 - HDInsight
SQL Saturday 323 Paris 2014 - HDInsightRomain Casteres
 
GTUG Nantes (Dec 2011) - BigTable et NoSQL
GTUG Nantes (Dec 2011) - BigTable et NoSQLGTUG Nantes (Dec 2011) - BigTable et NoSQL
GTUG Nantes (Dec 2011) - BigTable et NoSQLMichaël Figuière
 
Gtug nantes big table et nosql
Gtug nantes   big table et nosqlGtug nantes   big table et nosql
Gtug nantes big table et nosqlGDG Nantes
 
Alter way-wordcamp-paris-2014
Alter way-wordcamp-paris-2014Alter way-wordcamp-paris-2014
Alter way-wordcamp-paris-2014ALTER WAY
 
Sahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackSahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackALTIC Altic
 
SQL Saturday Paris 2015 - Polybase
SQL Saturday Paris 2015 - PolybaseSQL Saturday Paris 2015 - Polybase
SQL Saturday Paris 2015 - PolybaseRomain Casteres
 
2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...
2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...
2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...Club Alliances
 

Semelhante a Cy3902 formation-cloudera-developer-training-for-apache-hadoop (20)

TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureTIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
 
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows AzureBig Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
 
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopCasablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
 
Aqui hadoop draft
Aqui hadoop draftAqui hadoop draft
Aqui hadoop draft
 
SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …
SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …
SQLSaturday Paris 2014 - HDInsight : Cas d’usages, Hive, Sqoop, Pig, …
 
NoSQL et Big Data
NoSQL et Big DataNoSQL et Big Data
NoSQL et Big Data
 
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
 
Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...
Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...
Parallélisation d'algorithmes de graphes avec MapReduce sur un cluster d'ordi...
 
Annexe Big Data
Annexe Big DataAnnexe Big Data
Annexe Big Data
 
Vplstpfr formation-visualage-pacbase-son-langage-de-programmation
Vplstpfr formation-visualage-pacbase-son-langage-de-programmationVplstpfr formation-visualage-pacbase-son-langage-de-programmation
Vplstpfr formation-visualage-pacbase-son-langage-de-programmation
 
Php dans le cloud
Php dans le cloudPhp dans le cloud
Php dans le cloud
 
PHP dans le cloud
PHP dans le cloudPHP dans le cloud
PHP dans le cloud
 
SQL Saturday 323 Paris 2014 - HDInsight
SQL Saturday 323 Paris 2014 - HDInsightSQL Saturday 323 Paris 2014 - HDInsight
SQL Saturday 323 Paris 2014 - HDInsight
 
Hadoop
HadoopHadoop
Hadoop
 
GTUG Nantes (Dec 2011) - BigTable et NoSQL
GTUG Nantes (Dec 2011) - BigTable et NoSQLGTUG Nantes (Dec 2011) - BigTable et NoSQL
GTUG Nantes (Dec 2011) - BigTable et NoSQL
 
Gtug nantes big table et nosql
Gtug nantes   big table et nosqlGtug nantes   big table et nosql
Gtug nantes big table et nosql
 
Alter way-wordcamp-paris-2014
Alter way-wordcamp-paris-2014Alter way-wordcamp-paris-2014
Alter way-wordcamp-paris-2014
 
Sahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackSahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStack
 
SQL Saturday Paris 2015 - Polybase
SQL Saturday Paris 2015 - PolybaseSQL Saturday Paris 2015 - Polybase
SQL Saturday Paris 2015 - Polybase
 
2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...
2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...
2011.11.22 - Editeurs, concrétisez votre Offre SaaS avec Aspaway - 8ème Forum...
 

Mais de CERTyou Formation

Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10
Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10
Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10CERTyou Formation
 
Zz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-edition
Zz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-editionZz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-edition
Zz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-editionCERTyou Formation
 
Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...
Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...
Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...CERTyou Formation
 
Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...
Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...
Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...CERTyou Formation
 
Zv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linux
Zv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linuxZv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linux
Zv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linuxCERTyou Formation
 
Zv02 g formation-z-vm-introduction-et-concepts
Zv02 g formation-z-vm-introduction-et-conceptsZv02 g formation-z-vm-introduction-et-concepts
Zv02 g formation-z-vm-introduction-et-conceptsCERTyou Formation
 
Zop04 formation-zope-les-bases-et-perfectionnement
Zop04 formation-zope-les-bases-et-perfectionnementZop04 formation-zope-les-bases-et-perfectionnement
Zop04 formation-zope-les-bases-et-perfectionnementCERTyou Formation
 
Zop03 formation-zope-les-bases
Zop03 formation-zope-les-basesZop03 formation-zope-les-bases
Zop03 formation-zope-les-basesCERTyou Formation
 
Zop01 formation-zope-perfectionnement
Zop01 formation-zope-perfectionnementZop01 formation-zope-perfectionnement
Zop01 formation-zope-perfectionnementCERTyou Formation
 
Zl10 g formation-implementation-linux-pour-system-z-suse
Zl10 g formation-implementation-linux-pour-system-z-suseZl10 g formation-implementation-linux-pour-system-z-suse
Zl10 g formation-implementation-linux-pour-system-z-suseCERTyou Formation
 
Zl00 g formation-bootcamp-z-vm-et-linux
Zl00 g formation-bootcamp-z-vm-et-linuxZl00 g formation-bootcamp-z-vm-et-linux
Zl00 g formation-bootcamp-z-vm-et-linuxCERTyou Formation
 
Zen06 formation-zend-framework-2-les-bases-et-perfectionnement
Zen06 formation-zend-framework-2-les-bases-et-perfectionnementZen06 formation-zend-framework-2-les-bases-et-perfectionnement
Zen06 formation-zend-framework-2-les-bases-et-perfectionnementCERTyou Formation
 
Zen05 formation-zend-framework-2-les-bases
Zen05 formation-zend-framework-2-les-basesZen05 formation-zend-framework-2-les-bases
Zen05 formation-zend-framework-2-les-basesCERTyou Formation
 
Zen04 formation-zend-framework-2-perfectionnement
Zen04 formation-zend-framework-2-perfectionnementZen04 formation-zend-framework-2-perfectionnement
Zen04 formation-zend-framework-2-perfectionnementCERTyou Formation
 
Zen03 formation-zend-framework-1-les-bases-et-perfectionnement
Zen03 formation-zend-framework-1-les-bases-et-perfectionnementZen03 formation-zend-framework-1-les-bases-et-perfectionnement
Zen03 formation-zend-framework-1-les-bases-et-perfectionnementCERTyou Formation
 
Zen02 formation-zend-framework-1-les-bases
Zen02 formation-zend-framework-1-les-basesZen02 formation-zend-framework-1-les-bases
Zen02 formation-zend-framework-1-les-basesCERTyou Formation
 
Zen01 formation-zend-framework-1-perfectionnement
Zen01 formation-zend-framework-1-perfectionnementZen01 formation-zend-framework-1-perfectionnement
Zen01 formation-zend-framework-1-perfectionnementCERTyou Formation
 
Zabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructureZabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructureCERTyou Formation
 

Mais de CERTyou Formation (20)

Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10
Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10
Zz670 g formation-ibm-infosphere-mdm-reference-data-management-v10
 
Zz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-edition
Zz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-editionZz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-edition
Zz640 g formation-ibm-personnaliser-infosphere-mdm-advanced-edition
 
Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...
Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...
Zz620 g formation-ibm-concepts-d-architecture-et-modele-de-donnees-pour-infos...
 
Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...
Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...
Zv10 g formation-ibm-z-vm-et-linux-pour-zseries-connectivite-et-gestion-du-sy...
 
Zv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linux
Zv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linuxZv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linux
Zv06 g formation-ibm-z-vm-et-linux-pour-zseries-bases-vm-pour-linux
 
Zv02 g formation-z-vm-introduction-et-concepts
Zv02 g formation-z-vm-introduction-et-conceptsZv02 g formation-z-vm-introduction-et-concepts
Zv02 g formation-z-vm-introduction-et-concepts
 
Zop05 formation-zope-plone
Zop05 formation-zope-ploneZop05 formation-zope-plone
Zop05 formation-zope-plone
 
Zop04 formation-zope-les-bases-et-perfectionnement
Zop04 formation-zope-les-bases-et-perfectionnementZop04 formation-zope-les-bases-et-perfectionnement
Zop04 formation-zope-les-bases-et-perfectionnement
 
Zop03 formation-zope-les-bases
Zop03 formation-zope-les-basesZop03 formation-zope-les-bases
Zop03 formation-zope-les-bases
 
Zop02 formation-zope-cps
Zop02 formation-zope-cpsZop02 formation-zope-cps
Zop02 formation-zope-cps
 
Zop01 formation-zope-perfectionnement
Zop01 formation-zope-perfectionnementZop01 formation-zope-perfectionnement
Zop01 formation-zope-perfectionnement
 
Zl10 g formation-implementation-linux-pour-system-z-suse
Zl10 g formation-implementation-linux-pour-system-z-suseZl10 g formation-implementation-linux-pour-system-z-suse
Zl10 g formation-implementation-linux-pour-system-z-suse
 
Zl00 g formation-bootcamp-z-vm-et-linux
Zl00 g formation-bootcamp-z-vm-et-linuxZl00 g formation-bootcamp-z-vm-et-linux
Zl00 g formation-bootcamp-z-vm-et-linux
 
Zen06 formation-zend-framework-2-les-bases-et-perfectionnement
Zen06 formation-zend-framework-2-les-bases-et-perfectionnementZen06 formation-zend-framework-2-les-bases-et-perfectionnement
Zen06 formation-zend-framework-2-les-bases-et-perfectionnement
 
Zen05 formation-zend-framework-2-les-bases
Zen05 formation-zend-framework-2-les-basesZen05 formation-zend-framework-2-les-bases
Zen05 formation-zend-framework-2-les-bases
 
Zen04 formation-zend-framework-2-perfectionnement
Zen04 formation-zend-framework-2-perfectionnementZen04 formation-zend-framework-2-perfectionnement
Zen04 formation-zend-framework-2-perfectionnement
 
Zen03 formation-zend-framework-1-les-bases-et-perfectionnement
Zen03 formation-zend-framework-1-les-bases-et-perfectionnementZen03 formation-zend-framework-1-les-bases-et-perfectionnement
Zen03 formation-zend-framework-1-les-bases-et-perfectionnement
 
Zen02 formation-zend-framework-1-les-bases
Zen02 formation-zend-framework-1-les-basesZen02 formation-zend-framework-1-les-bases
Zen02 formation-zend-framework-1-les-bases
 
Zen01 formation-zend-framework-1-perfectionnement
Zen01 formation-zend-framework-1-perfectionnementZen01 formation-zend-framework-1-perfectionnement
Zen01 formation-zend-framework-1-perfectionnement
 
Zabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructureZabix formation-zabbix-supervision-d-infrastructure
Zabix formation-zabbix-supervision-d-infrastructure
 

Cy3902 formation-cloudera-developer-training-for-apache-hadoop

  • 1. CERTYOU, 37 rue des Mathurins, 75008 PARIS - SAS au capital de 10 000 Euros Tél : 01 42 93 52 72 - Fax : 01 70 72 02 72 - contact@certyou.com - www.certyou.com RCS de Paris n° 804 509 461- TVA intracommunautaire FR03 804509461 - APE 8559A Déclaration d’activité enregistrée sous le N° 11 75 52524 75 auprès du préfet de région d’Ile-de-France Cloudera Developer Training for Apache Hadoop Formation Informatique / Virtualisation et Cloud / Cloudera Cette formation officielle Cloudera Developer Training for Apache Hadoop permet d'acquérir les concepts clés et l'expertise pour créer des applications de traitement de données solides avec Apache Hadoop. De la mise en œuvre du Workflow au travail avec les APIs via l'écriture du code MapReduce et de l'exécution des jointures, la formation Cloudera est la meilleure préparation pour aborder les cas concrets rencontrés par les développeurs Hadoop. Cette formation prépare en partie à la certification CCDH (Cloudera Certified Developer for Apache Hadoop). OBJECTIFS • MapReduce et HDFS. Comment écrire le code mapReduce • Meilleures pratiques pour le développement et le débogage de Hadoop et la mise en œuvre des Workflows et des algorithmes courants • Comment utiliser efficacement les autres projets tels que Hive, Pig, Sqoop, Flume, Oozie, Mahout et les autres projets Hadoop • Configuration matérielle optimale et besoins réseaux pour l'intégration d'un cluster Hadoop dans le data center • Ecrire et exécuter les jointures pour lier les sets de données dans MapReduce • Problèmes à prendre en compte dans le développement de travaux Mapreduce • Sujets avancés Hadoop nécessaires pour l'analyse des données en temps réel PUBLIC Cette formation s'adresse aux développeurs et ingénieurs ayant une expérience en programmation. Des connaissances en Java sont fortement recommandées et sont nécessaires pour compléter les exercices pratiques. PRE-REQUIS Une expérience en programmation est souhaitable (Java de préférence). PROGRAMME Pourquoi choisir Hadoop ? Problèmes avec les systèmes traditionnels à grande échelle Introduction à Hadoop Problèmes liés à Hadoop Hadoop : Concepts de base et HDFS Projet Hadoop Composants Hadoop HDFS (Hadoop Distributed File System) Introduction à MapReduce Vue d'ensemble de MapReduce Exemple: Wordcount «Mappers» «Reducers» Clusters Hadoop et Ecosystème Hadoop Vue d'ensemble du cluster Hadoop Jobs Hadoop et tâches Autres composants de l'écosystème Hadoop Ecriture d'un programme MapReduce dans java Concepts de base API MapReduce Ecrire des drivers, des «mappers» et des «reducers» dans Java Accélérer le développement Hadoop avec Eclipse Différences entre les nouveaux et les anciens APIs MapReduce Ecriture d'un programme MapReduce dans Streaming Ecrire des «Mappers» et des «Reducers» avec le streaming API Tests des programmes MapReduce Test Frameworks de tests JUnit et MRUnit Ecrire des tests avec MRUnit Activer les tests Approfondir les APIs Hadoop A retenir Durée : 4 jours soit 28h. Réf. CY3902 Dates des sessions Paris 07/04/2015 12/10/2015 Cette formation est également proposée en formule INTRA-ENTREPRISE. Inclus dans cette formation EXAMEN Cloudera COMPRIS DANS LE TARIF Pour toutes nos formations certifiantes, nous incluons les frais de certification dans le tarif de la formation. Comparez bien les offres de formation du marché : notre offre étant la plus complète, vous serez alors plus serein dans la préparation de vos certifications. Coaching Après-COURS Pendant 30 jours, votre formateur
  • 2. CERTYOU, 37 rue des Mathurins, 75008 PARIS - SAS au capital de 10 000 Euros Tél : 01 42 93 52 72 - Fax : 01 70 72 02 72 - contact@certyou.com - www.certyou.com RCS de Paris n° 804 509 461- TVA intracommunautaire FR03 804509461 - APE 8559A Déclaration d’activité enregistrée sous le N° 11 75 52524 75 auprès du préfet de région d’Ile-de-France Cloudera Developer Training for Apache Hadoop Formation Informatique / Virtualisation et Cloud / Cloudera Utiliser la classe ToolRunner Installer et «démonter» les «Mappers» et les «Reducers» Diminution de la quantité de données intermédiaires avec les multiplexeurs Accès à la programmation HDFS Utiliser le cache distribué Utiliser la bibliothèque de «Mappers», des «Reducers» et des «Partitioners» des APIs Hadoop Sujets pratiques de développement et techniques Stratégies de débugging du code MapRecuce Tester le code MapReduce localement avec LocalJobRunner Récupérer les informations avec les compteurs Réutiliser des objets Travaux de Map-only MapReduce Partitionneurs et «Reducers» Comment les partitionneurs et les «Reducers» travaillent ensemble Déterminer le nombre optimal de «Reducers» pour un job Ecrire les partitionneurs clients Données en entrée et en sortie Créer des mises en œuvre personnalisées «writable» et «writable-comparable» Sauvegarder des données binaires avec SequenceFile et les fichiers de données Avro Quand savoir qu'il faut utiliser la compression des fichiers? Mettre en œuvre les formats d'entrée et les formats de sortie personnalisés Algorithmes courants MapReduce Trier et rechercher un ensemble de données important Indexer les données Fréquence des termes Fréquence de documents inverses Co-occurrence Word Améliorer le tri secondaire Jointure de de données dans les jobs MapReduce Ecrire une une jointure «Map-Side» Réduire les jointures Intégration de Hadoop dans le Workflow de l'entreprise Intégrer Hadoop dans une entreprise existante Charger des données d'un RDBMS dans HDFS avec Sqoop Gérer les données en temps rééel avec Flume Accéder à HDFS à partir des systèmes légaux avec FuseDFS et HttpFS Introduction à Hive, Imapala et Pig Pourquoi Hive, Impala et Pig? Vue d'ensemble de Hive Vue d'ensemble de Impala Vue d'ensemble de Pig Choisir entre Hive, Impala et Pig Introduction à Oozie Introduction à Oozie Créer des Workflows Oozie sera disponible pour vous aider. CERTyou s'engage dans la réalisation de vos objectifs. Votre garantie 100% SATISFACTION Notre engagement 100% satisfaction vous garantit la plus grande qualité de formation.