SlideShare uma empresa Scribd logo
1 de 18
Intégration de données avec
    les ETL open sources
               Présenté par :
               Horacio LASSEY-ASSIAKOLEY
               Twitter : @horalass



                                           1
Agenda

Contexte
Qu’est ce qu’un ETL
Avantages des ETL
Inconvenients des ETL
Présentation de Talend Open Source
Critères de sélection des ETL
Démo : création de job Talend
Conclusion


                                      2
Contexte (1/3)
      • Les systèmes de production sont
         pas intégrés. Il faut s’assurer que
         les données soit disponibles
         dans tous les systèmes.
      • Les administrateurs définissent
         des routines manuellement pour
         synchroniser les données
      • Ces routines sont difficiles à
         maintenir si elles sont
         programmées

                                        3
Contexte (2/3)




• Les systèmes décisionnelles et de production sont
  séparées.
• Il faut des routines qui alimentent les sources de
  données décisionnelles.
                                                       4
Contexte (3/3)
• Ces routines doivent être automatiques et alimentent
  le système décisionnel de façon quotidienne ( de
  préférence la nuit pour que les rapports soient
  disponible le lendemain matin pour les décideurs)




                                                         5
Qu’est ce qu’un ETL
• ETL est l’acronyme de Extract Transform Load. Un ETL
  combine en elle seule trois fonctionnalités : extraction
  depuis une source de données , la transformation des
  données issues de l’étape précédente et enfin le load
  (chargement) dans une nouvelle source de données.
• On utilise les ETL pour les projets d’intégration de
  données (structure BI), de synchronisation de sources de
  données, migration de données etc…



                                                        6
Avantages des ETL
• Dans un environnement décisionnel une partie des
  besoins ne survient qu’après la mise en production. Il
  faut pouvoir adapter rapidement son code ETL au
  nouveau des utilisateurs tout en gardant une bonne
  qualité du code
• Nécessité de transformer certains données
  opérationnelles sans avoir à programmer.
• Il faut pouvoir stocker les metadatas des transformations
• La plupart des solutions ETL propose des exécutions en
  parallèle et du multi-threading ce qui les rend plus
  performants qu’un code simple
                                                              7
Avantages des ETL (suite)
• Accès à des sources de données très diversifiées et
  intégration des fonctions de filtre, agrégation etc.
• Gestion centralisée des metadata
• Utilisation d’interface graphique conviviale pour
  exécuter les tâches ETL




                                                         8
Inconvénient d’un ETL
• Il faut apprendre un nouvel outil ou concept. Cela
  peut dérouter un programmeur classique
• Il y’a un temps d’apprentissage donc un temps
  d’adaption




                                                       9
Présentation de Talend
                Open Studio
•   TOS est un ETL de la société Talend
•   C’est un projet open source
•   C’est une application Eclipse plateforme
•   Première version en 2005
•   C’est un ETL générateur de code (Java, Perl )




                                                    10
Présentation de Talend
Open Studio ( suite )




                         11
Critère de sélection d’un
                ETL
• Type d’ETL : code generator, database-
  embedded, engine based
• Connecteur natif : SAP, salesforce, XML, etc
• Les temps d’exécution.
• Type de déclencheur ( temps réel , sur évènement
  , batch)




                                                     12
Démo
Job step1 ( Présentation )




                             13
Démo
Job step2 ( Mappage des données )




                                    14
Démo
Job step3 ( Orchestration et gestion de flow)




                                                15
Démo
Job step4 ( gestion des erreurs et deploiement)




                                                  16
Conclusion
Le choix d’un etl est très influencé par le projet que l’on
 fait et le contexte
Mais pour faire son choix il faut tenir compte :
    Connecteurs natifs
    du temps de traitements
    du type d’etl ( générateur de code, moteur de
     transformation, etc)
    du type de déclencheur
Il existe plusieurs ETL open source : Talend , Pentaho data
 Integration etc pour s’essayer et faire la preuve du
 concept
                                                           17
Références
www.talend.com pour vos prémiers pas
The Data Warehouse ETL Toolkit, Ralph Kimball & Joe
 Caserta ( pour toute la théorie des ETL en
 environnement décisionnel)
www.horalass.blogspot.com ( mon blog où je donne
 quelques conseils d’utilisation de Talend )




                                                  18

Mais conteúdo relacionado

Mais procurados

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelFrédéric FAURE
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehousenzuguem
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsJean-Marc Dupont
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olapCynapsys It Hotspot
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Sql Loader
Sql LoaderSql Loader
Sql Loaderreda
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesJean-Marc Dupont
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2Amal Abid
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008Abdelouahed Abdou
 

Mais procurados (20)

Système Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et OpérationnelSystème Information - ETL et EAI - Décisionnel et Opérationnel
Système Information - ETL et EAI - Décisionnel et Opérationnel
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Resume de BI
Resume de BIResume de BI
Resume de BI
 
Bi
BiBi
Bi
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Projet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoinsProjet BI - 1 - Analyse des besoins
Projet BI - 1 - Analyse des besoins
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Présentation data warehouse etl et olap
Présentation data warehouse etl et olapPrésentation data warehouse etl et olap
Présentation data warehouse etl et olap
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Bddwdm
BddwdmBddwdm
Bddwdm
 
Sql Loader
Sql LoaderSql Loader
Sql Loader
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Projet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des donnéesProjet Bi - 3 - Alimentation des données
Projet Bi - 3 - Alimentation des données
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
 
Data warehouse
Data warehouseData warehouse
Data warehouse
 
MongoDB.pptx
MongoDB.pptxMongoDB.pptx
MongoDB.pptx
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008
 

Destaque

Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.arnaudm
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...Jean-Pierre Riehl
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPTriyadadva
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...HAFID Ait Bihi
 
Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLICedric CARBONE
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réelSmile I.T is open
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultantAlphorm
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQLAlphorm
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationAlphorm
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)Alphorm
 

Destaque (20)

Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.Business Intelligence : Transformer les données en information.
Business Intelligence : Transformer les données en information.
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Rapport De PFE
Rapport De PFERapport De PFE
Rapport De PFE
 
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...
 
PFE BI - INPT
PFE BI - INPTPFE BI - INPT
PFE BI - INPT
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Td dw1
Td dw1Td dw1
Td dw1
 
Rapport Projet de fin d’études
Rapport Projet de fin d’étudesRapport Projet de fin d’études
Rapport Projet de fin d’études
 
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
 
Petit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLIPetit Déjeuner Talend/SQLI
Petit Déjeuner Talend/SQLI
 
Certificate Talend
Certificate TalendCertificate Talend
Certificate Talend
 
Rapport PFE
Rapport PFERapport PFE
Rapport PFE
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
Webinar Smile et Talend  : Faites communiquer vos applications en temps réelWebinar Smile et Talend  : Faites communiquer vos applications en temps réel
Webinar Smile et Talend : Faites communiquer vos applications en temps réel
 
Guide talend
Guide talendGuide talend
Guide talend
 
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultantAlphorm.com Formation  RDS Windows Server 2008 R2 - Guide du consultant
Alphorm.com Formation RDS Windows Server 2008 R2 - Guide du consultant
 
Alphorm.com Formation le langage SQL
Alphorm.com  Formation le langage SQLAlphorm.com  Formation le langage SQL
Alphorm.com Formation le langage SQL
 
Alphorm.com formation-GNS3
Alphorm.com formation-GNS3Alphorm.com formation-GNS3
Alphorm.com formation-GNS3
 
alphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administrationalphorm.com - Formation PostgreSQL administration
alphorm.com - Formation PostgreSQL administration
 
alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)alphorm.com - Formation SQL Server 2012 (70-462)
alphorm.com - Formation SQL Server 2012 (70-462)
 

Semelhante a Integration de donnees_etl

Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...CERTyou Formation
 
Switch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frSwitch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frAlfresco Software
 
Talei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-basesTalei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-basesCERTyou Formation
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
Petit DéJeuner Industrialisation 13 10 2011 Eurosites
Petit DéJeuner Industrialisation 13 10 2011 EurositesPetit DéJeuner Industrialisation 13 10 2011 Eurosites
Petit DéJeuner Industrialisation 13 10 2011 EurositesHervé Leclerc
 
Talea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnementTalea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnementCERTyou Formation
 
Perfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptxPerfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptxMarc Bojoly
 
Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Elapse Technologies
 
Comparaison de outils mda
Comparaison de outils mdaComparaison de outils mda
Comparaison de outils mdaShili Mohamed
 
Cas integration open_erp
Cas integration open_erpCas integration open_erp
Cas integration open_erpJoubi Aaziz
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneCedric CARBONE
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs Microsoft
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessingPierre-Marie Brunet
 
Versionning et travail en équipe avec Salesforce - 27/11/2014
Versionning et travail en équipe avec Salesforce - 27/11/2014Versionning et travail en équipe avec Salesforce - 27/11/2014
Versionning et travail en équipe avec Salesforce - 27/11/2014Paris Salesforce Developer Group
 
Deep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerDeep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerMicrosoft
 
Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?pprem
 

Semelhante a Integration de donnees_etl (20)

Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
Taleb formation-talend-open-studio-data-integration-les-bases-et-perfectionne...
 
Switch to alfresco with 1 genia fr
Switch to alfresco with 1 genia frSwitch to alfresco with 1 genia fr
Switch to alfresco with 1 genia fr
 
Talei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-basesTalei formation-talend-open-studio-data-integration-les-bases
Talei formation-talend-open-studio-data-integration-les-bases
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
Petit DéJeuner Industrialisation 13 10 2011 Eurosites
Petit DéJeuner Industrialisation 13 10 2011 EurositesPetit DéJeuner Industrialisation 13 10 2011 Eurosites
Petit DéJeuner Industrialisation 13 10 2011 Eurosites
 
Talea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnementTalea formation-talend-open-studio-data-integration-perfectionnement
Talea formation-talend-open-studio-data-integration-perfectionnement
 
Perfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptxPerfug BOF devoxx2017.pptx
Perfug BOF devoxx2017.pptx
 
Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29Retour d'expérience TAA - 2011/03/29
Retour d'expérience TAA - 2011/03/29
 
FinistJUG - Apache TomEE
FinistJUG - Apache TomEEFinistJUG - Apache TomEE
FinistJUG - Apache TomEE
 
Comparaison de outils mda
Comparaison de outils mdaComparaison de outils mda
Comparaison de outils mda
 
Cas integration open_erp
Cas integration open_erpCas integration open_erp
Cas integration open_erp
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing
 
Présentation LO-Cockpit , SAP
Présentation LO-Cockpit , SAPPrésentation LO-Cockpit , SAP
Présentation LO-Cockpit , SAP
 
Versionning et travail en équipe avec Salesforce - 27/11/2014
Versionning et travail en équipe avec Salesforce - 27/11/2014Versionning et travail en équipe avec Salesforce - 27/11/2014
Versionning et travail en équipe avec Salesforce - 27/11/2014
 
Deep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL ServerDeep Dive Performance , le In-Memory dans SQL Server
Deep Dive Performance , le In-Memory dans SQL Server
 
Usine Logicielle 2013
Usine Logicielle 2013Usine Logicielle 2013
Usine Logicielle 2013
 
Parc info
Parc infoParc info
Parc info
 
Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?
 

Integration de donnees_etl

  • 1. Intégration de données avec les ETL open sources Présenté par : Horacio LASSEY-ASSIAKOLEY Twitter : @horalass 1
  • 2. Agenda Contexte Qu’est ce qu’un ETL Avantages des ETL Inconvenients des ETL Présentation de Talend Open Source Critères de sélection des ETL Démo : création de job Talend Conclusion 2
  • 3. Contexte (1/3) • Les systèmes de production sont pas intégrés. Il faut s’assurer que les données soit disponibles dans tous les systèmes. • Les administrateurs définissent des routines manuellement pour synchroniser les données • Ces routines sont difficiles à maintenir si elles sont programmées 3
  • 4. Contexte (2/3) • Les systèmes décisionnelles et de production sont séparées. • Il faut des routines qui alimentent les sources de données décisionnelles. 4
  • 5. Contexte (3/3) • Ces routines doivent être automatiques et alimentent le système décisionnel de façon quotidienne ( de préférence la nuit pour que les rapports soient disponible le lendemain matin pour les décideurs) 5
  • 6. Qu’est ce qu’un ETL • ETL est l’acronyme de Extract Transform Load. Un ETL combine en elle seule trois fonctionnalités : extraction depuis une source de données , la transformation des données issues de l’étape précédente et enfin le load (chargement) dans une nouvelle source de données. • On utilise les ETL pour les projets d’intégration de données (structure BI), de synchronisation de sources de données, migration de données etc… 6
  • 7. Avantages des ETL • Dans un environnement décisionnel une partie des besoins ne survient qu’après la mise en production. Il faut pouvoir adapter rapidement son code ETL au nouveau des utilisateurs tout en gardant une bonne qualité du code • Nécessité de transformer certains données opérationnelles sans avoir à programmer. • Il faut pouvoir stocker les metadatas des transformations • La plupart des solutions ETL propose des exécutions en parallèle et du multi-threading ce qui les rend plus performants qu’un code simple 7
  • 8. Avantages des ETL (suite) • Accès à des sources de données très diversifiées et intégration des fonctions de filtre, agrégation etc. • Gestion centralisée des metadata • Utilisation d’interface graphique conviviale pour exécuter les tâches ETL 8
  • 9. Inconvénient d’un ETL • Il faut apprendre un nouvel outil ou concept. Cela peut dérouter un programmeur classique • Il y’a un temps d’apprentissage donc un temps d’adaption 9
  • 10. Présentation de Talend Open Studio • TOS est un ETL de la société Talend • C’est un projet open source • C’est une application Eclipse plateforme • Première version en 2005 • C’est un ETL générateur de code (Java, Perl ) 10
  • 11. Présentation de Talend Open Studio ( suite ) 11
  • 12. Critère de sélection d’un ETL • Type d’ETL : code generator, database- embedded, engine based • Connecteur natif : SAP, salesforce, XML, etc • Les temps d’exécution. • Type de déclencheur ( temps réel , sur évènement , batch) 12
  • 13. Démo Job step1 ( Présentation ) 13
  • 14. Démo Job step2 ( Mappage des données ) 14
  • 15. Démo Job step3 ( Orchestration et gestion de flow) 15
  • 16. Démo Job step4 ( gestion des erreurs et deploiement) 16
  • 17. Conclusion Le choix d’un etl est très influencé par le projet que l’on fait et le contexte Mais pour faire son choix il faut tenir compte :  Connecteurs natifs  du temps de traitements  du type d’etl ( générateur de code, moteur de transformation, etc)  du type de déclencheur Il existe plusieurs ETL open source : Talend , Pentaho data Integration etc pour s’essayer et faire la preuve du concept 17
  • 18. Références www.talend.com pour vos prémiers pas The Data Warehouse ETL Toolkit, Ralph Kimball & Joe Caserta ( pour toute la théorie des ETL en environnement décisionnel) www.horalass.blogspot.com ( mon blog où je donne quelques conseils d’utilisation de Talend ) 18