2. Enterprise Data Hub
La prochaine étape pour transformer la
Gestion des Données d’Entreprise
Aadel Benyoussef
Directeur – Excelerate Systems France
Aadel.Benyoussef@ExcelerateSystems.net
+33 (0)5 24 61 56 81 | +33 (0)6 07 73 18 61
3. En route vers l’Enterprise Data Hub
1
Déterminer
l’environnement
opérationnel
4. En route vers l’Enterprise Data Hub
1
2
Déterminer
l’environnement
opérationnel
Analyser un cas
d’usage
5. En route vers l’Enterprise Data Hub
1
2
3
Déterminer
l’environnement
opérationnel
Analyser un cas
d’usage
Identifier les
Compétences
7. BigData
Une puissante plate-forme BigData basée sur
Apache Hadoop
• Cloudera est le plus grand contributeur au projet
Hadoop
• CDH est la 1ère distribution Hadoop 100% Open Source
prête à l’emploi pour les entreprises.
• Intègre les projets les plus populaires liées à Hadoop
dans un package unique, testé rigoureusement et qui
garantit une fiabilité maximale lors de la mise en
production.
#Cloud #BigData #Security #Mobile
@ExcelSysFrance
ExcelerateSystemsFrance
9. Les avantages de l'Open Source au-delà de l’éthique,
il est question de :
1
Facilité d’Adoption
Acquisition et démonstration de la Valeur avec des investissements mesurées
10. Les avantages de l'Open Source au-delà de l’éthique,
il est question de :
1
Facilité d’Adoption
2
Innovation et Développement Rapide
Acquisition et démonstration de la Valeur avec des investissements mesurées
Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les
problèmes et Imaginer de nouveaux concepts
11. Les avantages de l'Open Source au-delà de l’éthique,
il est question de :
1
Facilité d’Adoption
2
Innovation et Développement Rapide
3
Extensibilité
Acquisition et démonstration de la Valeur avec des investissements mesurées
Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les
problèmes et Imaginer de nouveaux concepts
Un Standard Ouvert et indépendant des fournisseurs, ce qui encourage une large intégration de la technologie
12. Les avantages de l'Open Source au-delà de l’éthique,
il est question de :
1
Facilité d’Adoption
2
Innovation et Développement Rapide
3
Extensibilité
4
Pas de dépendance « Editeur »
Acquisition et démonstration de la Valeur avec des investissements mesurées
Développement communautaire: les meilleurs ingénieurs de beaucoup de sociétés Collaborent pour résoudre les
problèmes et Imaginer de nouveaux concepts
Un Standard Ouvert et indépendant des fournisseurs, ce qui encourage une large intégration de la technologie
Pas de données ou processus « propriétaires" – la sélection des fournisseurs uniquement sur la Qualité des Services
13. Quelle importance accordez vous, dans la sélection d’un
vendeur de BigData aux critères suivants:
évolutivité
performance
flexibilité
Fiabilité du vendeur
Technologie Sécurisée
Intégration avec d'autres systèmes
coût
Techniquement Supérieur aux autres
Logiciel Open Source
7
Source: King Research, 3922 Respondents
8
9
16. Quels sont les éléments qui déterminent votre choix de
fournisseur de solution BigData?
Richesse des Fonctionnalités
Support Technique
Recommandations
Services de Consulting
Formations
6
6,5
7
Source: King Research, 3922 Respondents
7,5
8
8,5
9
17. Quelles infrastructures pensez-vous améliorer avec des
solutions BigData ?
Traitements ETL
Bases de Données Analytiques
Stockage
Enterprise Data Warehouse
Système Central (Mainframe)
0%
Source: King Research, 3922 Respondents
20%
40%
60%
18. Quels sont les principaux avantages recherchés dans une
solutions BigData d’entreprise
Amélioration des Analyses de Données
Amélioration du Traitement de Données
Prendre de Meilleures Décisions, Plus Rapidement
Augmenter la Valeur marchande des Données
Améliorer l‘Efficacité Opérationnelle
Acquérir un Avantage Concurrentiel
10%
Source: King Research, 3922 Respondents
18
30%
50%
70%
19. Quelles sont vos principaux développements d’applications
BigData?
Recherche / Innovation
Analyse Comportementale
Connaissance des Clients
Ciblage de Marché
Analyse de l‘Expérience Client
Amélioration Opérationnelle
15%
Source: King Research, 3922 Respondents
25%
35%
45%
21. Retour sur le “Data Warehouse”
Applications
Applications
OLTP
Business
Intelligence
22. Retour sur le “Data Warehouse”
Applications
Applications
OLTP
Extract
Transform
Load
Query
Data
Warehouse
Transform
Business
Intelligence
23. Retour sur le “Data Warehouse”
Applications
Applications
OLTP
Extract
Transform
Load
Query
Data
Warehouse
Transform
Business
Intelligence
24. Retour sur le “Data Warehouse”
Applications
Applications
OLTP
Extract
Transform
Load
Query
Data
Warehouse
Transform
Business
Intelligence
Ce n’est pas une question de Logiciel mais d’Architecture
Généralement déployé sur un SGBD Relationnel
S.I centralisée = "Enterprise Data Warehouse"
25. Des changements considérables lors des 30 dernières années
+3 trillion Go de données créées en 2013…
Plus de 90% sont des données non structurées
500 quadrillion de fichiers
Evolution de la Donnée
Quantité double tous les 2 ans
1 Trillion = 1018, soit un milliard de milliards.
1 Quadrillion = 1024
Applications
Internet
Dispositifs connectés
Mobiles
M2M
Capteurs
…
Données Non-Structurées – 90%
Données Structurées – 10%
1980
2014
26. Défis communs dans les environnements DW
Applications
Applications
OLTP
Extract
Transform
Load
Query
Data
Warehouse
Transform
Business
Intelligence
27. Défis communs dans les environnements DW
1
Transformations de données est lentes, SLA manqué
Applications
Applications
OLTP
1
Extract
Transform
Load
1
Query
Data
Warehouse
Transform
Business
Intelligence
28. Défis communs dans les environnements DW
Applications
Applications
OLTP
1
2
1
Transformations de données est lentes, SLA manqué
Requêtes lentes, QoS dégradé et des opportunités
manquées.
Extract
Transform
Load
2
1
Query
Data
Warehouse
Transform
Business
Intelligence
29. Défis communs dans les environnements DW
Applications
Applications
OLTP
1
2
1
3
Transformations de données est lentes, SLA manqué
Requêtes lentes, QoS dégradé et des opportunités
manquées.
Extract
Transform
Load
2
1
Query
Data
Warehouse
Transform
Business
Intelligence
Nécessité d’Archivage pour économiser l’espace de stockage
Les données archivées ne peuvent pas fournir une valeur.
30. Défis communs dans les environnements DW
Applications
Applications
4
OLTP
1 Transformations de données est lentes, SLA manqué
Pression constante pourdégradé et de nouvelles
2 Requêtes lentes, QoS acheter des opportunités
manquées.
capacités de stockage et unités de calculs juste
pour maintenir la qualité de service actuel.
Extract
2 Query
1
Transform
Pas Loadplace pour
de
Data
Business
Warehouse
étendre les possibilités. Intelligence
1 Transform
Pas de place pour l’innovation.
3
Nécessité d’archiver.
Les données archivées ne peuvent pas fournir une valeur.
32. Plate-forme unique pour Stocker toutes les données
• Stockage +
BATCH
PROCESSING
WORKLOAD MANAGEMENT
STORAGE FOR ANY TYPE OF DATA
UNIFIED, ELASTIC, RESILIENT, SECURE
Filesystem
Online NoSQL
Traitement par
Lots
• HDFS + NoSQL
• Gestionnaire de
processus batch
33. Ouverture de l'entonnoir d‘Accès aux données
• Fournir de multiples
BATCH
PROCESSING
ANALYTIC
SQL
SEARCH
ENGINE
MACHINE
LEARNING
STREAM
PROCESSING
WORKLOAD MANAGEMENT
STORAGE FOR ANY TYPE OF DATA
UNIFIED, ELASTIC, RESILIENT, SECURE
Filesystem
Online NoSQL
formes d'accès aux
données
• S'appuyant sur les
niveaux de
compétences et les
investissements
existants
34. Prêt pour l'entreprise avec
la Sécurité et de la Supervision
ANALYTIC
SQL
SEARCH
ENGINE
MACHINE
LEARNING
STREAM
PROCESSING
WORKLOAD MANAGEMENT
3RD PARTY
APPS
DATA
MANAGEMENT
BATCH
PROCESSING
STORAGE FOR ANY TYPE OF DATA
Filesystem
Online NoSQL
SYSTEM
MANAGEMENT
UNIFIED, ELASTIC, RESILIENT, SECURE
• Sécurité
• Haute
disponibilité
avec
sauvegarde
automatique et
reprise après
sinistre
• La gestion du
système
35. Cloudera’s Enterprise Data Hub
CLOUDERA’S ENTERPRISE DATA HUB
ANALYTIC
SQL
SEARCH
ENGINE
MACHINE
LEARNING
STREAM
PROCESSING
WORKLOAD MANAGEMENT
3RD PARTY
APPS
DATA
MANAGEMENT
BATCH
PROCESSING
STORAGE FOR ANY TYPE OF DATA
Filesystem
Online NoSQL
SYSTEM
MANAGEMENT
UNIFIED, ELASTIC, RESILIENT, SECURE
1. Secure & Compliant
• Robust access controls
• Data encryption options
• Shared security policies
2. Enterprise Data Governance
• Meta data management
• Data lineage/tethering/pedigree
• Audit capabilities
3. Manageable
• One framework across all
components
• Extensible to 3rd party workloads
• Back-up, Disaster Recovery (BDR)
4. Open Architecture
• Open Source at core
• APIs & engines for multiple
workloads
• Support for best-of-breed
37. Solution Complète
CLOUDERA
UNIVERSITY
CLOUDERA’S ENTERPRISE DATA HUB
BATCH
PROCESSI
NG
ANALYTIC
SQL
SEARCH
ENGINE
STREAM
MACHINE
3RD PARTY
PROCESSI
LEARNING
APPS
NG
WORKLOAD MANAGEMENT
DATA
MANAGEMENT
APACHE
HADOOP™
DEVELOPER
TRAINING
STORAGE FOR ANY TYPE OF DATA
Filesystem
Online NoSQL
SYSTEM
MANAGEMENT
UNIFIED, ELASTIC, RESILIENT, SECURE
ADMINISTRATOR
TRAINING
DATA SCIENCE
TRAINING
PROFESSIONAL SERVICES
USE CASE DISCOVERY
PRODUCTION PILOTS
NEW HADOOP DEPLOYMENT
PROCESS & TEAM DEVELOPMENT
PROOF-OF-CONCEPT
DEPLOYMENT CERTIFICATION
CERTIFICATION
PROGRAMS
38. Excelerate Systems +30 Experts Certifiés Cloudera
• Depuis 2011, nous avons
développé un réseau de
consultants hautement
qualifiés.
•
Nous avons réalisé plusieurs
projets dans divers secteurs
d’activités.
•
•
• Architectes,
•
• Administrateurs,
•
• Développeurs,
• Analystes,
Statisticiens
• Data Scientistes
•
•
•
•
e-Commerce
Jeux
e-Gouvernement
Banque et Finance
Grande Distribution
Marketing
Communication
Sécurité et Protection
des Données