SlideShare uma empresa Scribd logo
1 de 24
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
 Überraschend mehr Möglichkeiten
© OPITZ CONSULTING 2018
… und 10 typische Stolpersteine auf dem Weg dahin
Lukas Berle
Big-Data-Architekturen
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin
Who am I?
Lukas Berle
 Big Data Software Engineering Lead @
OPITZ CONSULTING
 Scalable Computing
 Big-Data-Architekturen
 Hadoop Infrastruktur Setup
 Docker & Kubernetes
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich Seite 3
Überblick
1
2
Big Data Architekturen
Zehn Stolpersteine
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 4
Die klassische Data Warehouse Architektur
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 5
Data Lake Grobarchitektur
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 6
Data Lake Feinarchitektur
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 7
Hadoop als Active Archive
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 8
DWH Architektur mit Streaming Layer
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 9
DWH Architektur mit Streaming Layer
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle - Big Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 10
Streaming Architekturen – Lambda Architektur
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle - Big Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 11
Streaming Architekturen – Kappa Architektur
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 12
Spark on Kubernetes
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 13
Stolperstein 1
Don‘t use NoSQL Database
SQL-like!
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin
Stolperstein 2
Hadoop Distribution?!
Ich nehm das Open Source Hadoop!
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 15
Stolperstein 3
Big Data != Analytics
Analytics < Big Data
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 16
Stolperstein 4
„My 5 men backend-developer team will make it“
Verzweiflung Vorbeugen:
• Grundlagenschulung
• Spezialistenschulung
Es gibt eine Menge an
• Bugs
• Versionsinkompatibilitäten
• Fehlender Doku
• Möglichkeiten der Fehlkonfiguration
+
Hortonworks Commmunity
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 17
Stolperstein 5
Denke in Rollen!
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 18
Stolperstein 6
Warum Big Data Projekte organisatorisch fehlschlagen
 Ungenaue Ziele
 Falsche Erwartungen
 Technologien und vorhandene Skills divergieren zu stark
Das „richtige“ erste Big Data Projekt
 Nachweisbarer Wert
 Management Attention + Sponsoring
 Small Use Case for Big Data
 Umsetzbar in 6 Monaten
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 19
Stolperstein 7
Automatisierung des Hadoop
Infrastruktursetups spart mir viel
Geld!
Denk an:
• Security
• Properties
• Versionsupdates
• Neue Tools
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 20
Stolperstein 8
Entkopplung von Storage und Compute Knoten
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 21
Stolperstein 8
Entkopplung von Storage und Compute Knoten
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 22
Stolperstein 8
Entkopplung von Storage und Compute Knoten
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 23
Stolperstein 9
Halte dich an die richtige Reihenfolge!
Hardware
Distribution /
Technologie
Anwendungs-
fälle
Hardware
Distribution /
Technologie
Anwendungs-
fälle
© OPITZ CONSULTING 2018
Informationsklassifikation:
Öffentlich
Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 24
Stolperstein 10
Nutze nicht für alles das Beste!

Mais conteúdo relacionado

Semelhante a Big-Data-Architekturen

Modern Data Stack – Buzzword oder echter Game-Changer?
Modern Data Stack – Buzzword oder echter Game-Changer?Modern Data Stack – Buzzword oder echter Game-Changer?
Modern Data Stack – Buzzword oder echter Game-Changer?Fabian Hardt
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Martin Kaltenböck
 
DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)
DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)
DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)Johannes Dienst
 
Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...
Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...
Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...Fabian Hardt
 
Wie erstelle ich ein Datenmodell in einem agilen Projekt?
Wie erstelle ich ein Datenmodell in einem agilen Projekt? Wie erstelle ich ein Datenmodell in einem agilen Projekt?
Wie erstelle ich ein Datenmodell in einem agilen Projekt? OPITZ CONSULTING Deutschland
 
Big Data Governance
Big Data GovernanceBig Data Governance
Big Data GovernanceCapgemini
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATMartin Kaltenböck
 
Linked Data nach dem Hype
Linked Data nach dem HypeLinked Data nach dem Hype
Linked Data nach dem HypeKai Eckert
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data KonnektivitätTrivadis
 
20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert
20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert
20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändertWerbeplanung.at Summit
 
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger KochOSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger KochNETWAYS
 
Big Data und Oracle bringen die Logistik in Bewegung
Big Data und Oracle bringen die Logistik in BewegungBig Data und Oracle bringen die Logistik in Bewegung
Big Data und Oracle bringen die Logistik in BewegungOPITZ CONSULTING Deutschland
 
Technologie und SEO: Cloud, Big Data und Mobile First angeschaut
Technologie und SEO: Cloud, Big Data und Mobile First angeschautTechnologie und SEO: Cloud, Big Data und Mobile First angeschaut
Technologie und SEO: Cloud, Big Data und Mobile First angeschautRalf Schwoebel
 
BARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
BARC Studie Webinar: Ausgereifte Analysen mit Apache HadoopBARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
BARC Studie Webinar: Ausgereifte Analysen mit Apache HadoopCloudera, Inc.
 
Different perspectives on data science
Different perspectives on data scienceDifferent perspectives on data science
Different perspectives on data scienceSabrina Kirrane
 
Wird das Datacenter künstlich-intelligent?
Wird das Datacenter künstlich-intelligent?Wird das Datacenter künstlich-intelligent?
Wird das Datacenter künstlich-intelligent?Jesus Villar-Rodriguez
 
Big Data Minds 2016 - Post Event Report
Big Data Minds 2016 - Post Event ReportBig Data Minds 2016 - Post Event Report
Big Data Minds 2016 - Post Event ReportRamona Kohrs
 

Semelhante a Big-Data-Architekturen (20)

Modern Data Stack – Buzzword oder echter Game-Changer?
Modern Data Stack – Buzzword oder echter Game-Changer?Modern Data Stack – Buzzword oder echter Game-Changer?
Modern Data Stack – Buzzword oder echter Game-Changer?
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
 
DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)
DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)
DevOps im Konzern - Autonomie vs Betriebssicherheit (Continuous Lifecycle)
 
Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...
Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...
Data Mesh und Domain Driven Design - rücken Analytics und SD nun doch näher z...
 
Ms dos-and-donts-doag
Ms dos-and-donts-doagMs dos-and-donts-doag
Ms dos-and-donts-doag
 
Wie erstelle ich ein Datenmodell in einem agilen Projekt?
Wie erstelle ich ein Datenmodell in einem agilen Projekt? Wie erstelle ich ein Datenmodell in einem agilen Projekt?
Wie erstelle ich ein Datenmodell in einem agilen Projekt?
 
Big Data Governance
Big Data GovernanceBig Data Governance
Big Data Governance
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
 
Analytics as a Service - Microsoft Azure
Analytics as a Service  - Microsoft Azure Analytics as a Service  - Microsoft Azure
Analytics as a Service - Microsoft Azure
 
Linked Data nach dem Hype
Linked Data nach dem HypeLinked Data nach dem Hype
Linked Data nach dem Hype
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data Konnektivität
 
20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert
20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert
20131203 11 pivotal_ wie_big_data_geschäftsmodelle_verändert
 
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger KochOSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
OSMC 2023 | Bring IoT auf ein neues Level mit ThingsBoard by Holger Koch
 
Big Data und Oracle bringen die Logistik in Bewegung
Big Data und Oracle bringen die Logistik in BewegungBig Data und Oracle bringen die Logistik in Bewegung
Big Data und Oracle bringen die Logistik in Bewegung
 
Technologie und SEO: Cloud, Big Data und Mobile First angeschaut
Technologie und SEO: Cloud, Big Data und Mobile First angeschautTechnologie und SEO: Cloud, Big Data und Mobile First angeschaut
Technologie und SEO: Cloud, Big Data und Mobile First angeschaut
 
BARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
BARC Studie Webinar: Ausgereifte Analysen mit Apache HadoopBARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
BARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
 
Different perspectives on data science
Different perspectives on data scienceDifferent perspectives on data science
Different perspectives on data science
 
Wird das Datacenter künstlich-intelligent?
Wird das Datacenter künstlich-intelligent?Wird das Datacenter künstlich-intelligent?
Wird das Datacenter künstlich-intelligent?
 
Big Data Minds 2016 - Post Event Report
Big Data Minds 2016 - Post Event ReportBig Data Minds 2016 - Post Event Report
Big Data Minds 2016 - Post Event Report
 
Hadoop und SAS für Einsteiger
Hadoop und SAS für EinsteigerHadoop und SAS für Einsteiger
Hadoop und SAS für Einsteiger
 

Mais de OPITZ CONSULTING Deutschland

Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"OPITZ CONSULTING Deutschland
 
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOPITZ CONSULTING Deutschland
 
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOPITZ CONSULTING Deutschland
 
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OPITZ CONSULTING Deutschland
 
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OPITZ CONSULTING Deutschland
 
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OPITZ CONSULTING Deutschland
 
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OPITZ CONSULTING Deutschland
 
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OPITZ CONSULTING Deutschland
 
Effiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungEffiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungOPITZ CONSULTING Deutschland
 

Mais de OPITZ CONSULTING Deutschland (20)

OC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast: Grundlagen der Oracle LizenzierungOC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast: Grundlagen der Oracle Lizenzierung
 
OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 28.09.2021OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 28.09.2021
 
OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Java heute" vom 24.08.2021OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Java heute" vom 24.08.2021
 
OC|Webcast "Daten wirklich nutzen"
OC|Webcast "Daten wirklich nutzen"OC|Webcast "Daten wirklich nutzen"
OC|Webcast "Daten wirklich nutzen"
 
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
 
OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Willkommen in der Cloud!"OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Willkommen in der Cloud!"
 
OC|Webcast "Die neue Welt der Virtualisierung"
OC|Webcast "Die neue Welt der Virtualisierung"OC|Webcast "Die neue Welt der Virtualisierung"
OC|Webcast "Die neue Welt der Virtualisierung"
 
10 Thesen zur professionellen Softwareentwicklung
10 Thesen zur professionellen Softwareentwicklung10 Thesen zur professionellen Softwareentwicklung
10 Thesen zur professionellen Softwareentwicklung
 
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
 
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
 
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
 
OC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Webcast: Grundlagen der Oracle-LizenzierungOC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Webcast: Grundlagen der Oracle-Lizenzierung
 
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
 
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
 
OC|Weekly Talk The Power of DevOps…
OC|Weekly Talk  The Power of DevOps…OC|Weekly Talk  The Power of DevOps…
OC|Weekly Talk The Power of DevOps…
 
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
 
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
 
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring
 
OC|Weekly Talk - Beratung remote
OC|Weekly Talk - Beratung remoteOC|Weekly Talk - Beratung remote
OC|Weekly Talk - Beratung remote
 
Effiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungEffiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud Nutzung
 

Big-Data-Architekturen

  • 1. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich  Überraschend mehr Möglichkeiten © OPITZ CONSULTING 2018 … und 10 typische Stolpersteine auf dem Weg dahin Lukas Berle Big-Data-Architekturen
  • 2. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Who am I? Lukas Berle  Big Data Software Engineering Lead @ OPITZ CONSULTING  Scalable Computing  Big-Data-Architekturen  Hadoop Infrastruktur Setup  Docker & Kubernetes
  • 3. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Seite 3 Überblick 1 2 Big Data Architekturen Zehn Stolpersteine Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin
  • 4. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 4 Die klassische Data Warehouse Architektur
  • 5. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 5 Data Lake Grobarchitektur
  • 6. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 6 Data Lake Feinarchitektur
  • 7. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 7 Hadoop als Active Archive
  • 8. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 8 DWH Architektur mit Streaming Layer
  • 9. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 9 DWH Architektur mit Streaming Layer
  • 10. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle - Big Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 10 Streaming Architekturen – Lambda Architektur
  • 11. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle - Big Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 11 Streaming Architekturen – Kappa Architektur
  • 12. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 12 Spark on Kubernetes
  • 13. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 13 Stolperstein 1 Don‘t use NoSQL Database SQL-like!
  • 14. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Stolperstein 2 Hadoop Distribution?! Ich nehm das Open Source Hadoop!
  • 15. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 15 Stolperstein 3 Big Data != Analytics Analytics < Big Data
  • 16. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 16 Stolperstein 4 „My 5 men backend-developer team will make it“ Verzweiflung Vorbeugen: • Grundlagenschulung • Spezialistenschulung Es gibt eine Menge an • Bugs • Versionsinkompatibilitäten • Fehlender Doku • Möglichkeiten der Fehlkonfiguration + Hortonworks Commmunity
  • 17. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 17 Stolperstein 5 Denke in Rollen!
  • 18. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 18 Stolperstein 6 Warum Big Data Projekte organisatorisch fehlschlagen  Ungenaue Ziele  Falsche Erwartungen  Technologien und vorhandene Skills divergieren zu stark Das „richtige“ erste Big Data Projekt  Nachweisbarer Wert  Management Attention + Sponsoring  Small Use Case for Big Data  Umsetzbar in 6 Monaten
  • 19. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 19 Stolperstein 7 Automatisierung des Hadoop Infrastruktursetups spart mir viel Geld! Denk an: • Security • Properties • Versionsupdates • Neue Tools
  • 20. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 20 Stolperstein 8 Entkopplung von Storage und Compute Knoten
  • 21. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 21 Stolperstein 8 Entkopplung von Storage und Compute Knoten
  • 22. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 22 Stolperstein 8 Entkopplung von Storage und Compute Knoten
  • 23. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 23 Stolperstein 9 Halte dich an die richtige Reihenfolge! Hardware Distribution / Technologie Anwendungs- fälle Hardware Distribution / Technologie Anwendungs- fälle
  • 24. © OPITZ CONSULTING 2018 Informationsklassifikation: Öffentlich Lukas Berle – Big-Data-Architekturen und 10 typische Stolpersteine auf dem Weg dahin Seite 24 Stolperstein 10 Nutze nicht für alles das Beste!

Notas do Editor

  1. Daten im Active Archive können ... Mit Oracle SQL abgefragt und mit SQL + PL/SQL Security geschützt werden Auslagerung von Daten aus dem DWH Daten können noch abgefragt werden Kostengünstigere Speicherung der Daten