SlideShare uma empresa Scribd logo
1 de 21
Baixar para ler offline
Big data-Projekte:
Best practices aus der Praxis
Dr. Kathrin Spreyer
Big Data Engineer
JAX / Big data days
Mainz, 14.05.2014
Agenda
1. Projekte
2. Big
3. Datenimport
4. Datenschutz
5. Testen
6. Tooling
7. Agilität
2
Agenda
1. Projekte
2. Big
3. Datenimport
4. Datenschutz
5. Testen
6. Tooling
7. Agilität
2
Zwei Projekte
• 1&1
• 2009-2013
• Web-Analytics
• ProsiebenSat.1 Digital (PSD)
• 2013-heute
• Integration von Reichweiten-,
Vermarktungserlös- und
Transaktionsdaten
3
Architektur 1&1
4
Architektur PSD
5
Lösungsansatz
Hybrides System aus relationaler Datenbank und Hadoop Cluster
Was heißt “Big?”
6
3V
Was heißt “Big?”
6
3V
Parallelisierung
Skalierbarkeit
Datenimport
7
Koordination m. Quellsystemen
Zwischenspeicherung
Skalierbarer
Transport
(N)RT
Datenschutz
8
Computersicherheit
Multi-Tenancy
Datenschutz
8
Computersicherheit
Multi-Tenancy
PII
Anonymisierung
Nutzen vs. Anonymität
Testen
9
Korrektheit
Robustheit
Performanz
Testen
9
Korrektheit
Robustheit
Performanz
Regressions-/Akzeptanztests
Testen
9
Datenmenge
Korrektheit
Robustheit
Performanz
Testdauer
Regressions-/Akzeptanztests
Wartbarkeit (Fachseite)
Tooling
10
Tooling
10
Reifegrad
Downstream-Anforderungen
Datenmodellierung
RT?
Nutzerakzeptanz
Agilität
11
REfactoring mit neuen Technologien
Iterativ
inkrementell
Agilität
11
Daten-Exploration
REfactoring mit neuen Technologien
Iterativ
inkrementell
Anforderungen erwachsen aus Daten
Und jetzt?
12
Luecken
Junge Technologien
inovex Academy
1. U.a. Hadoop-Entwickler-Training
2. 1-3 Tage
3. Inhouse oder offen
4. Offene Hadoop-Trainings 2014:
18.-20. März (Köln)
24.-26. Juni (München)
18.-20. November (Karlsruhe)
www.inovex.de/trainings/offene-trainings/
13
14
Fragen?
Meinungen?

Mais conteúdo relacionado

Destaque

Topic 4 business model innovation
Topic 4   business model innovationTopic 4   business model innovation
Topic 4 business model innovationZaheer Travadi
 
Digitale Transformation - Industrie 4.0 & FinTech
Digitale Transformation - Industrie 4.0 & FinTechDigitale Transformation - Industrie 4.0 & FinTech
Digitale Transformation - Industrie 4.0 & FinTechNicolas Schobinger
 
Digitale Transformation - Herausforderungen und Ansatzpunkte
Digitale Transformation - Herausforderungen und AnsatzpunkteDigitale Transformation - Herausforderungen und Ansatzpunkte
Digitale Transformation - Herausforderungen und AnsatzpunkteNicolas Schobinger
 
BUSINESS MODEL INNOVATION
BUSINESS MODEL INNOVATIONBUSINESS MODEL INNOVATION
BUSINESS MODEL INNOVATIONClemens Frowein
 
Bedeutung von Innovation Communities für die Innovationsmarktforschung
Bedeutung von Innovation Communities für die InnovationsmarktforschungBedeutung von Innovation Communities für die Innovationsmarktforschung
Bedeutung von Innovation Communities für die InnovationsmarktforschungFH Brandenburg
 
How to choose the right business model? by @boardofinno - @nickdemey
How to choose the right business model? by @boardofinno - @nickdemeyHow to choose the right business model? by @boardofinno - @nickdemey
How to choose the right business model? by @boardofinno - @nickdemeyBoard of Innovation
 
Innovation Labs und Corporate Acceleratoren im Innovations-Dilemma
Innovation Labs und Corporate Acceleratoren im Innovations-DilemmaInnovation Labs und Corporate Acceleratoren im Innovations-Dilemma
Innovation Labs und Corporate Acceleratoren im Innovations-DilemmaManuel Funk
 
Innovation - Entwicklung und Konzepte
Innovation - Entwicklung und KonzepteInnovation - Entwicklung und Konzepte
Innovation - Entwicklung und KonzepteTheodor Beutel
 
Digitale Transformation
Digitale TransformationDigitale Transformation
Digitale TransformationSven Ruoss
 
Corporate Startup: Disruptive Innovation mit Lean Startup & Design Thinking
Corporate Startup: Disruptive Innovation mit Lean Startup & Design ThinkingCorporate Startup: Disruptive Innovation mit Lean Startup & Design Thinking
Corporate Startup: Disruptive Innovation mit Lean Startup & Design ThinkingInstitute for Business Innovation
 
Business Model Course Day 1 (in German)
Business Model Course Day 1 (in German)Business Model Course Day 1 (in German)
Business Model Course Day 1 (in German)Alexander Osterwalder
 
Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...
Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...
Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...Dr. Judith Grummer
 
Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)
Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)
Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)Hannes Rothe
 
Business Model Canvas 101
Business Model Canvas 101Business Model Canvas 101
Business Model Canvas 101Emad Saif
 

Destaque (16)

Topic 4 business model innovation
Topic 4   business model innovationTopic 4   business model innovation
Topic 4 business model innovation
 
Digitale Transformation - Industrie 4.0 & FinTech
Digitale Transformation - Industrie 4.0 & FinTechDigitale Transformation - Industrie 4.0 & FinTech
Digitale Transformation - Industrie 4.0 & FinTech
 
Digitale Transformation - Herausforderungen und Ansatzpunkte
Digitale Transformation - Herausforderungen und AnsatzpunkteDigitale Transformation - Herausforderungen und Ansatzpunkte
Digitale Transformation - Herausforderungen und Ansatzpunkte
 
BUSINESS MODEL INNOVATION
BUSINESS MODEL INNOVATIONBUSINESS MODEL INNOVATION
BUSINESS MODEL INNOVATION
 
Bedeutung von Innovation Communities für die Innovationsmarktforschung
Bedeutung von Innovation Communities für die InnovationsmarktforschungBedeutung von Innovation Communities für die Innovationsmarktforschung
Bedeutung von Innovation Communities für die Innovationsmarktforschung
 
Industrie 4.0: Geschäftsmodelle und Umsetzung für den Mittelstand
Industrie 4.0: Geschäftsmodelle und Umsetzung für den MittelstandIndustrie 4.0: Geschäftsmodelle und Umsetzung für den Mittelstand
Industrie 4.0: Geschäftsmodelle und Umsetzung für den Mittelstand
 
How to choose the right business model? by @boardofinno - @nickdemey
How to choose the right business model? by @boardofinno - @nickdemeyHow to choose the right business model? by @boardofinno - @nickdemey
How to choose the right business model? by @boardofinno - @nickdemey
 
Innovation Labs und Corporate Acceleratoren im Innovations-Dilemma
Innovation Labs und Corporate Acceleratoren im Innovations-DilemmaInnovation Labs und Corporate Acceleratoren im Innovations-Dilemma
Innovation Labs und Corporate Acceleratoren im Innovations-Dilemma
 
Innovation - Entwicklung und Konzepte
Innovation - Entwicklung und KonzepteInnovation - Entwicklung und Konzepte
Innovation - Entwicklung und Konzepte
 
Digitale Transformation
Digitale TransformationDigitale Transformation
Digitale Transformation
 
Corporate Startup: Disruptive Innovation mit Lean Startup & Design Thinking
Corporate Startup: Disruptive Innovation mit Lean Startup & Design ThinkingCorporate Startup: Disruptive Innovation mit Lean Startup & Design Thinking
Corporate Startup: Disruptive Innovation mit Lean Startup & Design Thinking
 
Business Model Course Day 1 (in German)
Business Model Course Day 1 (in German)Business Model Course Day 1 (in German)
Business Model Course Day 1 (in German)
 
Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...
Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...
Juni 2015: The Lean Startup / Vorlesung "Entrepreneurship & Intrapreneurship"...
 
Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)
Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)
Educational Service Engineering - Digitalisierung der Lehre (Dr. Hannes Rothe)
 
IT-Projekte erfolgreich abwickeln - topsoft 2010_03_24 09:00
IT-Projekte erfolgreich abwickeln - topsoft 2010_03_24 09:00IT-Projekte erfolgreich abwickeln - topsoft 2010_03_24 09:00
IT-Projekte erfolgreich abwickeln - topsoft 2010_03_24 09:00
 
Business Model Canvas 101
Business Model Canvas 101Business Model Canvas 101
Business Model Canvas 101
 

Mais de inovex GmbH

lldb – Debugger auf Abwegen
lldb – Debugger auf Abwegenlldb – Debugger auf Abwegen
lldb – Debugger auf Abwegeninovex GmbH
 
Are you sure about that?! Uncertainty Quantification in AI
Are you sure about that?! Uncertainty Quantification in AIAre you sure about that?! Uncertainty Quantification in AI
Are you sure about that?! Uncertainty Quantification in AIinovex GmbH
 
Why natural language is next step in the AI evolution
Why natural language is next step in the AI evolutionWhy natural language is next step in the AI evolution
Why natural language is next step in the AI evolutioninovex GmbH
 
Network Policies
Network PoliciesNetwork Policies
Network Policiesinovex GmbH
 
Interpretable Machine Learning
Interpretable Machine LearningInterpretable Machine Learning
Interpretable Machine Learninginovex GmbH
 
Jenkins X – CI/CD in wolkigen Umgebungen
Jenkins X – CI/CD in wolkigen UmgebungenJenkins X – CI/CD in wolkigen Umgebungen
Jenkins X – CI/CD in wolkigen Umgebungeninovex GmbH
 
AI auf Edge-Geraeten
AI auf Edge-GeraetenAI auf Edge-Geraeten
AI auf Edge-Geraeteninovex GmbH
 
Prometheus on Kubernetes
Prometheus on KubernetesPrometheus on Kubernetes
Prometheus on Kubernetesinovex GmbH
 
Deep Learning for Recommender Systems
Deep Learning for Recommender SystemsDeep Learning for Recommender Systems
Deep Learning for Recommender Systemsinovex GmbH
 
Representation Learning von Zeitreihen
Representation Learning von ZeitreihenRepresentation Learning von Zeitreihen
Representation Learning von Zeitreiheninovex GmbH
 
Talk to me – Chatbots und digitale Assistenten
Talk to me – Chatbots und digitale AssistentenTalk to me – Chatbots und digitale Assistenten
Talk to me – Chatbots und digitale Assistenteninovex GmbH
 
Künstlich intelligent?
Künstlich intelligent?Künstlich intelligent?
Künstlich intelligent?inovex GmbH
 
Das Android Open Source Project
Das Android Open Source ProjectDas Android Open Source Project
Das Android Open Source Projectinovex GmbH
 
Machine Learning Interpretability
Machine Learning InterpretabilityMachine Learning Interpretability
Machine Learning Interpretabilityinovex GmbH
 
Performance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use casePerformance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use caseinovex GmbH
 
People & Products – Lessons learned from the daily IT madness
People & Products – Lessons learned from the daily IT madnessPeople & Products – Lessons learned from the daily IT madness
People & Products – Lessons learned from the daily IT madnessinovex GmbH
 
Infrastructure as (real) Code – Manage your K8s resources with Pulumi
Infrastructure as (real) Code – Manage your K8s resources with PulumiInfrastructure as (real) Code – Manage your K8s resources with Pulumi
Infrastructure as (real) Code – Manage your K8s resources with Pulumiinovex GmbH
 

Mais de inovex GmbH (20)

lldb – Debugger auf Abwegen
lldb – Debugger auf Abwegenlldb – Debugger auf Abwegen
lldb – Debugger auf Abwegen
 
Are you sure about that?! Uncertainty Quantification in AI
Are you sure about that?! Uncertainty Quantification in AIAre you sure about that?! Uncertainty Quantification in AI
Are you sure about that?! Uncertainty Quantification in AI
 
Why natural language is next step in the AI evolution
Why natural language is next step in the AI evolutionWhy natural language is next step in the AI evolution
Why natural language is next step in the AI evolution
 
WWDC 2019 Recap
WWDC 2019 RecapWWDC 2019 Recap
WWDC 2019 Recap
 
Network Policies
Network PoliciesNetwork Policies
Network Policies
 
Interpretable Machine Learning
Interpretable Machine LearningInterpretable Machine Learning
Interpretable Machine Learning
 
Jenkins X – CI/CD in wolkigen Umgebungen
Jenkins X – CI/CD in wolkigen UmgebungenJenkins X – CI/CD in wolkigen Umgebungen
Jenkins X – CI/CD in wolkigen Umgebungen
 
AI auf Edge-Geraeten
AI auf Edge-GeraetenAI auf Edge-Geraeten
AI auf Edge-Geraeten
 
Prometheus on Kubernetes
Prometheus on KubernetesPrometheus on Kubernetes
Prometheus on Kubernetes
 
Deep Learning for Recommender Systems
Deep Learning for Recommender SystemsDeep Learning for Recommender Systems
Deep Learning for Recommender Systems
 
Azure IoT Edge
Azure IoT EdgeAzure IoT Edge
Azure IoT Edge
 
Representation Learning von Zeitreihen
Representation Learning von ZeitreihenRepresentation Learning von Zeitreihen
Representation Learning von Zeitreihen
 
Talk to me – Chatbots und digitale Assistenten
Talk to me – Chatbots und digitale AssistentenTalk to me – Chatbots und digitale Assistenten
Talk to me – Chatbots und digitale Assistenten
 
Künstlich intelligent?
Künstlich intelligent?Künstlich intelligent?
Künstlich intelligent?
 
Dev + Ops = Go
Dev + Ops = GoDev + Ops = Go
Dev + Ops = Go
 
Das Android Open Source Project
Das Android Open Source ProjectDas Android Open Source Project
Das Android Open Source Project
 
Machine Learning Interpretability
Machine Learning InterpretabilityMachine Learning Interpretability
Machine Learning Interpretability
 
Performance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use casePerformance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use case
 
People & Products – Lessons learned from the daily IT madness
People & Products – Lessons learned from the daily IT madnessPeople & Products – Lessons learned from the daily IT madness
People & Products – Lessons learned from the daily IT madness
 
Infrastructure as (real) Code – Manage your K8s resources with Pulumi
Infrastructure as (real) Code – Manage your K8s resources with PulumiInfrastructure as (real) Code – Manage your K8s resources with Pulumi
Infrastructure as (real) Code – Manage your K8s resources with Pulumi
 

Big Data Projekte - Best Practices aus der Praxis