SlideShare uma empresa Scribd logo
1 de 27
“ Fehler vorprogrammiert?!” Breakfast Session,  26.05.2009 – Hotel im Wasserturm/Köln
Customer Data Integration (CDI) Projekte sind oftmals mit viel Zeit, Resourcen und hohen Budget verbunden.   ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Schwierigkeiten bei der Datensemantik ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Die Ursachen mangelnder Datenqualität sind vielfältig Dubletten Groß/Kleinschreibung Inkonsistenzen Mißbrauch von Feldern Fehlerhafte Adressen
Risiken ,[object Object],[object Object],[object Object]
ETL: Traditionelle Methodik Im Hinblick auf die Datenqualität ist ETL zwar ein sinnvolles Tool für die Konvertierung oder Standardisierung, jedoch nicht für die  Korrektur oder Verbesserung von Daten . Daneben ist ETL mit einer Konvertierung von Daten vor ihrer Speicherung in einem Data Warehouse, Datamart oder einer neuen Zieldatenbank eher auf den Datenfluss fokussiert. Subjektspezifische Daten wie Kunden- oder Produktdaten stehen nicht im Mittelpunkt.“ Data based Advisor “Data Quality: A Problem and an Approach” DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records load Target System
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Vorgehensweise bei Move & Improve
ETL mit Move & Improve DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records Validation Match Storage of  Golden record load Target System 1. Datenanalyse durch    Data Quality Audit 2. Konzeption 3. Transformierung und    Standardisierung durch   Transform und Scripting 4. Data Improver 5. Merge & Enrich „Golden Record“
DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records Validation Match Storage of  Golden record load Target System 1. Datenanalyse durch    ein Data Quality Audit ETL mit Move & Improve
Data Quality Audit Vorgehensweise: - Durchführung eines Workshop in Zusammenarbeit mit dem Projektteam und Vertretern der IT- und Fachabteilungen. - Analyse der Datenstruktur und der Feldinhalte hinsichtlich Vollständigkeit, Konsistenz und fehlerhaften Störelementen (Erika Mustermann, Test-Test, asdfg, qwertz, etc.). - Analyse der Bestandsliste hinsichtlich Crossreferenzen durch Einsatz der im Workshop abgestimmten Regeln.  - Auswertung und Dokumentation der Ergebnisse. - Präsentation der Ergebnisse
Ergebnis Feldprüfung
Adressprüfung 18,00% 528 Manuelle Korrektor notwendig 10,00% 292 Nicht eindeutig Korrigiert 72,00% 2.107 Automatisch Korrigiert 12,32% 2.927 Verschmutze Adressen 77,68% 33.130 Saubere Adressen 100,00% 36.057 Addressen Gesamt
Ergebnis Data Quality Audit
DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records Validation Match Storage of  Golden record load Target System 1. Datenanalyse durch    ein Data Quality Audit 2. Konzeption ETL mit Move & Improve
Projektkonzeption „Move & Improve“ Analyse Grobkonzept Feinkonzept Umsetzung der Migrationsplanung Initialer  Migrationslauf Inkrementeller Migrationslauf ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records Validation Match Storage of  Golden record load Target System 1. Datenanalyse durch    ein Data Quality Audit 2. Konzeption 3. Transformierung und    Standardisierung durch   Transform und Scripting ETL mit Human Inference:  Move & Improve
Transformieren und Standardisieren: ,[object Object],[object Object],[object Object],[object Object],[object Object]
DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records Validation Match Storage of  Golden record load Target System 1. Datenanalyse durch    ein Data Quality Audit 2. Konzeption 3. Transformierung und    Standardisierung durch   Transform und Scripting ETL mit Move and Improve 4. Data Improver
HI Data Improver (aka Waschstrasse )
DB 1 DB 2 DB n extract extract extract Storage of  Original  records Uniform Parse & Format Storage of  All Uniformed records Validation Match Storage of  Golden record load Target System 1. Datenanalyse durch    ein Data Quality Audit 2. Konzeption 3. Transformierung und    Standardisierung durch   Transform und Scripting ETL mit Move & Improve 4. Data Improver 5. Merge & Enrich „Golden Record“
Merge – Datenvermischung ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Automatische Datenvermischung ,[object Object],[object Object],[object Object],[object Object],[object Object]
Manuelle Datenvermischung
Ein Mass für den Erfolg  des Projektes sind die Ergebnisse aus den Audits! Führt man nach Abschluss der Datenmigration den gleichen Audit nochmal durch und vergleicht ihn mit den Ergebnissen des ersten Audits, hat man hier einen wesentlichen Indikator für den Erfolg des Projektes .
Warum sind dann in reinen Datenmigrationsprojekten Fehler vorprogrammiert? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Fragen?
Vielen Dank für Ihre Aufmerksamkeit Kontakt: Paul Tours Senior Consultant Human Inference Hammfelddamm 4a 41460 Neuss Tel:  +49 2131 403170 Fax:  +49   21314031770 Mobile:  +49   171 3811709 Internet:   www.humaninference.com Email:  [email_address]

Mais conteúdo relacionado

Destaque

Changement d'insert rolex
Changement d'insert rolexChangement d'insert rolex
Changement d'insert rolexJoseph-eugene
 
eTourisme : Lancez vous !
eTourisme : Lancez vous !eTourisme : Lancez vous !
eTourisme : Lancez vous !themagency
 
Forum Weserterrassen: Soziale Medien
Forum Weserterrassen: Soziale MedienForum Weserterrassen: Soziale Medien
Forum Weserterrassen: Soziale Medienclhanken
 
Tome 9 - Tourisme et culture
Tome 9 - Tourisme et cultureTome 9 - Tourisme et culture
Tome 9 - Tourisme et cultureparoles d'élus
 
Tome 8 : développement économique
Tome 8 : développement économiqueTome 8 : développement économique
Tome 8 : développement économiqueparoles d'élus
 
Auw An Der Kyll Family History Book 1657 1854
Auw  An Der Kyll Family History Book 1657 1854Auw  An Der Kyll Family History Book 1657 1854
Auw An Der Kyll Family History Book 1657 1854guestfb5551
 
Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...
Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...
Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...Christoph Deeg
 
Twitter im Tourismus - Hotel Vitalis Twittag 2010
Twitter im Tourismus - Hotel Vitalis Twittag 2010Twitter im Tourismus - Hotel Vitalis Twittag 2010
Twitter im Tourismus - Hotel Vitalis Twittag 2010Realizing Progress
 
3G Service für Zeitungs-Rotationsanlagen
3G Service für Zeitungs-Rotationsanlagen3G Service für Zeitungs-Rotationsanlagen
3G Service für Zeitungs-Rotationsanlagenchristiandunkel
 
Ipsos Italia "Italie 2014: le climat du pays"
Ipsos Italia "Italie 2014: le climat du pays"Ipsos Italia "Italie 2014: le climat du pays"
Ipsos Italia "Italie 2014: le climat du pays"Ermete Mariani
 
Tome 1 : Gestion interne des collectivites
Tome 1 : Gestion interne des collectivitesTome 1 : Gestion interne des collectivites
Tome 1 : Gestion interne des collectivitesparoles d'élus
 
Album photo 304
Album photo 304Album photo 304
Album photo 304lio77
 

Destaque (16)

Changement d'insert rolex
Changement d'insert rolexChangement d'insert rolex
Changement d'insert rolex
 
eTourisme : Lancez vous !
eTourisme : Lancez vous !eTourisme : Lancez vous !
eTourisme : Lancez vous !
 
Forum Weserterrassen: Soziale Medien
Forum Weserterrassen: Soziale MedienForum Weserterrassen: Soziale Medien
Forum Weserterrassen: Soziale Medien
 
Koss00
Koss00Koss00
Koss00
 
Tome 9 - Tourisme et culture
Tome 9 - Tourisme et cultureTome 9 - Tourisme et culture
Tome 9 - Tourisme et culture
 
Tome 8 : développement économique
Tome 8 : développement économiqueTome 8 : développement économique
Tome 8 : développement économique
 
Auw An Der Kyll Family History Book 1657 1854
Auw  An Der Kyll Family History Book 1657 1854Auw  An Der Kyll Family History Book 1657 1854
Auw An Der Kyll Family History Book 1657 1854
 
Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...
Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...
Die wollen nur Spielen – wie Computerspiele neue Formen der Kreativität und d...
 
Mobile National Days 2012
Mobile National Days 2012Mobile National Days 2012
Mobile National Days 2012
 
Patient 1
Patient 1Patient 1
Patient 1
 
Twitter im Tourismus - Hotel Vitalis Twittag 2010
Twitter im Tourismus - Hotel Vitalis Twittag 2010Twitter im Tourismus - Hotel Vitalis Twittag 2010
Twitter im Tourismus - Hotel Vitalis Twittag 2010
 
3G Service für Zeitungs-Rotationsanlagen
3G Service für Zeitungs-Rotationsanlagen3G Service für Zeitungs-Rotationsanlagen
3G Service für Zeitungs-Rotationsanlagen
 
Bildungszentrum Gesundheit und Soziales Chur
Bildungszentrum Gesundheit und Soziales ChurBildungszentrum Gesundheit und Soziales Chur
Bildungszentrum Gesundheit und Soziales Chur
 
Ipsos Italia "Italie 2014: le climat du pays"
Ipsos Italia "Italie 2014: le climat du pays"Ipsos Italia "Italie 2014: le climat du pays"
Ipsos Italia "Italie 2014: le climat du pays"
 
Tome 1 : Gestion interne des collectivites
Tome 1 : Gestion interne des collectivitesTome 1 : Gestion interne des collectivites
Tome 1 : Gestion interne des collectivites
 
Album photo 304
Album photo 304Album photo 304
Album photo 304
 

Semelhante a ‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference

Bi testing media_factory_0.10
Bi testing media_factory_0.10Bi testing media_factory_0.10
Bi testing media_factory_0.10inovex GmbH
 
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria ConsultingDatenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria ConsultingSopra Steria Consulting
 
worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH
 
BizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement KonzepteBizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement KonzepteDragan Kinkela
 
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...Markus Harrer
 
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannBARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannDataValueTalk
 
Analytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und rAnalytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und rMarcel Franke
 
05 präsentation der siegerarbeit
05 präsentation der siegerarbeit05 präsentation der siegerarbeit
05 präsentation der siegerarbeitICV_eV
 
Qualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AG
Qualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AGQualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AG
Qualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AGTorsten Kleiber
 
Excellent reporting in ms excel
Excellent reporting in ms excelExcellent reporting in ms excel
Excellent reporting in ms excelsolutiontogo
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAPmurat9393
 
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...Spark Summit
 
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Falk Neubert
 
Datenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgenDatenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgenVizlib Ltd.
 
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...SQL Projekt AG
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern
 
Oracle Datenbank-Architektur
Oracle Datenbank-ArchitekturOracle Datenbank-Architektur
Oracle Datenbank-ArchitekturMarkus Flechtner
 
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes KunzeSEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunzetakevalue Consulting GmbH
 
SQL Server Monitoring - Piloten fliegen auch nicht blind
SQL Server Monitoring - Piloten fliegen auch nicht blindSQL Server Monitoring - Piloten fliegen auch nicht blind
SQL Server Monitoring - Piloten fliegen auch nicht blindAndre Essing
 

Semelhante a ‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference (20)

Bi testing media_factory_0.10
Bi testing media_factory_0.10Bi testing media_factory_0.10
Bi testing media_factory_0.10
 
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria ConsultingDatenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
 
worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse
 
BizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement KonzepteBizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement Konzepte
 
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
 
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannBARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
 
Analytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und rAnalytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und r
 
05 präsentation der siegerarbeit
05 präsentation der siegerarbeit05 präsentation der siegerarbeit
05 präsentation der siegerarbeit
 
Qualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AG
Qualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AGQualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AG
Qualitätssicherung in ADF Projekten der IKB Deutschen Industriebank AG
 
Excellent reporting in ms excel
Excellent reporting in ms excelExcellent reporting in ms excel
Excellent reporting in ms excel
 
Die Loesung - Turbo iXtractor -
Die Loesung - Turbo iXtractor -Die Loesung - Turbo iXtractor -
Die Loesung - Turbo iXtractor -
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAP
 
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
Clickstream Analysis with Spark—Understanding Visitors in Realtime by Josef A...
 
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
 
Datenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgenDatenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgen
 
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und Knacknüsse
 
Oracle Datenbank-Architektur
Oracle Datenbank-ArchitekturOracle Datenbank-Architektur
Oracle Datenbank-Architektur
 
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes KunzeSEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
 
SQL Server Monitoring - Piloten fliegen auch nicht blind
SQL Server Monitoring - Piloten fliegen auch nicht blindSQL Server Monitoring - Piloten fliegen auch nicht blind
SQL Server Monitoring - Piloten fliegen auch nicht blind
 

Mais de DataValueTalk

What is the price of bad customer data?
What is the price of bad customer data?What is the price of bad customer data?
What is the price of bad customer data?DataValueTalk
 
Inside the Data Fortress
Inside the Data FortressInside the Data Fortress
Inside the Data FortressDataValueTalk
 
Is uw klant een risico?
Is uw klant een risico?Is uw klant een risico?
Is uw klant een risico?DataValueTalk
 
‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier
‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier
‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias KlierDataValueTalk
 
Begrüßung durch Frank Thomas/Human Inferfence
Begrüßung durch Frank Thomas/Human InferfenceBegrüßung durch Frank Thomas/Human Inferfence
Begrüßung durch Frank Thomas/Human InferfenceDataValueTalk
 
Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'
Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'
Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'DataValueTalk
 
Presentation Mark Humphries/Essent evu.it-Business Brekafast
Presentation Mark Humphries/Essent evu.it-Business BrekafastPresentation Mark Humphries/Essent evu.it-Business Brekafast
Presentation Mark Humphries/Essent evu.it-Business BrekafastDataValueTalk
 
Do you know more about your customer after the migration?
Do you know more about your customer after the migration?Do you know more about your customer after the migration?
Do you know more about your customer after the migration?DataValueTalk
 
Ddma presentatie 14 mei
Ddma presentatie 14 meiDdma presentatie 14 mei
Ddma presentatie 14 meiDataValueTalk
 
Het Bel-me-niet register 14 mei 2009
Het Bel-me-niet register 14 mei 2009Het Bel-me-niet register 14 mei 2009
Het Bel-me-niet register 14 mei 2009DataValueTalk
 
What do I know about my customers?
What do I know about my customers?What do I know about my customers?
What do I know about my customers?DataValueTalk
 
Geen Relatie Zonder Juiste Klantgegevens
Geen Relatie Zonder Juiste KlantgegevensGeen Relatie Zonder Juiste Klantgegevens
Geen Relatie Zonder Juiste KlantgegevensDataValueTalk
 
Van je klant moet je 't hebben...
Van je klant moet je 't hebben...Van je klant moet je 't hebben...
Van je klant moet je 't hebben...DataValueTalk
 
Wat Weet Ik Van Mijn Klant Na De Integratie - Capgemini
Wat Weet Ik Van Mijn Klant Na De Integratie - CapgeminiWat Weet Ik Van Mijn Klant Na De Integratie - Capgemini
Wat Weet Ik Van Mijn Klant Na De Integratie - CapgeminiDataValueTalk
 
Wat Weet Ik Van Mijn Klant Na De Integratie - Human Inference
Wat Weet Ik Van Mijn Klant Na De Integratie - Human InferenceWat Weet Ik Van Mijn Klant Na De Integratie - Human Inference
Wat Weet Ik Van Mijn Klant Na De Integratie - Human InferenceDataValueTalk
 
De Klant Centraal - ICSB
De Klant Centraal - ICSBDe Klant Centraal - ICSB
De Klant Centraal - ICSBDataValueTalk
 
Human Inference - Product Update What Do I Know About My Customers
Human Inference - Product Update   What Do I Know About My CustomersHuman Inference - Product Update   What Do I Know About My Customers
Human Inference - Product Update What Do I Know About My CustomersDataValueTalk
 

Mais de DataValueTalk (20)

Bad customer data?
Bad customer data?Bad customer data?
Bad customer data?
 
What is the price of bad customer data?
What is the price of bad customer data?What is the price of bad customer data?
What is the price of bad customer data?
 
Inside the Data Fortress
Inside the Data FortressInside the Data Fortress
Inside the Data Fortress
 
Is uw klant een risico?
Is uw klant een risico?Is uw klant een risico?
Is uw klant een risico?
 
Ken uw klant
Ken uw klantKen uw klant
Ken uw klant
 
‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier
‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier
‘Metriken für ein ROI-basiertes Datenqualitätsmanagement’ Dr. Mathias Klier
 
Begrüßung durch Frank Thomas/Human Inferfence
Begrüßung durch Frank Thomas/Human InferfenceBegrüßung durch Frank Thomas/Human Inferfence
Begrüßung durch Frank Thomas/Human Inferfence
 
Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'
Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'
Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken'
 
Presentation Mark Humphries/Essent evu.it-Business Brekafast
Presentation Mark Humphries/Essent evu.it-Business BrekafastPresentation Mark Humphries/Essent evu.it-Business Brekafast
Presentation Mark Humphries/Essent evu.it-Business Brekafast
 
Do you know more about your customer after the migration?
Do you know more about your customer after the migration?Do you know more about your customer after the migration?
Do you know more about your customer after the migration?
 
Ddma presentatie 14 mei
Ddma presentatie 14 meiDdma presentatie 14 mei
Ddma presentatie 14 mei
 
Het Bel-me-niet register 14 mei 2009
Het Bel-me-niet register 14 mei 2009Het Bel-me-niet register 14 mei 2009
Het Bel-me-niet register 14 mei 2009
 
Digital Revolution
Digital RevolutionDigital Revolution
Digital Revolution
 
What do I know about my customers?
What do I know about my customers?What do I know about my customers?
What do I know about my customers?
 
Geen Relatie Zonder Juiste Klantgegevens
Geen Relatie Zonder Juiste KlantgegevensGeen Relatie Zonder Juiste Klantgegevens
Geen Relatie Zonder Juiste Klantgegevens
 
Van je klant moet je 't hebben...
Van je klant moet je 't hebben...Van je klant moet je 't hebben...
Van je klant moet je 't hebben...
 
Wat Weet Ik Van Mijn Klant Na De Integratie - Capgemini
Wat Weet Ik Van Mijn Klant Na De Integratie - CapgeminiWat Weet Ik Van Mijn Klant Na De Integratie - Capgemini
Wat Weet Ik Van Mijn Klant Na De Integratie - Capgemini
 
Wat Weet Ik Van Mijn Klant Na De Integratie - Human Inference
Wat Weet Ik Van Mijn Klant Na De Integratie - Human InferenceWat Weet Ik Van Mijn Klant Na De Integratie - Human Inference
Wat Weet Ik Van Mijn Klant Na De Integratie - Human Inference
 
De Klant Centraal - ICSB
De Klant Centraal - ICSBDe Klant Centraal - ICSB
De Klant Centraal - ICSB
 
Human Inference - Product Update What Do I Know About My Customers
Human Inference - Product Update   What Do I Know About My CustomersHuman Inference - Product Update   What Do I Know About My Customers
Human Inference - Product Update What Do I Know About My Customers
 

‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference

  • 1. “ Fehler vorprogrammiert?!” Breakfast Session, 26.05.2009 – Hotel im Wasserturm/Köln
  • 2.
  • 3.
  • 4. Die Ursachen mangelnder Datenqualität sind vielfältig Dubletten Groß/Kleinschreibung Inkonsistenzen Mißbrauch von Feldern Fehlerhafte Adressen
  • 5.
  • 6. ETL: Traditionelle Methodik Im Hinblick auf die Datenqualität ist ETL zwar ein sinnvolles Tool für die Konvertierung oder Standardisierung, jedoch nicht für die Korrektur oder Verbesserung von Daten . Daneben ist ETL mit einer Konvertierung von Daten vor ihrer Speicherung in einem Data Warehouse, Datamart oder einer neuen Zieldatenbank eher auf den Datenfluss fokussiert. Subjektspezifische Daten wie Kunden- oder Produktdaten stehen nicht im Mittelpunkt.“ Data based Advisor “Data Quality: A Problem and an Approach” DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records load Target System
  • 7.
  • 8. ETL mit Move & Improve DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records Validation Match Storage of Golden record load Target System 1. Datenanalyse durch Data Quality Audit 2. Konzeption 3. Transformierung und Standardisierung durch Transform und Scripting 4. Data Improver 5. Merge & Enrich „Golden Record“
  • 9. DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records Validation Match Storage of Golden record load Target System 1. Datenanalyse durch ein Data Quality Audit ETL mit Move & Improve
  • 10. Data Quality Audit Vorgehensweise: - Durchführung eines Workshop in Zusammenarbeit mit dem Projektteam und Vertretern der IT- und Fachabteilungen. - Analyse der Datenstruktur und der Feldinhalte hinsichtlich Vollständigkeit, Konsistenz und fehlerhaften Störelementen (Erika Mustermann, Test-Test, asdfg, qwertz, etc.). - Analyse der Bestandsliste hinsichtlich Crossreferenzen durch Einsatz der im Workshop abgestimmten Regeln. - Auswertung und Dokumentation der Ergebnisse. - Präsentation der Ergebnisse
  • 12. Adressprüfung 18,00% 528 Manuelle Korrektor notwendig 10,00% 292 Nicht eindeutig Korrigiert 72,00% 2.107 Automatisch Korrigiert 12,32% 2.927 Verschmutze Adressen 77,68% 33.130 Saubere Adressen 100,00% 36.057 Addressen Gesamt
  • 14. DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records Validation Match Storage of Golden record load Target System 1. Datenanalyse durch ein Data Quality Audit 2. Konzeption ETL mit Move & Improve
  • 15.
  • 16. DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records Validation Match Storage of Golden record load Target System 1. Datenanalyse durch ein Data Quality Audit 2. Konzeption 3. Transformierung und Standardisierung durch Transform und Scripting ETL mit Human Inference: Move & Improve
  • 17.
  • 18. DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records Validation Match Storage of Golden record load Target System 1. Datenanalyse durch ein Data Quality Audit 2. Konzeption 3. Transformierung und Standardisierung durch Transform und Scripting ETL mit Move and Improve 4. Data Improver
  • 19. HI Data Improver (aka Waschstrasse )
  • 20. DB 1 DB 2 DB n extract extract extract Storage of Original records Uniform Parse & Format Storage of All Uniformed records Validation Match Storage of Golden record load Target System 1. Datenanalyse durch ein Data Quality Audit 2. Konzeption 3. Transformierung und Standardisierung durch Transform und Scripting ETL mit Move & Improve 4. Data Improver 5. Merge & Enrich „Golden Record“
  • 21.
  • 22.
  • 24. Ein Mass für den Erfolg des Projektes sind die Ergebnisse aus den Audits! Führt man nach Abschluss der Datenmigration den gleichen Audit nochmal durch und vergleicht ihn mit den Ergebnissen des ersten Audits, hat man hier einen wesentlichen Indikator für den Erfolg des Projektes .
  • 25.
  • 27. Vielen Dank für Ihre Aufmerksamkeit Kontakt: Paul Tours Senior Consultant Human Inference Hammfelddamm 4a 41460 Neuss Tel: +49 2131 403170 Fax: +49 21314031770 Mobile: +49 171 3811709 Internet: www.humaninference.com Email: [email_address]