SlideShare uma empresa Scribd logo
1 de 58
Baixar para ler offline
Azure Data Factory – Data Management für die
Cloud
Stefan Kirner
Speaker Bio: Stefan Kirner
• Teamleiter BI Solutions bei der inovex GmbH
• Erfahrung mit Microsoft BI Stack seit SQL Server 2000
• Entwicklung von Data Management Lösungen in der Cloud
• Microsoft Certified Systems Expert (MCSE)
• Leitet seit 2006 die PASS Regionalgruppe Karlsruhe
• Unterstützt Microsoft Deutschland als P-TSP im Presales Bereich
• Kontakt: stefan.kirner@inovex.de
Data Factory ist einfach...
Mein Sohn Leo beim Bau seiner ersten
Data Factory!
Es funktioniert!
...die Wirklichkeit ist etwas komplizierter...
Die Agenda:
• Warum Azure Data Factory?
• Beispielszenarien
• Elementare Begriffe
• Mit Data Factories arbeiten
• Live Demo
• Kosten
• Vertiefungen
Warum Azure Data Factory?
Das “traditionelle” Data Warehouse
Data Warehousing verändert sich
Analytische Workflows werden immer komplexer
Announcing Azure Data Factory
Es folgt ein kurzer Reklame-Block ;-)
Data Factory ist Teil der Cortana Analytics Suite
Azure Data Factory ist nicht...
...SSIS in der Cloud!
SSIS Data Factory
Einsatzziel Traditionelles ETL-Tool Orchestrierungsdienst
Skalierbarkeit Für DWH ausreichend Für Big Data gedacht
„Reichweite“ Firmennetzwerk Global in Azure
Art der Software On Prem Software Managed Service
Produktzyklen Lang: Jahre Kurz: Wochen
Beispielszenarien
Lesen der Quelldaten
In Unterordner
Azure Blob Store Copy Activitiy
1:1 Kopieren der
Referenzdatenvom Blob
Store nach SQL Azure
SQL Azure
Wegschreiben der
Referenzdatenin SQL
Azure Tabelle
Beispiel: Laden von Referenzdaten in DB
Azure Blob Store
Lesen der Quelldaten
In Unterordnern auf
Ebene Stunde
HDInsight
Berechnen Aggregation
mit Hive, Logging HDI und
ADF
Azure Blob Store
Wegschreiben der
Aggregationen
In Unterordner auf Ebene
Tag
Copy Activitiy
1:1 Kopieren der
Aggregationen vom Blob
Store nach SQL Azure
SQL Azure
Wegschreiben der
Aggregationen in SQL
Azure Tabelle
Beispiel: Daten-Aggregation mit Hadoop und Laden in DB
Beispiel: Kunden-Profiling & Spiel-Analyse
Copy new users to
blob storage
Join and aggregate
activity per week and
user table
Weekly
Privacy:
Refresh:
Xbox New Users
Game New Users
Game Activity Per
Week
Daily
New User Activity Per Week
Contains PII
Weekly, Mon
by 8AM
Beispiel Kundenprojekt: Azure Consumption Reporting
 Auswertung Azure Consumption nach den unterschiedlichen Hierarchiestufen die im EA Azure Portal
vorgesehen sind: Enrollment Level, Department, Account und Subscriptions
 Schnittstelle ist ein Webservice
 Datengrundlage sind Azure-Abrechnungsdaten
 Security Konzept auf Datenebene
 Pflege der Berechtigungen und Zuordnungen über Web-Apps
Non-Functional Requirement: Nur PaaS Dienste verwenden um Betriebsaufwände auf Kundenseite zu
vermeiden
Architektur
Azure-Billing-API Azure Data Factory Azure DB
Power BI
Azure
Web App
Extract Archive
Standard
reportingRow-level
Security
Manage
Security
SettingsRead +
Write
Manage
Mappings
Leistungs-
verrechnung
Auswertung
Read
Azure AD
Azure Batch + Blob
Store
using
Integrated
Data Factory part
• Sourcing 1x täglich aus Web-Schnittstelle über eigenentwickelte custom .net Activity
• Nutzen von Azure Batch als Compute Knoten und Blob Store als Zwischenspeicher
• Laden nach Azure SQL für Staging und DWH Layer
• Alerting bei Fehlern
Elementare Begriffe
ADF Bausteine
• Linked Service
• Data Store – Speichern und Verarbeiten von Daten (SQL, Storage,...)
• Data Gateway – Verbindung zu On Prem-Daten (On Premises ORACLE,...)
• Compute – Verarbeitung von Daten (Batch, HDInsight, ML,...)
• Data Set
• Datenbeschreibung (Tabelle, Datei,...)
• Activity
• Verarbeitet ein Dataset und erzeugt ein neues Dataset (Copy, Hive, Stored Procedure,...)
• Entweder Data Movement oder Data Transformation
• Pipeline
• Gruppierung von Aktivitäten, die eine bestimmte Aufgabe lösen
• Deployment- & Management-Einheit für Aktivitäten
Wie hängen die Bausteine zusammen?
(Einige) Aktuell vorhandene Bausteine
• Compute Linked Services
• HDInsight
• Azure Batch
• Azure ML
• Azure Data Lake Analytics
• Azure SQL
• Activities
• Copy
• HDInsight (Pig, Hive, ...)
• Azure ML Batch Scoring
• Stored Procedure
• .NET
 Unterstützte Datenquellen
 Azure Blob
 Azure Table
 Azure SQL Database
 Azure SQL Data Warehouse
 Azure DocumentDB
 Azure Data Lake Store
 SQL Server on-premises/Azure IaaS
 File System On-premises/Azure IaaS
 Oracle Database On-premises/Azure IaaS
 MySQL Database On-premises/Azure IaaS
 DB2 Database On-premises/Azure IaaS
 Teradata Database On-premises/Azure IaaS
 Sybase Database On-premises/Azure IaaS
 PostgreSQL Database On-premises/Azure IaaS
Mit Data Factories arbeiten
Warnung: Achtung – Work in Progress!
• „Es liegt nicht an Euch“
• Speziell die Design-Tools haben noch Ihre Macken
z.B. fehlende Möglichkeit Elemente aus einem Visual Studio-Projekt zu löschen
• Verfügbarkeit
• derzeit nur North Europe & West US
• Die Begriffe sind noch nicht „stabil“
• z.B. Dataset (in Doku) vs. „Table“ in Visual Studio
• Die Metadaten-Schemata ändern sich hin und wieder
• „RTFM“ ist schwierig
• die Dokumentation ist ... „übersichtlich“ und gut verteilt
Eine neue Data Factory anlegen
• Neues Portal
• Data > Analytics
• Ressource-Gruppen verwenden
• für bessere Übersicht
• einfachere Security
• Auf die Region achten!
• Die Factory ist ein Container
für Pipes, Data Sets, ...
Tipp: Erste Schritte mit den ADF Beispiel-Pipelines
• Einstieg mit fertigen
Beispielen
• Ressourcen am besten selbst
vorbereiten
• gregsadfsample (Ressource Group)
• gregsadfsamplestorage
• ...sqlserver
• ...sqldatabase
• Und wieder: auf Regionen
achten und Ressource-Gruppen
verwenden!
Im Azure Portal arbeiten
• Factory-Dashboard
• Werkzeuge für das Erstellen der Factory
• Zustandsüberwachung
• Manuelles Starten von Vorgängen
• Auslastung und Diagnosen
• Neu! Erweitertes Monitoring
Ein Element entwerfen & deployen
• das Design ist textbasiert
• JSON-Format
• Für alle Elemente existieren
Schemata
• das heißt tatsächlich häufig
„Design by Copy and Paste“

Übersicht mit dem Diagramm gewinnen
• Das Diagramm zeigt eine Übersicht
über die Factory an
• Es ist kein grafischer Designer
• Das Lineage-Highlighting
vereinfacht die Orientierung
in komplexen Factories
In Visual Studio entwickeln
• Voraussetzung: Azure .NET SDK
ab 2.7 aufwärts
• Visual Studio ab Version 2013
• Syntax-Highlighting erst ab 2015
• Mit dem SDK Setup werden die passenden Projekt-Templates
installiert
• Prozess:
• Offline-Entwurf
• Build
• Deploy
• Monitoring findet im Portal statt
• Einbindung in Source Code-Kontrolle
• Tipp: Save & Build nach jedem neuen Element
Ein Projekt Reverse engineeren
• Im Portal vorhandene Factories
können einfach in ein Projekt
überführt werden
• Server Explorer
• Export Data Factory to New Project
Neue Objekte entwerfen
• Templates enthalten
• Code-Fragemente
• Verweis auf das passende Schema
Von Visual Studio aus publizieren
• in neue oder bestehende
Factory publizieren
• Offline-Projekt wird mit
der Online-Factory verglichen
• zu publizierende oder zu
löschende Elemente können
an- oder abgewählt werden
Ausführung überwachen
• im Portal ADF Dashboard
unter Contents
• am besten unter
Datasets nachschauen
• Infos:
• aktueller Status
• ausgeführte Aktivitäten
• Meldungen
• ..
• in den Slices kann Aktivität neu gestartet werden
• Jetzt gibt’s aber auch die „Monitoring App“
Überwachen und verwalten mit der Monitoring App
• Besteht aus 3 Teilen:
• Resource Explorer
• Monitoring Views
• Alerts
• Debugging der Data Factory über
versch. Ansichten
• Starten von Batches mit abh. Slices
• Anlegen von Email Alerts (detaillierter
als bisher)
Resource Explorer
• Detaillierte Auswertungen über Verläufe,
schön dargestellt
• Drill down in die Pipelines
Resource Explorer zum Restart
Detaillierte Alerts setzen
Kosten
Was kostet denn das eigentlich?
...gar nicht so einfach zu beantworten
• „Die ersten 5 Aktivitäten mit niedriger Auslastung sind ... in einem Monat kostenlos“ - ah, ja...
• Häufigkeitsklassen
• max. 1 X pro Tag: „weniger häufig“. Sonst: „sehr häufig“ (also z.B. 2 X pro Tag ;-) )
• Kosten für Aktivitäten
• ab 100 Aktivitäten/Monat 20% Rabatt
• Data Movement Service (wird in der Quelle gemessen)
• Cloud: €0.2109/h
• On-Premises: €0.0844/h
Weniger häufig Sehr häufig
Cloud €0,506 €0,6747
On-Premises €1,26 €2,1083
Beispiel-Rechnung (Customer Profiling-Szenario)
• Aktivitäten / Monat
• 30 X Copy – 4: 28 On-Prem
• 4 X Join/Aggregate – 4: 0 Cloud
• Data Movement
• User aus dem on Prem SQL Server holen: 30 X 1h
• User aus dem Blog Storage holen: 4 X 0,25h
• Game-Daten aus dem Blob Storage holen: 4 X 5h
• Pro Jahr ca. 500€ für die Factory
Aktivitäten On-Prem 28 €1,26 €35,00
Movement On-Prem 30 €0.0844 €2,50
Movement Cloud 21 €0.2109 €4,40
ca. €42/Monat
Vertiefungen
Zeitplanung
• start/end-Elemente in der Pipeline
• Pipeline steht in diesem Zeitraum prinzipiell zur Verfügung
• Slice
• Zeitscheibe (Intervall) für die Dataset-Verarbeitung
• Frequenz der Generierung kann im Input-Dataset, einer Aktivität, im Output-Dataset definiert sein
• das Output-Dataset gibt den Takt vor
• Aktivität startet, wenn passendes Input Slice vorhanden ist
• Bezeichnung der Zeitplanungs-Elemente
• Dataset: Availability
• Aktivität: Scheduler
• Aufbau dieser Element-Typen ist identisch
Zeitplanungs-Eigenschaften
• "scheduler":
{ "frequency": "Hour", "interval" }
• Intervalle starten um 0 Uhr
• style: StartOfInterval / EndOfInterval
• frequency = Month & style = EndOfInterval:
Letzter Tag im Monat
• anchorDateTime: Zeitpunkt, von dem
aus slices berechnet werden
• z.B. 2015-10-19T08:00:00" }
Zeitplanung in einer Pipeline
• slices können unterschiedlich sein
• Output-Slices und Aktivitäts-Windows müssen
übereinstimmen
• die aktuellen Zeitpunkte
können über Systemvariablen abgefragt werden
• Startdatum in der Vergangenheit
• alle Slices werden automatisch
aufgefüllt
Beispiel: SQL Dataset als Input & Blob als Output
• "availability": { "frequency": "Hour",
"interval": 1 },
• soll zwischen 8h und 11h ergeben:
• mypath/2015/1/1/8/Data.txt
10002345,334,2,2015-01-01 08:24:00.3130000
10002345,347,15,2015-01-01 08:24:00.6570000
10991568,2,7,2015-01-01 08:56:34.5300000
• mypath/2015/1/1/9/Data.txt
10002345,334,1,2015-01-01 09:13:00.3900000
24379245,569,23,2015-01-01 09:25:00.3130000
16777799,21,115,2015-01-01 09:47:34.3130000
Beispiel: Copy Activity für time sliced-SQL Daten
...
"activities": [{
"type": "Copy", "name": "AzureSQLtoBlob", "description": "copy activity",
"typeProperties": {
"source": { "type": "SqlSource",
"sqlReaderQuery": "$$Text.Format(
'SELECT * from MyTable
WHERE timestampcolumn >= '{0:yyyy-MM-dd HH:mm}'
AND timestampcolumn < '{1:yyyy-MM-dd HH:mm}' ',
WindowStart, WindowEnd )" },
"sink": { "type": "BlobSink", "writeBatchSize": 100000, "writeBatchTimeout": "00:05:00" } },
"inputs": [ { "name": "AzureSQLInput" } ],
...
Fazit: Mächtig aber auch strange…hier soll ein Update kommen!
Pig & Hive einsetzen
• HDInsight als Compute Environment
• On-demand Cluster
• BYOC: „Bring your own Cluster“ – bestehender Cluster
• On Demand Cluster als Linked Service
{ "name": "HDInsightOnDemandLinkedService",
"properties": { "type": "HDInsightOnDemand",
"typeProperties": { "clusterSize": 4,
"timeToLive": "00:05:00", "version": "3.1", "osType": "linux",
"linkedServiceName": "MyBlobStore" ...
Hybride Szenarien
• Data Management Gateway
• Erhältlich im Microsoft Download Center
• http://www.microsoft.com/de-de/download/details.aspx?id=39717
• läuft nur unter Windows
• max. ein Gateway auf einem Rechner
• wird auch von Power BI verwendet
• Datenquellen können sich ein Gateway teilen
• ...aber ein Gateway gehört zu einer Factory
Vorhersagepipelines mit Azure ML
• Verwendet veröffentlichtes
Azure ML Scoring Modell
• Scoring via Batch-API
• Auch Re-Training ist möglich
Outlook & Call to action
Roadmap Stand Dez. 2015
Learning Path
https://azure.microsoft.com/en-us/documentation/learning-
paths/data-factory/
• Documentation: azure.com/df
• Samples on GitHub
• Ask questions: MSDN Forum
• Request & vote on new features
• Financial services blueprint
• Case Studies
• Milliman - Actuarial Automation
• Rockwell Automation - Operational Excellence
• Ziosk – Improved Guest Experience & Satisfaction
Call to Action
Ressourcen
• ADF Blog
https://azure.microsoft.com/en-us/blog/tag/azure-data-factory/
• ADF vs. SSIS (PASS Präsentation)
www.sqlpass.org/EventDownload.aspx?suid=3583
• Channel 9 „Data Exposed“ Videos
https://channel9.msdn.com/Shows/Data-Exposed
Azure Data Factory – Data Management für die Cloud

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Clickstream Analysis with Spark
Clickstream Analysis with Spark Clickstream Analysis with Spark
Clickstream Analysis with Spark
 
Data lake vs Data Warehouse: Hybrid Architectures
Data lake vs Data Warehouse: Hybrid ArchitecturesData lake vs Data Warehouse: Hybrid Architectures
Data lake vs Data Warehouse: Hybrid Architectures
 
Trivadis Office365-Azure Case OdA
Trivadis Office365-Azure Case OdATrivadis Office365-Azure Case OdA
Trivadis Office365-Azure Case OdA
 
Data Vault DWH Automation
Data Vault DWH AutomationData Vault DWH Automation
Data Vault DWH Automation
 
Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017
 
Realtime BigData Step by Step mit Lambda, Kafka, Storm und Hadoop
Realtime BigData Step by Step mit Lambda, Kafka, Storm und HadoopRealtime BigData Step by Step mit Lambda, Kafka, Storm und Hadoop
Realtime BigData Step by Step mit Lambda, Kafka, Storm und Hadoop
 
Warum sap hana sql data warehousing
Warum sap hana sql data warehousingWarum sap hana sql data warehousing
Warum sap hana sql data warehousing
 
04 Datenintegration und Verwaltung
04 Datenintegration und Verwaltung04 Datenintegration und Verwaltung
04 Datenintegration und Verwaltung
 
Portfolio 2016
Portfolio 2016Portfolio 2016
Portfolio 2016
 
Daten und Analytics in IBM Bluemix
Daten und Analytics in IBM BluemixDaten und Analytics in IBM Bluemix
Daten und Analytics in IBM Bluemix
 
The cloud 2011
The cloud 2011The cloud 2011
The cloud 2011
 
Data Quadrant - Daten Management Methode
Data Quadrant - Daten Management MethodeData Quadrant - Daten Management Methode
Data Quadrant - Daten Management Methode
 
he Future of SharePoint is Now – Tipps für On-Premise, Cloud oder Hybride Mig...
he Future of SharePoint is Now – Tipps für On-Premise, Cloud oder Hybride Mig...he Future of SharePoint is Now – Tipps für On-Premise, Cloud oder Hybride Mig...
he Future of SharePoint is Now – Tipps für On-Premise, Cloud oder Hybride Mig...
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
 
Dv 20 sdlc_oss_automation
Dv 20 sdlc_oss_automationDv 20 sdlc_oss_automation
Dv 20 sdlc_oss_automation
 
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
Oracle Data Warehouse Integration Builder - Ein Selbstversuch (DOAG 2013)
 
BARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
BARC Studie Webinar: Ausgereifte Analysen mit Apache HadoopBARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
BARC Studie Webinar: Ausgereifte Analysen mit Apache Hadoop
 
SharePoint Community Mittelland - GARAIO : Enterprise Search
SharePoint Community Mittelland - GARAIO : Enterprise SearchSharePoint Community Mittelland - GARAIO : Enterprise Search
SharePoint Community Mittelland - GARAIO : Enterprise Search
 
Oracle ETL Herausforderungen - OPITZ CONSULTING - Till Sander - Wolfgang Rütter
Oracle ETL Herausforderungen - OPITZ CONSULTING - Till Sander - Wolfgang RütterOracle ETL Herausforderungen - OPITZ CONSULTING - Till Sander - Wolfgang Rütter
Oracle ETL Herausforderungen - OPITZ CONSULTING - Till Sander - Wolfgang Rütter
 
SharePoint Community Mittelland @ isolutions: SharePoint in der Cloud
SharePoint Community Mittelland @ isolutions: SharePoint in der CloudSharePoint Community Mittelland @ isolutions: SharePoint in der Cloud
SharePoint Community Mittelland @ isolutions: SharePoint in der Cloud
 

Destaque

PHPの仕事と学びin仙台_WindowsAzure概説_20130921
PHPの仕事と学びin仙台_WindowsAzure概説_20130921PHPの仕事と学びin仙台_WindowsAzure概説_20130921
PHPの仕事と学びin仙台_WindowsAzure概説_20130921
Ayako Omori
 
JAWSUG & JAZUG Sendai Azure Update 20140517
JAWSUG & JAZUG Sendai Azure Update 20140517JAWSUG & JAZUG Sendai Azure Update 20140517
JAWSUG & JAZUG Sendai Azure Update 20140517
Ayako Omori
 

Destaque (20)

JAZUG Nagoya Azure Update 20140607
JAZUG Nagoya Azure Update 20140607JAZUG Nagoya Azure Update 20140607
JAZUG Nagoya Azure Update 20140607
 
PHPの仕事と学びin仙台_WindowsAzure概説_20130921
PHPの仕事と学びin仙台_WindowsAzure概説_20130921PHPの仕事と学びin仙台_WindowsAzure概説_20130921
PHPの仕事と学びin仙台_WindowsAzure概説_20130921
 
JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301
 
Welcome to Hour of Code 20151202
Welcome to Hour of Code 20151202Welcome to Hour of Code 20151202
Welcome to Hour of Code 20151202
 
JAZUG Sendai Windows Azure Update 20131109
JAZUG Sendai Windows Azure Update 20131109JAZUG Sendai Windows Azure Update 20131109
JAZUG Sendai Windows Azure Update 20131109
 
Microsoft Azure Update 20151112
Microsoft Azure Update 20151112Microsoft Azure Update 20151112
Microsoft Azure Update 20151112
 
JAWSUG & JAZUG Sendai Azure Update 20140517
JAWSUG & JAZUG Sendai Azure Update 20140517JAWSUG & JAZUG Sendai Azure Update 20140517
JAWSUG & JAZUG Sendai Azure Update 20140517
 
JAZUG Nagoya Bar Azure #2 Japan DC 20140331
JAZUG Nagoya Bar Azure #2 Japan DC 20140331JAZUG Nagoya Bar Azure #2 Japan DC 20140331
JAZUG Nagoya Bar Azure #2 Japan DC 20140331
 
TDC Presentation Basics 20131108
TDC Presentation Basics 20131108TDC Presentation Basics 20131108
TDC Presentation Basics 20131108
 
Go azure おばかIoT シンポジウム
Go azure おばかIoT シンポジウムGo azure おばかIoT シンポジウム
Go azure おばかIoT シンポジウム
 
IoTのIを考えてみる話
IoTのIを考えてみる話IoTのIを考えてみる話
IoTのIを考えてみる話
 
20150421 QCon Tokyo 2015 Azureが切り開く新時代のソフトウェア開発・設計
20150421 QCon Tokyo 2015 Azureが切り開く新時代のソフトウェア開発・設計20150421 QCon Tokyo 2015 Azureが切り開く新時代のソフトウェア開発・設計
20150421 QCon Tokyo 2015 Azureが切り開く新時代のソフトウェア開発・設計
 
NoSQL Bigtable and Azure Table
NoSQL Bigtable and Azure TableNoSQL Bigtable and Azure Table
NoSQL Bigtable and Azure Table
 
KIXS Vol.000: Microsoft Cognitive Services 入門 & Azure サーバー管理ツール
KIXS Vol.000: Microsoft Cognitive Services 入門 & Azure サーバー管理ツールKIXS Vol.000: Microsoft Cognitive Services 入門 & Azure サーバー管理ツール
KIXS Vol.000: Microsoft Cognitive Services 入門 & Azure サーバー管理ツール
 
Microsoft Azure で スマホからIoTまで
Microsoft AzureでスマホからIoTまでMicrosoft AzureでスマホからIoTまで
Microsoft Azure で スマホからIoTまで
 
Microsoft Azure EventHubで始めるIoT
Microsoft Azure EventHubで始めるIoTMicrosoft Azure EventHubで始めるIoT
Microsoft Azure EventHubで始めるIoT
 
OSS/linux on Azureの活用方法と勘所
OSS/linux on Azureの活用方法と勘所OSS/linux on Azureの活用方法と勘所
OSS/linux on Azureの活用方法と勘所
 
AWS IoT を使う上での Next Step!!
AWS IoT を使う上での Next Step!!AWS IoT を使う上での Next Step!!
AWS IoT を使う上での Next Step!!
 
渋谷モノ系ミートアップ Watanabe p
渋谷モノ系ミートアップ Watanabe p渋谷モノ系ミートアップ Watanabe p
渋谷モノ系ミートアップ Watanabe p
 
Embedded Technology 2014 Smart Japan Aliance IoT Azure
Embedded Technology 2014 Smart Japan Aliance IoT AzureEmbedded Technology 2014 Smart Japan Aliance IoT Azure
Embedded Technology 2014 Smart Japan Aliance IoT Azure
 

Semelhante a Azure Data Factory – Data Management für die Cloud

Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...
Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...
Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...
Michael Kirst-Neshva
 
Best Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL InstallationBest Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL Installation
Samuel Zürcher
 
SharePoint Community Mittelland: Fit für Office 365
SharePoint Community Mittelland: Fit für Office 365SharePoint Community Mittelland: Fit für Office 365
SharePoint Community Mittelland: Fit für Office 365
David Schneider
 

Semelhante a Azure Data Factory – Data Management für die Cloud (20)

Einführung in Microsoft Azure und seine Funktionalitäten
Einführung in Microsoft Azure und seine FunktionalitätenEinführung in Microsoft Azure und seine Funktionalitäten
Einführung in Microsoft Azure und seine Funktionalitäten
 
Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...
Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...
Hybrid cloud iaa-s_office-365-azure_sharepoint-konferenz-wien-2013_ankbs_mich...
 
Spontan testen! Das eigene Test Lab, für jeden in der Cloud!
Spontan testen! Das eigene Test Lab, für jeden in der Cloud!Spontan testen! Das eigene Test Lab, für jeden in der Cloud!
Spontan testen! Das eigene Test Lab, für jeden in der Cloud!
 
skilllocation Foliensatz zu Microsoft Azure
skilllocation Foliensatz zu Microsoft Azureskilllocation Foliensatz zu Microsoft Azure
skilllocation Foliensatz zu Microsoft Azure
 
Automatische Erstellung einer SharePoint 2013 Entwicklungsumgebung in Microso...
Automatische Erstellung einer SharePoint 2013 Entwicklungsumgebung in Microso...Automatische Erstellung einer SharePoint 2013 Entwicklungsumgebung in Microso...
Automatische Erstellung einer SharePoint 2013 Entwicklungsumgebung in Microso...
 
Azure WorkshopPart1 Intro
Azure WorkshopPart1   IntroAzure WorkshopPart1   Intro
Azure WorkshopPart1 Intro
 
Azure für SysAdmins Eine Reise durch die Cloud v.0.5
Azure für SysAdmins   Eine Reise durch die Cloud v.0.5 Azure für SysAdmins   Eine Reise durch die Cloud v.0.5
Azure für SysAdmins Eine Reise durch die Cloud v.0.5
 
Startimpuls at Microsoft w/ IFJ
Startimpuls at Microsoft w/ IFJStartimpuls at Microsoft w/ IFJ
Startimpuls at Microsoft w/ IFJ
 
Oracle-DB: Panorama-Sampler - Eigenes Workload Repository für Panorama
Oracle-DB: Panorama-Sampler - Eigenes Workload Repository für PanoramaOracle-DB: Panorama-Sampler - Eigenes Workload Repository für Panorama
Oracle-DB: Panorama-Sampler - Eigenes Workload Repository für Panorama
 
Oracle Database 12c Release 2
Oracle Database 12c Release 2 Oracle Database 12c Release 2
Oracle Database 12c Release 2
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2
 
Best Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL InstallationBest Practices SharePoint and SQL Installation
Best Practices SharePoint and SQL Installation
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios Workshop
 
SharePoint Community Mittelland: Fit für Office 365
SharePoint Community Mittelland: Fit für Office 365SharePoint Community Mittelland: Fit für Office 365
SharePoint Community Mittelland: Fit für Office 365
 
SaaS Web 2.0 Aktivitaetenmanagement
SaaS Web 2.0 AktivitaetenmanagementSaaS Web 2.0 Aktivitaetenmanagement
SaaS Web 2.0 Aktivitaetenmanagement
 
Cloud Deployment und (Auto)Scaling am Beispiel von Angrybird
Cloud Deployment und (Auto)Scaling am Beispiel von AngrybirdCloud Deployment und (Auto)Scaling am Beispiel von Angrybird
Cloud Deployment und (Auto)Scaling am Beispiel von Angrybird
 
Desktop Containers 12: Next Generation of ZENworks Application Virtualization
Desktop Containers 12: Next Generation of ZENworks Application VirtualizationDesktop Containers 12: Next Generation of ZENworks Application Virtualization
Desktop Containers 12: Next Generation of ZENworks Application Virtualization
 
Unternehmensanwendungen auf AWS - Oracle, SAP, Microsoft
Unternehmensanwendungen auf AWS - Oracle, SAP, MicrosoftUnternehmensanwendungen auf AWS - Oracle, SAP, Microsoft
Unternehmensanwendungen auf AWS - Oracle, SAP, Microsoft
 
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
Warum Monitoring und warum Icinga 2 (Webinar vom 04.12.2013)
 
Performance-Analyse von Oracle-Datenbanken mit Panorama
Performance-Analyse von Oracle-Datenbanken mit PanoramaPerformance-Analyse von Oracle-Datenbanken mit Panorama
Performance-Analyse von Oracle-Datenbanken mit Panorama
 

Mais de inovex GmbH

Interpretable Machine Learning
Interpretable Machine LearningInterpretable Machine Learning
Interpretable Machine Learning
inovex GmbH
 
Deep Learning for Recommender Systems
Deep Learning for Recommender SystemsDeep Learning for Recommender Systems
Deep Learning for Recommender Systems
inovex GmbH
 
Representation Learning von Zeitreihen
Representation Learning von ZeitreihenRepresentation Learning von Zeitreihen
Representation Learning von Zeitreihen
inovex GmbH
 
Performance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use casePerformance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use case
inovex GmbH
 

Mais de inovex GmbH (20)

lldb – Debugger auf Abwegen
lldb – Debugger auf Abwegenlldb – Debugger auf Abwegen
lldb – Debugger auf Abwegen
 
Are you sure about that?! Uncertainty Quantification in AI
Are you sure about that?! Uncertainty Quantification in AIAre you sure about that?! Uncertainty Quantification in AI
Are you sure about that?! Uncertainty Quantification in AI
 
Why natural language is next step in the AI evolution
Why natural language is next step in the AI evolutionWhy natural language is next step in the AI evolution
Why natural language is next step in the AI evolution
 
WWDC 2019 Recap
WWDC 2019 RecapWWDC 2019 Recap
WWDC 2019 Recap
 
Network Policies
Network PoliciesNetwork Policies
Network Policies
 
Interpretable Machine Learning
Interpretable Machine LearningInterpretable Machine Learning
Interpretable Machine Learning
 
Jenkins X – CI/CD in wolkigen Umgebungen
Jenkins X – CI/CD in wolkigen UmgebungenJenkins X – CI/CD in wolkigen Umgebungen
Jenkins X – CI/CD in wolkigen Umgebungen
 
AI auf Edge-Geraeten
AI auf Edge-GeraetenAI auf Edge-Geraeten
AI auf Edge-Geraeten
 
Prometheus on Kubernetes
Prometheus on KubernetesPrometheus on Kubernetes
Prometheus on Kubernetes
 
Deep Learning for Recommender Systems
Deep Learning for Recommender SystemsDeep Learning for Recommender Systems
Deep Learning for Recommender Systems
 
Azure IoT Edge
Azure IoT EdgeAzure IoT Edge
Azure IoT Edge
 
Representation Learning von Zeitreihen
Representation Learning von ZeitreihenRepresentation Learning von Zeitreihen
Representation Learning von Zeitreihen
 
Talk to me – Chatbots und digitale Assistenten
Talk to me – Chatbots und digitale AssistentenTalk to me – Chatbots und digitale Assistenten
Talk to me – Chatbots und digitale Assistenten
 
Künstlich intelligent?
Künstlich intelligent?Künstlich intelligent?
Künstlich intelligent?
 
Dev + Ops = Go
Dev + Ops = GoDev + Ops = Go
Dev + Ops = Go
 
Das Android Open Source Project
Das Android Open Source ProjectDas Android Open Source Project
Das Android Open Source Project
 
Machine Learning Interpretability
Machine Learning InterpretabilityMachine Learning Interpretability
Machine Learning Interpretability
 
Performance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use casePerformance evaluation of GANs in a semisupervised OCR use case
Performance evaluation of GANs in a semisupervised OCR use case
 
People & Products – Lessons learned from the daily IT madness
People & Products – Lessons learned from the daily IT madnessPeople & Products – Lessons learned from the daily IT madness
People & Products – Lessons learned from the daily IT madness
 
Infrastructure as (real) Code – Manage your K8s resources with Pulumi
Infrastructure as (real) Code – Manage your K8s resources with PulumiInfrastructure as (real) Code – Manage your K8s resources with Pulumi
Infrastructure as (real) Code – Manage your K8s resources with Pulumi
 

Azure Data Factory – Data Management für die Cloud

  • 1. Azure Data Factory – Data Management für die Cloud Stefan Kirner
  • 2. Speaker Bio: Stefan Kirner • Teamleiter BI Solutions bei der inovex GmbH • Erfahrung mit Microsoft BI Stack seit SQL Server 2000 • Entwicklung von Data Management Lösungen in der Cloud • Microsoft Certified Systems Expert (MCSE) • Leitet seit 2006 die PASS Regionalgruppe Karlsruhe • Unterstützt Microsoft Deutschland als P-TSP im Presales Bereich • Kontakt: stefan.kirner@inovex.de
  • 3. Data Factory ist einfach... Mein Sohn Leo beim Bau seiner ersten Data Factory!
  • 5. ...die Wirklichkeit ist etwas komplizierter... Die Agenda: • Warum Azure Data Factory? • Beispielszenarien • Elementare Begriffe • Mit Data Factories arbeiten • Live Demo • Kosten • Vertiefungen
  • 6. Warum Azure Data Factory?
  • 10. Announcing Azure Data Factory Es folgt ein kurzer Reklame-Block ;-)
  • 11. Data Factory ist Teil der Cortana Analytics Suite
  • 12. Azure Data Factory ist nicht... ...SSIS in der Cloud! SSIS Data Factory Einsatzziel Traditionelles ETL-Tool Orchestrierungsdienst Skalierbarkeit Für DWH ausreichend Für Big Data gedacht „Reichweite“ Firmennetzwerk Global in Azure Art der Software On Prem Software Managed Service Produktzyklen Lang: Jahre Kurz: Wochen
  • 14. Lesen der Quelldaten In Unterordner Azure Blob Store Copy Activitiy 1:1 Kopieren der Referenzdatenvom Blob Store nach SQL Azure SQL Azure Wegschreiben der Referenzdatenin SQL Azure Tabelle Beispiel: Laden von Referenzdaten in DB
  • 15. Azure Blob Store Lesen der Quelldaten In Unterordnern auf Ebene Stunde HDInsight Berechnen Aggregation mit Hive, Logging HDI und ADF Azure Blob Store Wegschreiben der Aggregationen In Unterordner auf Ebene Tag Copy Activitiy 1:1 Kopieren der Aggregationen vom Blob Store nach SQL Azure SQL Azure Wegschreiben der Aggregationen in SQL Azure Tabelle Beispiel: Daten-Aggregation mit Hadoop und Laden in DB
  • 16. Beispiel: Kunden-Profiling & Spiel-Analyse Copy new users to blob storage Join and aggregate activity per week and user table Weekly Privacy: Refresh: Xbox New Users Game New Users Game Activity Per Week Daily New User Activity Per Week Contains PII Weekly, Mon by 8AM
  • 17. Beispiel Kundenprojekt: Azure Consumption Reporting  Auswertung Azure Consumption nach den unterschiedlichen Hierarchiestufen die im EA Azure Portal vorgesehen sind: Enrollment Level, Department, Account und Subscriptions  Schnittstelle ist ein Webservice  Datengrundlage sind Azure-Abrechnungsdaten  Security Konzept auf Datenebene  Pflege der Berechtigungen und Zuordnungen über Web-Apps Non-Functional Requirement: Nur PaaS Dienste verwenden um Betriebsaufwände auf Kundenseite zu vermeiden
  • 18. Architektur Azure-Billing-API Azure Data Factory Azure DB Power BI Azure Web App Extract Archive Standard reportingRow-level Security Manage Security SettingsRead + Write Manage Mappings Leistungs- verrechnung Auswertung Read Azure AD Azure Batch + Blob Store using Integrated
  • 19. Data Factory part • Sourcing 1x täglich aus Web-Schnittstelle über eigenentwickelte custom .net Activity • Nutzen von Azure Batch als Compute Knoten und Blob Store als Zwischenspeicher • Laden nach Azure SQL für Staging und DWH Layer • Alerting bei Fehlern
  • 21. ADF Bausteine • Linked Service • Data Store – Speichern und Verarbeiten von Daten (SQL, Storage,...) • Data Gateway – Verbindung zu On Prem-Daten (On Premises ORACLE,...) • Compute – Verarbeitung von Daten (Batch, HDInsight, ML,...) • Data Set • Datenbeschreibung (Tabelle, Datei,...) • Activity • Verarbeitet ein Dataset und erzeugt ein neues Dataset (Copy, Hive, Stored Procedure,...) • Entweder Data Movement oder Data Transformation • Pipeline • Gruppierung von Aktivitäten, die eine bestimmte Aufgabe lösen • Deployment- & Management-Einheit für Aktivitäten
  • 22. Wie hängen die Bausteine zusammen?
  • 23. (Einige) Aktuell vorhandene Bausteine • Compute Linked Services • HDInsight • Azure Batch • Azure ML • Azure Data Lake Analytics • Azure SQL • Activities • Copy • HDInsight (Pig, Hive, ...) • Azure ML Batch Scoring • Stored Procedure • .NET  Unterstützte Datenquellen  Azure Blob  Azure Table  Azure SQL Database  Azure SQL Data Warehouse  Azure DocumentDB  Azure Data Lake Store  SQL Server on-premises/Azure IaaS  File System On-premises/Azure IaaS  Oracle Database On-premises/Azure IaaS  MySQL Database On-premises/Azure IaaS  DB2 Database On-premises/Azure IaaS  Teradata Database On-premises/Azure IaaS  Sybase Database On-premises/Azure IaaS  PostgreSQL Database On-premises/Azure IaaS
  • 24. Mit Data Factories arbeiten
  • 25. Warnung: Achtung – Work in Progress! • „Es liegt nicht an Euch“ • Speziell die Design-Tools haben noch Ihre Macken z.B. fehlende Möglichkeit Elemente aus einem Visual Studio-Projekt zu löschen • Verfügbarkeit • derzeit nur North Europe & West US • Die Begriffe sind noch nicht „stabil“ • z.B. Dataset (in Doku) vs. „Table“ in Visual Studio • Die Metadaten-Schemata ändern sich hin und wieder • „RTFM“ ist schwierig • die Dokumentation ist ... „übersichtlich“ und gut verteilt
  • 26. Eine neue Data Factory anlegen • Neues Portal • Data > Analytics • Ressource-Gruppen verwenden • für bessere Übersicht • einfachere Security • Auf die Region achten! • Die Factory ist ein Container für Pipes, Data Sets, ...
  • 27. Tipp: Erste Schritte mit den ADF Beispiel-Pipelines • Einstieg mit fertigen Beispielen • Ressourcen am besten selbst vorbereiten • gregsadfsample (Ressource Group) • gregsadfsamplestorage • ...sqlserver • ...sqldatabase • Und wieder: auf Regionen achten und Ressource-Gruppen verwenden!
  • 28. Im Azure Portal arbeiten • Factory-Dashboard • Werkzeuge für das Erstellen der Factory • Zustandsüberwachung • Manuelles Starten von Vorgängen • Auslastung und Diagnosen • Neu! Erweitertes Monitoring
  • 29. Ein Element entwerfen & deployen • das Design ist textbasiert • JSON-Format • Für alle Elemente existieren Schemata • das heißt tatsächlich häufig „Design by Copy and Paste“ 
  • 30. Übersicht mit dem Diagramm gewinnen • Das Diagramm zeigt eine Übersicht über die Factory an • Es ist kein grafischer Designer • Das Lineage-Highlighting vereinfacht die Orientierung in komplexen Factories
  • 31. In Visual Studio entwickeln • Voraussetzung: Azure .NET SDK ab 2.7 aufwärts • Visual Studio ab Version 2013 • Syntax-Highlighting erst ab 2015 • Mit dem SDK Setup werden die passenden Projekt-Templates installiert • Prozess: • Offline-Entwurf • Build • Deploy • Monitoring findet im Portal statt • Einbindung in Source Code-Kontrolle • Tipp: Save & Build nach jedem neuen Element
  • 32. Ein Projekt Reverse engineeren • Im Portal vorhandene Factories können einfach in ein Projekt überführt werden • Server Explorer • Export Data Factory to New Project
  • 33. Neue Objekte entwerfen • Templates enthalten • Code-Fragemente • Verweis auf das passende Schema
  • 34. Von Visual Studio aus publizieren • in neue oder bestehende Factory publizieren • Offline-Projekt wird mit der Online-Factory verglichen • zu publizierende oder zu löschende Elemente können an- oder abgewählt werden
  • 35. Ausführung überwachen • im Portal ADF Dashboard unter Contents • am besten unter Datasets nachschauen • Infos: • aktueller Status • ausgeführte Aktivitäten • Meldungen • .. • in den Slices kann Aktivität neu gestartet werden • Jetzt gibt’s aber auch die „Monitoring App“
  • 36. Überwachen und verwalten mit der Monitoring App • Besteht aus 3 Teilen: • Resource Explorer • Monitoring Views • Alerts • Debugging der Data Factory über versch. Ansichten • Starten von Batches mit abh. Slices • Anlegen von Email Alerts (detaillierter als bisher)
  • 37.
  • 38. Resource Explorer • Detaillierte Auswertungen über Verläufe, schön dargestellt • Drill down in die Pipelines
  • 42. Was kostet denn das eigentlich? ...gar nicht so einfach zu beantworten • „Die ersten 5 Aktivitäten mit niedriger Auslastung sind ... in einem Monat kostenlos“ - ah, ja... • Häufigkeitsklassen • max. 1 X pro Tag: „weniger häufig“. Sonst: „sehr häufig“ (also z.B. 2 X pro Tag ;-) ) • Kosten für Aktivitäten • ab 100 Aktivitäten/Monat 20% Rabatt • Data Movement Service (wird in der Quelle gemessen) • Cloud: €0.2109/h • On-Premises: €0.0844/h Weniger häufig Sehr häufig Cloud €0,506 €0,6747 On-Premises €1,26 €2,1083
  • 43. Beispiel-Rechnung (Customer Profiling-Szenario) • Aktivitäten / Monat • 30 X Copy – 4: 28 On-Prem • 4 X Join/Aggregate – 4: 0 Cloud • Data Movement • User aus dem on Prem SQL Server holen: 30 X 1h • User aus dem Blog Storage holen: 4 X 0,25h • Game-Daten aus dem Blob Storage holen: 4 X 5h • Pro Jahr ca. 500€ für die Factory Aktivitäten On-Prem 28 €1,26 €35,00 Movement On-Prem 30 €0.0844 €2,50 Movement Cloud 21 €0.2109 €4,40 ca. €42/Monat
  • 45. Zeitplanung • start/end-Elemente in der Pipeline • Pipeline steht in diesem Zeitraum prinzipiell zur Verfügung • Slice • Zeitscheibe (Intervall) für die Dataset-Verarbeitung • Frequenz der Generierung kann im Input-Dataset, einer Aktivität, im Output-Dataset definiert sein • das Output-Dataset gibt den Takt vor • Aktivität startet, wenn passendes Input Slice vorhanden ist • Bezeichnung der Zeitplanungs-Elemente • Dataset: Availability • Aktivität: Scheduler • Aufbau dieser Element-Typen ist identisch
  • 46. Zeitplanungs-Eigenschaften • "scheduler": { "frequency": "Hour", "interval" } • Intervalle starten um 0 Uhr • style: StartOfInterval / EndOfInterval • frequency = Month & style = EndOfInterval: Letzter Tag im Monat • anchorDateTime: Zeitpunkt, von dem aus slices berechnet werden • z.B. 2015-10-19T08:00:00" }
  • 47. Zeitplanung in einer Pipeline • slices können unterschiedlich sein • Output-Slices und Aktivitäts-Windows müssen übereinstimmen • die aktuellen Zeitpunkte können über Systemvariablen abgefragt werden • Startdatum in der Vergangenheit • alle Slices werden automatisch aufgefüllt
  • 48. Beispiel: SQL Dataset als Input & Blob als Output • "availability": { "frequency": "Hour", "interval": 1 }, • soll zwischen 8h und 11h ergeben: • mypath/2015/1/1/8/Data.txt 10002345,334,2,2015-01-01 08:24:00.3130000 10002345,347,15,2015-01-01 08:24:00.6570000 10991568,2,7,2015-01-01 08:56:34.5300000 • mypath/2015/1/1/9/Data.txt 10002345,334,1,2015-01-01 09:13:00.3900000 24379245,569,23,2015-01-01 09:25:00.3130000 16777799,21,115,2015-01-01 09:47:34.3130000
  • 49. Beispiel: Copy Activity für time sliced-SQL Daten ... "activities": [{ "type": "Copy", "name": "AzureSQLtoBlob", "description": "copy activity", "typeProperties": { "source": { "type": "SqlSource", "sqlReaderQuery": "$$Text.Format( 'SELECT * from MyTable WHERE timestampcolumn >= '{0:yyyy-MM-dd HH:mm}' AND timestampcolumn < '{1:yyyy-MM-dd HH:mm}' ', WindowStart, WindowEnd )" }, "sink": { "type": "BlobSink", "writeBatchSize": 100000, "writeBatchTimeout": "00:05:00" } }, "inputs": [ { "name": "AzureSQLInput" } ], ... Fazit: Mächtig aber auch strange…hier soll ein Update kommen!
  • 50. Pig & Hive einsetzen • HDInsight als Compute Environment • On-demand Cluster • BYOC: „Bring your own Cluster“ – bestehender Cluster • On Demand Cluster als Linked Service { "name": "HDInsightOnDemandLinkedService", "properties": { "type": "HDInsightOnDemand", "typeProperties": { "clusterSize": 4, "timeToLive": "00:05:00", "version": "3.1", "osType": "linux", "linkedServiceName": "MyBlobStore" ...
  • 51. Hybride Szenarien • Data Management Gateway • Erhältlich im Microsoft Download Center • http://www.microsoft.com/de-de/download/details.aspx?id=39717 • läuft nur unter Windows • max. ein Gateway auf einem Rechner • wird auch von Power BI verwendet • Datenquellen können sich ein Gateway teilen • ...aber ein Gateway gehört zu einer Factory
  • 52. Vorhersagepipelines mit Azure ML • Verwendet veröffentlichtes Azure ML Scoring Modell • Scoring via Batch-API • Auch Re-Training ist möglich
  • 53. Outlook & Call to action
  • 56. • Documentation: azure.com/df • Samples on GitHub • Ask questions: MSDN Forum • Request & vote on new features • Financial services blueprint • Case Studies • Milliman - Actuarial Automation • Rockwell Automation - Operational Excellence • Ziosk – Improved Guest Experience & Satisfaction Call to Action
  • 57. Ressourcen • ADF Blog https://azure.microsoft.com/en-us/blog/tag/azure-data-factory/ • ADF vs. SSIS (PASS Präsentation) www.sqlpass.org/EventDownload.aspx?suid=3583 • Channel 9 „Data Exposed“ Videos https://channel9.msdn.com/Shows/Data-Exposed