SlideShare uma empresa Scribd logo
PASS Community
November 2015
SQL Server Heterogêneo
SQL Server + BigData
PASS Chapter Leader
Rodrigo Ramos Dornel
“Dornel”
MTAC Lead da Região SUL
Professor Universitário
Mais de 10 anos como consultor em SQL
Server
MCT e MCSA
RDornel Data Platform Experts
Upcoming SQLSaturdays
South America International
• Novembro, 21em Brasília
• http://www.sqlsaturday.com/469/eventhome.aspx
• Abril, 09 Joinville (2016)
• http://www.sqlsaturday.com/488/eventhome.aspx
Visit www.sqlsaturday.com to
register for a event near you!
Local Chapter - MCITPSC
http://www.mcitpsc.com.br - @mcitpsc
Agenda
Introdução XML JSON
PolyBase SISS
6
Introdução
Porque banco de dados Heterogêneo?
• XML
• SQL + NoSQL
• Hadoop
• MapReduce
• HDFS
• Hive
• DocumentDB
7
Introdução
XML
• O que é XML
• Linguagem de marcação
• Capaz de descrever diversos tipos de dados. Seu
propósito principal é a facilidade de
compartilhamento de informações através da
internet.
8
Introdução
Onde tudo começou
• Alterou alguns paradigmas de banco de dados
• Primeira experiência com dados não estruturados
• Introdução do tipo de dados XML
9
Introdução
• SQL + NoSQL
• SQL, fortemente ligado ao mundo relacional,
consultas bem definidas, esquemas rígidos e ACID.
• NoSQL, termo genérico para uma classe definida de
banco de dados não-relacionais. Não apresenta
estrutura rígida, alguns chamam de livre de esquema,
pouco ou nenhum controle ACID.
1
0
Introdução
• SQL + NoSQL
• NoSQL, extremamente orientado a solução, ou seja,
flexível, escalável e customizado.
• Trabalhar em arquitetura em nuvem e escalabilidade
horizontal.
1
1
Introdução
• Hadoop
• Plataforma feita em Java para processamento
distribuído de grandes massas de dados.
• Basicamente composto pelo HDFS, Yarn e
MapReduce.
• Projeto é mantido pela fundação Apache.
• Para nós o mais familiar ou conhecido é o HDInsight
feito pela Hortomworks para a Microsoft.
• Azure ou Local (só um nó)
1
2
Introdução
• HDFS
• Sistemas de arquivos feito para rodar em hardware
básico.
• Feito para trabalhar com grandes quantidades de
dados.
• Tolerante a falha.
• Não leva em consideração aspectos tradicionais de
acesso a dados e sim um estilo de acesso como um
streaming de dados.
1
3
Introdução
1
4
Introdução
• MapReduce
• MapReduce é um modelo de programação
desenhado para processar grandes volumes de dados
em paralelo, dividindo o trabalho em um conjunto de
tarefas independentes
1
5
Introdução
1
6
Introdução
• Hive
• Basicamente uma infraestrutura de datawarehouse
para rodar no topo da arquitetura do Hadoop para
oferecer sumarização dos dados, consultas e análise.
• Ele oferece uma linguagem SQL-like chamada de
HiveQL com leitura e esquemas que permitem que
consultemos os dados MapReduce como se
consultássemos banco tradicionais.
• Por causa dessa bendita possibilidade que estamos
aqui Hoje .
1
7
Introdução
• DocumentDB
• É o banco de dados da Microsoft para JSON e
JavaScript (Java Script Object Notation).
• No site do DocumentDB ele comenta que é possível
fazer consultas parecidas com SQL ou usar UDF,
funções para essas conversões.
• Seria o concorrente da Microsoft para o mongoDB
1
8
Introdução
• DocumentDB
1
9
XML
• SQL Server e XML
• Introduzido na versão 2005.
• Possibilita transformar linhas do banco de dados em
fragmentos de XML.
• Permite carregar e armazenar dados XML dentro SQL
Server.
• Usa a linguagem XQuery para manipular dados
dentro do XML, baseado em expressões XPath
(árvore do XML, navegação).
2
0
XML
• Demo
• XML Auto
• XQuery
• XQuery Update
2
1
JSON
• DocumentDB
• O DocumentDB do Azure é um serviço de banco de
dados de documento NoSQL projetado desde o início
para suportar, de forma nativa, JSON e JavaScript
diretamente dentro do mecanismo de banco de
dados.
2
2
JSON
• JSON e o SQL Server 2016
• JSON Auto, cria uma hierarquia automaticamente
• JSON Path, você especifica as hierarquias
• ISJSON(), valida se a coluna está no padrão JSON
• JSON_QUERY() “SUB CONSULTA”
• JSON_VALUE(), retorna o valor do nó
• JSON_MODIFY()???
• OPENJSON(), carrega um campo “texto” convertendo
ele para JSON. OPENJSON é uma função (TVF),
imagina um CAST ou CONVERT.
• INCLUDE_NULL_VALUES
2
3
JSON
• JSON e o SQL Server 2016
• Indexação
• ALTER TABLE Sales.SalesOrder_json
• ADD vCustomerName AS JSON_VALUE(Info,
'$.Customer.Name')
• CREATE INDEX idx_SalesOrder_json_CustomerName
• ON Sales.SalesOrder_json(vCustomerName)
• Ou crie um índice Full Text!!!
CREATE FULLTEXT INDEX ON Person.Person_json(EmailAddresses)
KEY INDEX PK_Person_json_PersonID
ON jsonFullTextCatalog;
GO
2
4
JSON
• Demo
• JSON AUTO e PATH
2
5
PolyBase
O que é PolyBase?
• A tecnologia PolyBase permite consultar e unir dados
de várias fontes, tudo usando os comandos Transact-
SQL.
2
6
PolyBase
O que é PolyBase?
2
7
PolyBase
O que é PolyBase?
• Fonte de dados Externa, Hadoop, Azure Blob.
• Definição de como os dados estão organizados, ou
seja, separadores de colunas.
• Um esquema que represente esses dados, colunas,
tipos de dados e localização desse arquivo dentro do
seu sistema de arquivos.
• Necessário ter o Java JDK antes de instalar e/ou pode
ser interessante instalar um drive ODBC para Hive.
2
8
PolyBase
O que é PolyBase?
• Fonte de dados Externa, Hortomworks.
• Definição dos dados
• Localização dele no File System
2
9
PolyBase
• Demo
• Criar o Source, File, Table
• ODBC, OpenQuery
• Azure Blob
3
0
SSIS
• Pacote de Integração SSIS + HDInsight + Azure Blob
• Conjunto de ferramentas para conexão e tarefas
dentro do SSIS.
• Demo
• Azure Blob Upload.
3
1
SSIS
3
2
Quem vai cuidar disso tudo?
Você mesmo belesão!!!
Stay Involved!
• Sign up for a free membership today at sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
• @rdornel
• rodrigodornel@gmail.com

Mais conteúdo relacionado

Mais procurados

Monitorando seu ambiente SQL server com o Power BI
Monitorando seu ambiente SQL server com o Power BIMonitorando seu ambiente SQL server com o Power BI
Monitorando seu ambiente SQL server com o Power BI
Dirceu Resende
 
Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015
Douglas Romão
 
Power BI: DirectQuery, Live Connection e Import
Power BI: DirectQuery, Live Connection e ImportPower BI: DirectQuery, Live Connection e Import
Power BI: DirectQuery, Live Connection e Import
Dirceu Resende
 
SQL Day 2016 - SQL Server x Oracle
SQL Day 2016 - SQL Server x OracleSQL Day 2016 - SQL Server x Oracle
SQL Day 2016 - SQL Server x Oracle
Flávio Farias
 
Escolhendo entre SharePoint e ASP.NET
Escolhendo entre SharePoint e ASP.NETEscolhendo entre SharePoint e ASP.NET
Escolhendo entre SharePoint e ASP.NET
Wagner Amorim
 
Carreira na Plataforma de Dados da Microsoft
Carreira na Plataforma de Dados da MicrosoftCarreira na Plataforma de Dados da Microsoft
Carreira na Plataforma de Dados da Microsoft
Flávio Farias
 
Curso de SQL e Banco de Dados
Curso de SQL e Banco de DadosCurso de SQL e Banco de Dados
Curso de SQL e Banco de Dados
Wilson Kitth Real
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
tdc-globalcode
 
Criando um baseline de seu ambiente completo utilizando SSIS e SSRS
Criando um baseline de seu ambiente completo utilizando SSIS e SSRSCriando um baseline de seu ambiente completo utilizando SSIS e SSRS
Criando um baseline de seu ambiente completo utilizando SSIS e SSRS
Marcos Freccia
 
Integração entre o SharePoint e o Azure utilizando BCS - Azure Tech Nights
Integração entre o SharePoint e o Azure utilizando BCS - Azure Tech NightsIntegração entre o SharePoint e o Azure utilizando BCS - Azure Tech Nights
Integração entre o SharePoint e o Azure utilizando BCS - Azure Tech Nights
Douglas Romão
 
OneDay Baixada 2015 - Desenvolvimento para SharePoint
OneDay Baixada 2015 - Desenvolvimento para SharePointOneDay Baixada 2015 - Desenvolvimento para SharePoint
OneDay Baixada 2015 - Desenvolvimento para SharePoint
Douglas Romão
 
Introdução ao Sharepoint
Introdução ao SharepointIntrodução ao Sharepoint
Introdução ao Sharepoint
Huxley Dias
 
Cenários de utilização do SharePoint com Azure
Cenários de utilização do SharePoint com AzureCenários de utilização do SharePoint com Azure
Cenários de utilização do SharePoint com Azure
Douglas Romão
 
Quero trabalhar na área de dados. Por onde começar?
Quero trabalhar na área de dados. Por onde começar?Quero trabalhar na área de dados. Por onde começar?
Quero trabalhar na área de dados. Por onde começar?
Dirceu Resende
 

Mais procurados (14)

Monitorando seu ambiente SQL server com o Power BI
Monitorando seu ambiente SQL server com o Power BIMonitorando seu ambiente SQL server com o Power BI
Monitorando seu ambiente SQL server com o Power BI
 
Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015Conhecendo SharePoint - Anhanguera IT Summit 2015
Conhecendo SharePoint - Anhanguera IT Summit 2015
 
Power BI: DirectQuery, Live Connection e Import
Power BI: DirectQuery, Live Connection e ImportPower BI: DirectQuery, Live Connection e Import
Power BI: DirectQuery, Live Connection e Import
 
SQL Day 2016 - SQL Server x Oracle
SQL Day 2016 - SQL Server x OracleSQL Day 2016 - SQL Server x Oracle
SQL Day 2016 - SQL Server x Oracle
 
Escolhendo entre SharePoint e ASP.NET
Escolhendo entre SharePoint e ASP.NETEscolhendo entre SharePoint e ASP.NET
Escolhendo entre SharePoint e ASP.NET
 
Carreira na Plataforma de Dados da Microsoft
Carreira na Plataforma de Dados da MicrosoftCarreira na Plataforma de Dados da Microsoft
Carreira na Plataforma de Dados da Microsoft
 
Curso de SQL e Banco de Dados
Curso de SQL e Banco de DadosCurso de SQL e Banco de Dados
Curso de SQL e Banco de Dados
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
 
Criando um baseline de seu ambiente completo utilizando SSIS e SSRS
Criando um baseline de seu ambiente completo utilizando SSIS e SSRSCriando um baseline de seu ambiente completo utilizando SSIS e SSRS
Criando um baseline de seu ambiente completo utilizando SSIS e SSRS
 
Integração entre o SharePoint e o Azure utilizando BCS - Azure Tech Nights
Integração entre o SharePoint e o Azure utilizando BCS - Azure Tech NightsIntegração entre o SharePoint e o Azure utilizando BCS - Azure Tech Nights
Integração entre o SharePoint e o Azure utilizando BCS - Azure Tech Nights
 
OneDay Baixada 2015 - Desenvolvimento para SharePoint
OneDay Baixada 2015 - Desenvolvimento para SharePointOneDay Baixada 2015 - Desenvolvimento para SharePoint
OneDay Baixada 2015 - Desenvolvimento para SharePoint
 
Introdução ao Sharepoint
Introdução ao SharepointIntrodução ao Sharepoint
Introdução ao Sharepoint
 
Cenários de utilização do SharePoint com Azure
Cenários de utilização do SharePoint com AzureCenários de utilização do SharePoint com Azure
Cenários de utilização do SharePoint com Azure
 
Quero trabalhar na área de dados. Por onde começar?
Quero trabalhar na área de dados. Por onde começar?Quero trabalhar na área de dados. Por onde começar?
Quero trabalhar na área de dados. Por onde começar?
 

Destaque

Métodos Ágeis - Aula 01
Métodos Ágeis - Aula 01Métodos Ágeis - Aula 01
Métodos Ágeis - Aula 01
Adriano Bertucci
 
Biweek Mineração de Dados com SQL Server
Biweek   Mineração de Dados com SQL ServerBiweek   Mineração de Dados com SQL Server
Biweek Mineração de Dados com SQL Server
Rodrigo Dornel
 
Mentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de DadosMentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de Dados
Rodrigo Dornel
 
SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016
Rodrigo Dornel
 
Criando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BICriando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BI
Adriano Bertucci
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho Day
Marco Garcia
 

Destaque (6)

Métodos Ágeis - Aula 01
Métodos Ágeis - Aula 01Métodos Ágeis - Aula 01
Métodos Ágeis - Aula 01
 
Biweek Mineração de Dados com SQL Server
Biweek   Mineração de Dados com SQL ServerBiweek   Mineração de Dados com SQL Server
Biweek Mineração de Dados com SQL Server
 
Mentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de DadosMentoring para prova MTA - Fundamento de Banco de Dados
Mentoring para prova MTA - Fundamento de Banco de Dados
 
SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016SQL Saturday 570 - São Paulo - 2016
SQL Saturday 570 - São Paulo - 2016
 
Criando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BICriando indicadores de time com VSTS e POWER BI
Criando indicadores de time com VSTS e POWER BI
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho Day
 

Semelhante a SQL Server Heterogêneo: SQL Server + BigData

No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documento
Alex Martins
 
Alinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQLAlinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQL
pichiliani
 
NoSql e NewSql
NoSql e NewSqlNoSql e NewSql
NoSql e NewSql
Suzana Viana Mota
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dados
pichiliani
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dados
pichiliani
 
Utilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentesUtilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentes
Christiano Anderson
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
tdc-globalcode
 
Web Scale Data Management
Web Scale Data ManagementWeb Scale Data Management
Web Scale Data Management
Regis Magalhães
 
Bancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureBancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft Azure
Joel Rodrigues
 
Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...
Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...
Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...
Renato Groff
 
DocumentDB - Azure Fridays São Paulo
DocumentDB - Azure Fridays São PauloDocumentDB - Azure Fridays São Paulo
DocumentDB - Azure Fridays São Paulo
Renato Groff
 
Sql server 2019 big data cluster
Sql server 2019 big data clusterSql server 2019 big data cluster
Sql server 2019 big data cluster
Luiz Henrique Garetti Rosário
 
NoSQL & SQL
NoSQL & SQLNoSQL & SQL
NoSQL & SQL
Charles Fortes
 
#1 Introdução ao MongoDB
#1   Introdução ao MongoDB#1   Introdução ao MongoDB
#1 Introdução ao MongoDB
Gabriel Alves Scavassa
 
Webservices em PHP e a liberdade da Web
Webservices em PHP e a liberdade da WebWebservices em PHP e a liberdade da Web
Webservices em PHP e a liberdade da Web
Alexandre Andrade
 
Mongo db
Mongo dbMongo db
Mongo db
Edmilson Neto
 
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
Amazon Web Services LATAM
 
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
Renato Groff
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
Thiago de Azeredo
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQL
Eric Silva
 

Semelhante a SQL Server Heterogêneo: SQL Server + BigData (20)

No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documento
 
Alinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQLAlinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQL
 
NoSql e NewSql
NoSql e NewSqlNoSql e NewSql
NoSql e NewSql
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dados
 
Interoperabilidade entre bancos de dados
Interoperabilidade entre bancos de dadosInteroperabilidade entre bancos de dados
Interoperabilidade entre bancos de dados
 
Utilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentesUtilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentes
 
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
TDC2016POA | Trilha BigData - Orquestrando Hadoop, Cassandra e MongoDB com o ...
 
Web Scale Data Management
Web Scale Data ManagementWeb Scale Data Management
Web Scale Data Management
 
Bancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft AzureBancos NoSQL no Microsoft Azure
Bancos NoSQL no Microsoft Azure
 
Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...
Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...
Tecnologias de bancos de dados no Azure: conhecendo as opções relacionais e N...
 
DocumentDB - Azure Fridays São Paulo
DocumentDB - Azure Fridays São PauloDocumentDB - Azure Fridays São Paulo
DocumentDB - Azure Fridays São Paulo
 
Sql server 2019 big data cluster
Sql server 2019 big data clusterSql server 2019 big data cluster
Sql server 2019 big data cluster
 
NoSQL & SQL
NoSQL & SQLNoSQL & SQL
NoSQL & SQL
 
#1 Introdução ao MongoDB
#1   Introdução ao MongoDB#1   Introdução ao MongoDB
#1 Introdução ao MongoDB
 
Webservices em PHP e a liberdade da Web
Webservices em PHP e a liberdade da WebWebservices em PHP e a liberdade da Web
Webservices em PHP e a liberdade da Web
 
Mongo db
Mongo dbMongo db
Mongo db
 
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
Seu banco de dados na nuvem: Opções de bancos de dados na AWS e padrões de...
 
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
NoSQL para Desenvolvedores .NET - Developers-SP - Setembro-2017
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
 
Algumas das principais características do NoSQL
Algumas das principais características do NoSQLAlgumas das principais características do NoSQL
Algumas das principais características do NoSQL
 

Mais de Rodrigo Dornel

Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – Overview
Rodrigo Dornel
 
Mineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - DataminingMineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - Datamining
Rodrigo Dornel
 
Reunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSCReunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSC
Rodrigo Dornel
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSC
Rodrigo Dornel
 
Data mining (Part II)
Data mining (Part II)Data mining (Part II)
Data mining (Part II)
Rodrigo Dornel
 
Data mining (Part I)
Data mining (Part I)Data mining (Part I)
Data mining (Part I)
Rodrigo Dornel
 
Mineração com sql server 2008 r2
Mineração com sql server 2008 r2Mineração com sql server 2008 r2
Mineração com sql server 2008 r2
Rodrigo Dornel
 

Mais de Rodrigo Dornel (7)

Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – Overview
 
Mineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - DataminingMineração de dados com SQL Server - Datamining
Mineração de dados com SQL Server - Datamining
 
Reunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSCReunião 02 PASS Chapter MCITPSC
Reunião 02 PASS Chapter MCITPSC
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSC
 
Data mining (Part II)
Data mining (Part II)Data mining (Part II)
Data mining (Part II)
 
Data mining (Part I)
Data mining (Part I)Data mining (Part I)
Data mining (Part I)
 
Mineração com sql server 2008 r2
Mineração com sql server 2008 r2Mineração com sql server 2008 r2
Mineração com sql server 2008 r2
 

SQL Server Heterogêneo: SQL Server + BigData

  • 1. PASS Community November 2015 SQL Server Heterogêneo SQL Server + BigData
  • 2. PASS Chapter Leader Rodrigo Ramos Dornel “Dornel” MTAC Lead da Região SUL Professor Universitário Mais de 10 anos como consultor em SQL Server MCT e MCSA RDornel Data Platform Experts
  • 3. Upcoming SQLSaturdays South America International • Novembro, 21em Brasília • http://www.sqlsaturday.com/469/eventhome.aspx • Abril, 09 Joinville (2016) • http://www.sqlsaturday.com/488/eventhome.aspx Visit www.sqlsaturday.com to register for a event near you!
  • 4. Local Chapter - MCITPSC http://www.mcitpsc.com.br - @mcitpsc
  • 6. 6 Introdução Porque banco de dados Heterogêneo? • XML • SQL + NoSQL • Hadoop • MapReduce • HDFS • Hive • DocumentDB
  • 7. 7 Introdução XML • O que é XML • Linguagem de marcação • Capaz de descrever diversos tipos de dados. Seu propósito principal é a facilidade de compartilhamento de informações através da internet.
  • 8. 8 Introdução Onde tudo começou • Alterou alguns paradigmas de banco de dados • Primeira experiência com dados não estruturados • Introdução do tipo de dados XML
  • 9. 9 Introdução • SQL + NoSQL • SQL, fortemente ligado ao mundo relacional, consultas bem definidas, esquemas rígidos e ACID. • NoSQL, termo genérico para uma classe definida de banco de dados não-relacionais. Não apresenta estrutura rígida, alguns chamam de livre de esquema, pouco ou nenhum controle ACID.
  • 10. 1 0 Introdução • SQL + NoSQL • NoSQL, extremamente orientado a solução, ou seja, flexível, escalável e customizado. • Trabalhar em arquitetura em nuvem e escalabilidade horizontal.
  • 11. 1 1 Introdução • Hadoop • Plataforma feita em Java para processamento distribuído de grandes massas de dados. • Basicamente composto pelo HDFS, Yarn e MapReduce. • Projeto é mantido pela fundação Apache. • Para nós o mais familiar ou conhecido é o HDInsight feito pela Hortomworks para a Microsoft. • Azure ou Local (só um nó)
  • 12. 1 2 Introdução • HDFS • Sistemas de arquivos feito para rodar em hardware básico. • Feito para trabalhar com grandes quantidades de dados. • Tolerante a falha. • Não leva em consideração aspectos tradicionais de acesso a dados e sim um estilo de acesso como um streaming de dados.
  • 14. 1 4 Introdução • MapReduce • MapReduce é um modelo de programação desenhado para processar grandes volumes de dados em paralelo, dividindo o trabalho em um conjunto de tarefas independentes
  • 16. 1 6 Introdução • Hive • Basicamente uma infraestrutura de datawarehouse para rodar no topo da arquitetura do Hadoop para oferecer sumarização dos dados, consultas e análise. • Ele oferece uma linguagem SQL-like chamada de HiveQL com leitura e esquemas que permitem que consultemos os dados MapReduce como se consultássemos banco tradicionais. • Por causa dessa bendita possibilidade que estamos aqui Hoje .
  • 17. 1 7 Introdução • DocumentDB • É o banco de dados da Microsoft para JSON e JavaScript (Java Script Object Notation). • No site do DocumentDB ele comenta que é possível fazer consultas parecidas com SQL ou usar UDF, funções para essas conversões. • Seria o concorrente da Microsoft para o mongoDB
  • 19. 1 9 XML • SQL Server e XML • Introduzido na versão 2005. • Possibilita transformar linhas do banco de dados em fragmentos de XML. • Permite carregar e armazenar dados XML dentro SQL Server. • Usa a linguagem XQuery para manipular dados dentro do XML, baseado em expressões XPath (árvore do XML, navegação).
  • 20. 2 0 XML • Demo • XML Auto • XQuery • XQuery Update
  • 21. 2 1 JSON • DocumentDB • O DocumentDB do Azure é um serviço de banco de dados de documento NoSQL projetado desde o início para suportar, de forma nativa, JSON e JavaScript diretamente dentro do mecanismo de banco de dados.
  • 22. 2 2 JSON • JSON e o SQL Server 2016 • JSON Auto, cria uma hierarquia automaticamente • JSON Path, você especifica as hierarquias • ISJSON(), valida se a coluna está no padrão JSON • JSON_QUERY() “SUB CONSULTA” • JSON_VALUE(), retorna o valor do nó • JSON_MODIFY()??? • OPENJSON(), carrega um campo “texto” convertendo ele para JSON. OPENJSON é uma função (TVF), imagina um CAST ou CONVERT. • INCLUDE_NULL_VALUES
  • 23. 2 3 JSON • JSON e o SQL Server 2016 • Indexação • ALTER TABLE Sales.SalesOrder_json • ADD vCustomerName AS JSON_VALUE(Info, '$.Customer.Name') • CREATE INDEX idx_SalesOrder_json_CustomerName • ON Sales.SalesOrder_json(vCustomerName) • Ou crie um índice Full Text!!! CREATE FULLTEXT INDEX ON Person.Person_json(EmailAddresses) KEY INDEX PK_Person_json_PersonID ON jsonFullTextCatalog; GO
  • 25. 2 5 PolyBase O que é PolyBase? • A tecnologia PolyBase permite consultar e unir dados de várias fontes, tudo usando os comandos Transact- SQL.
  • 27. 2 7 PolyBase O que é PolyBase? • Fonte de dados Externa, Hadoop, Azure Blob. • Definição de como os dados estão organizados, ou seja, separadores de colunas. • Um esquema que represente esses dados, colunas, tipos de dados e localização desse arquivo dentro do seu sistema de arquivos. • Necessário ter o Java JDK antes de instalar e/ou pode ser interessante instalar um drive ODBC para Hive.
  • 28. 2 8 PolyBase O que é PolyBase? • Fonte de dados Externa, Hortomworks. • Definição dos dados • Localização dele no File System
  • 29. 2 9 PolyBase • Demo • Criar o Source, File, Table • ODBC, OpenQuery • Azure Blob
  • 30. 3 0 SSIS • Pacote de Integração SSIS + HDInsight + Azure Blob • Conjunto de ferramentas para conexão e tarefas dentro do SSIS.
  • 31. • Demo • Azure Blob Upload. 3 1 SSIS
  • 32. 3 2 Quem vai cuidar disso tudo? Você mesmo belesão!!!
  • 33. Stay Involved! • Sign up for a free membership today at sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org • @rdornel • rodrigodornel@gmail.com