SlideShare uma empresa Scribd logo
1 de 28
Powered by




           Qualidade e Tratamento de Dados
           Produto e Serviços



©2013 DataMotion Tecnologia. Todos direitos reservados
                                                               DataMotion Tecnologia
                                                               Rua Gomes de Carvalho 1327 – 11 andar
                                                               CEP 04547-005 – São Paulo – SP - Brazil
                                                               Tel.: (55 11) 3842-2616
Sobre a DataMotion
 Fundação em:                      • 2005

 Matriz:                           • São Paulo, Brasil
                                     (com clientes também na América Latina, USA e Europa)

 Quem somos:                       • Especialistas em tecnologia para dados
                                   • Provedor de soluções em Tratamento, Enriquecimento e
                                     Integração de Dados
                                   • Líder em tecnologia para Data Quality
                                   • Mais de 30 funcionários
                                   • Diversas empresas multinacionais como clientes
                                   • Time gerencial altamente qualificado, com experiência em
                                     projetos internacionais


©2013 DataMotion Tecnologia. Todos direitos reservados
Produtos e Serviços
A DataMotion oferece soluções personalizadas e completas, voltadas às áreas de TI, Integração de
Dados, CRM e Database Marketing. A DataMotion possui o expertise necessário para atender as
demandas relacionadas a gestão corporativa da qualidade da informação, projetos de migração de
dados, MDM, Web Services e processamentos sob medida.




                                                         ENRIQUECIMENTO   CAPTURA DE
                                    DATA QUALITY
                                                            DE DADOS        DADOS




                                     INTEGRAÇÃO                            GESTÃO DA
                                       DE DADOS                           INFORMAÇÃO




                                      DATABASE              DATA          MIGRAÇÃO
                                      MARKETING           WAREHOUSE       DE DADOS




©2013 DataMotion Tecnologia. Todos direitos reservados
Tecnologia de ETL e Qualidade de Dados

Domínio das principais tecnologias do mercado              Roda nos ambientes
          -Ambiente .Net, C#, Java, Python, PHP             › Windows
                                                            › Linux
          -XML SOAP Web Services, JSON REST
                                                            › HP-UX
          -SQLServer, Oracle, MySQL, etc                    › AIX
                                                            › IBM AS/400
                                                            › Solaris
Plataforma de ETL que domina seus dados                     › Mac OS X
      Extract – Transform – Load
                -Lê de uma ou mais fontes de dados
                -Transforma dados em qualquer formato
                imaginável
                -Grava e atualiza dados em qualquer base
                de destino



©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento de Dados
  Processos de Validação e Filtros de Dados

  Conteúdos Geográficos

  Tratamento de endereços – padronização e auditoria de conteúdo
  Validação e atualização de CEP utilizando base do DNE dos Correios

  Separação e padronização dos componentes do logradouro (tipo de
  logradouro, logradouro, número, complemento, Bairro, CEP, Cidade e UF)

  Georreferenciamento a partir do endereço

  Abragência de tratamento para todos os países da América Latina




©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento de Dados
  Nomes
  Atribuição de gênero (sexo)
  Identificação de tipo de pessoa – física ou jurídica
  Identificação de palavrões – nomes incorretamente digitados
  Separação de nome composto, primeiro nome, nome do meio e último nome

  Telefones
  Tratamento de Telefones – validação e atualização de DDDs e prefixos

  Documentos
  Validação do dígito de controle e formatação de CNPJ, CPF e Inscrição Estadual

  E-mail
  Verificação e consistência no conteúdo do campo e-mail
  Ping para verificação da existência do domínio


©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento de Dados
  Campos genéricos
  Padronização e formatação de campos genéricos como Cargos, Tabela de
  Produtos, Parentesco, Estado Civil, etc...
  Integração com expressões regulares (RegExp)


  MatchCode
  Identificação de registros duplicados no cadastro e Visão única de Cliente
  Parametrização e regras de negócios customizáveis
  Criação de MatchKeys Fonéticas
  Geração de arquivo DE/PARA
  Merge & Purge em campanhas de Marketing/CRM
  Householding




©2013 DataMotion Tecnologia. Todos direitos reservados
Simulação de um Processamento




©2013 DataMotion Tecnologia. Todos direitos reservados
Modelo Ideal de Integração




©2013 DataMotion Tecnologia. Todos direitos reservados
ETL com Qualidade de Dados




©2013 DataMotion Tecnologia. Todos direitos reservados
Integração sem Limites



   Microsoft .Net and Java                                     Integração de Dados




                               Data Modeling             CRM and Analytics   Reports   Security
                              XML Web Services




               Base de Dados Corporativa
©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento e Execução em Batch




                                                         O DataMotion pode tratar em
                                                         batch virtualmente qualquer
                                                          tipo de formato de arquivo




©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento de Nome/Empresa

                                                           Tratamento de nomes,
                                                          empresas, acentuação,
                                                         identificação de gênero e
                                                               nomes duplos




©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento de Endereço




      Reconhecimento de múltiplos
      formatos de preenchimento e
        de localização geográfica


©2013 DataMotion Tecnologia. Todos direitos reservados
Busca de Logradouros e CEPs




                                                             Busca de logradouros
                                                         utilizando padrões fonéticos
                                                         de reconhecimento e escrita




©2013 DataMotion Tecnologia. Todos direitos reservados
Tratamento de Telefone




                                                          Tratamento simultâneo de
                                                         vários telefones em um único
                                                               campo de entrada




©2013 DataMotion Tecnologia. Todos direitos reservados
Geo-Localização




©2013 DataMotion Tecnologia. Todos direitos reservados
Análise da Similaridade de Conteúdos




                                                         O Processo de Análise da
                                                           Similaridade pode ser
                                                         utilizado para todo tipo de
                                                             conteúdo cadastral.

                                                         Processo ideal para análise
                                                           de fraude, integração e
                                                             migração de dados

©2013 DataMotion Tecnologia. Todos direitos reservados
Data Quality na Web
                                                      O DataMotion Web permite a
                                                       execução de tratamento de
                                                     dados sob medida via browser




©2013 DataMotion Tecnologia. Todos direitos reservados
DataMotion SDK no Visual Studio




                                                         Aplicação escrita em C#
                                                          utilizando as APIs do
                                                                DataMotion




©2013 DataMotion Tecnologia. Todos direitos reservados
Data Quality XML Web Service




©2013 DataMotion Tecnologia. Todos direitos reservados
Data Quality XML Web Service - Autorizador Fiscal


                                                         CPF : Nome e Situação do CPF




CNPJ : Razão Social, Endereço,
CNAE, Natureza Jurídica, Data de
Abertura, Situação do CNPJ,
Inscrição Estadual, Situação da
Inscrição Estadual



©2013 DataMotion Tecnologia. Todos direitos reservados
CloverETL
    IDE que permite rápido
    desenvolvimento, com testes
    e execução.
         Visual job designer
         Definição dos Metadata
         Validação de job
         Inspeção de dados
         Validação de regras
         Estatísticas
         Captura do log
         XML storage aberto
         Integração com server


©2013 DataMotion Tecnologia. Todos direitos reservados
CloverETL Server

    Ambiente de execução com
    automação, gerenciamento
    e integração.
          Monitoramento
          Scheduling
          Dependências
          Segurança
          Gatilhos Real-time
          API (SOAP/REST/Java
          JMX)




©2013 DataMotion Tecnologia. Todos direitos reservados
CloverETL Engine

A core library monta e executa os
jobs do CloverETL
    Extensa arquitetura de plugin
    Multi threaded
    Paralelismo
    Baixo footprint
    Static Java codebase
    Jobs em Java ou XML




©2013 DataMotion Tecnologia. Todos direitos reservados
DataMotion integrado ao CloverETL




©2013 DataMotion Tecnologia. Todos direitos reservados
Data Quality Dashboards
   Desenvolvimento de soluções customizadas de Dashboards




©2013 DataMotion Tecnologia. Todos direitos reservados
DataMotion Tecnologia
          Rua Gomes de Carvalho 1327 – 11 andar
          CEP 04547-005 – São Paulo – SP - Brasil
          (55 11) 3842-2616

          http://www.datamotion.com.br

©2013 DataMotion Tecnologia. Todos direitos reservados

Mais conteúdo relacionado

Semelhante a Data Quality e ETL com a DataMotion

Marcos ferreira da silva tecnologia da informação
Marcos ferreira da silva   tecnologia da informaçãoMarcos ferreira da silva   tecnologia da informação
Marcos ferreira da silva tecnologia da informaçãoMarcos Ferreira
 
Primesoft Company Profile 2010 11
Primesoft Company Profile 2010 11Primesoft Company Profile 2010 11
Primesoft Company Profile 2010 11Primesoft
 
Quebra de paradigmas na coleta e governança de dados
Quebra de paradigmas na coleta e governança de dados Quebra de paradigmas na coleta e governança de dados
Quebra de paradigmas na coleta e governança de dados sucesu68
 
Big data - Conhecendo as Tecnologias
Big data - Conhecendo as TecnologiasBig data - Conhecendo as Tecnologias
Big data - Conhecendo as TecnologiasHumberto Moura
 
Introduction to the Cloud
Introduction to the Cloud Introduction to the Cloud
Introduction to the Cloud Marcelo Adade
 
Apresentação eMartim
Apresentação eMartimApresentação eMartim
Apresentação eMartimEMARTIM
 
Harvard Business Review - LGPD
Harvard Business Review - LGPDHarvard Business Review - LGPD
Harvard Business Review - LGPDThiago Santiago
 
O Mercado e o Profissional de TI - Senac Americana - 20/09/2011
O Mercado e o Profissional de TI - Senac Americana - 20/09/2011O Mercado e o Profissional de TI - Senac Americana - 20/09/2011
O Mercado e o Profissional de TI - Senac Americana - 20/09/2011Daniel Guedes
 
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...Amazon Web Services LATAM
 
CV+Paulo+Tatsuo (5).pdf
CV+Paulo+Tatsuo (5).pdfCV+Paulo+Tatsuo (5).pdf
CV+Paulo+Tatsuo (5).pdfPauloTatsuo
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...Amazon Web Services LATAM
 
Data Management Summit
Data Management SummitData Management Summit
Data Management SummitDenodo
 
Casos de Sucesso Talend Open Studio
Casos de Sucesso Talend Open StudioCasos de Sucesso Talend Open Studio
Casos de Sucesso Talend Open StudioProjetaty Tecnologia
 
Net Place - Apresentação Institucional
Net Place - Apresentação InstitucionalNet Place - Apresentação Institucional
Net Place - Apresentação InstitucionalRogerio Fernandes
 
Sistema GED - Mais de 10 motivos para usar Documentos Armazenados
Sistema GED - Mais de 10 motivos para usar Documentos ArmazenadosSistema GED - Mais de 10 motivos para usar Documentos Armazenados
Sistema GED - Mais de 10 motivos para usar Documentos ArmazenadosTaugor Corporation
 

Semelhante a Data Quality e ETL com a DataMotion (20)

Marcos ferreira da silva tecnologia da informação
Marcos ferreira da silva   tecnologia da informaçãoMarcos ferreira da silva   tecnologia da informação
Marcos ferreira da silva tecnologia da informação
 
Primesoft Company Profile 2010 11
Primesoft Company Profile 2010 11Primesoft Company Profile 2010 11
Primesoft Company Profile 2010 11
 
Big Data - Hadoop
Big Data - HadoopBig Data - Hadoop
Big Data - Hadoop
 
Portfolio LCS
Portfolio LCSPortfolio LCS
Portfolio LCS
 
Quebra de paradigmas na coleta e governança de dados
Quebra de paradigmas na coleta e governança de dados Quebra de paradigmas na coleta e governança de dados
Quebra de paradigmas na coleta e governança de dados
 
Big data Workshop
Big data WorkshopBig data Workshop
Big data Workshop
 
Big data - Conhecendo as Tecnologias
Big data - Conhecendo as TecnologiasBig data - Conhecendo as Tecnologias
Big data - Conhecendo as Tecnologias
 
Introduction to the Cloud
Introduction to the Cloud Introduction to the Cloud
Introduction to the Cloud
 
Apresentação eMartim
Apresentação eMartimApresentação eMartim
Apresentação eMartim
 
Harvard Business Review - LGPD
Harvard Business Review - LGPDHarvard Business Review - LGPD
Harvard Business Review - LGPD
 
O Mercado e o Profissional de TI - Senac Americana - 20/09/2011
O Mercado e o Profissional de TI - Senac Americana - 20/09/2011O Mercado e o Profissional de TI - Senac Americana - 20/09/2011
O Mercado e o Profissional de TI - Senac Americana - 20/09/2011
 
Folderdataprev2016 web
Folderdataprev2016 webFolderdataprev2016 web
Folderdataprev2016 web
 
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
AWS Innovate 2020 - Entenda como o Data Flywheel pode apoiá-lo em sua estraté...
 
CV+Paulo+Tatsuo (5).pdf
CV+Paulo+Tatsuo (5).pdfCV+Paulo+Tatsuo (5).pdf
CV+Paulo+Tatsuo (5).pdf
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
institucional
institucionalinstitucional
institucional
 
Data Management Summit
Data Management SummitData Management Summit
Data Management Summit
 
Casos de Sucesso Talend Open Studio
Casos de Sucesso Talend Open StudioCasos de Sucesso Talend Open Studio
Casos de Sucesso Talend Open Studio
 
Net Place - Apresentação Institucional
Net Place - Apresentação InstitucionalNet Place - Apresentação Institucional
Net Place - Apresentação Institucional
 
Sistema GED - Mais de 10 motivos para usar Documentos Armazenados
Sistema GED - Mais de 10 motivos para usar Documentos ArmazenadosSistema GED - Mais de 10 motivos para usar Documentos Armazenados
Sistema GED - Mais de 10 motivos para usar Documentos Armazenados
 

Data Quality e ETL com a DataMotion

  • 1. Powered by Qualidade e Tratamento de Dados Produto e Serviços ©2013 DataMotion Tecnologia. Todos direitos reservados DataMotion Tecnologia Rua Gomes de Carvalho 1327 – 11 andar CEP 04547-005 – São Paulo – SP - Brazil Tel.: (55 11) 3842-2616
  • 2. Sobre a DataMotion Fundação em: • 2005 Matriz: • São Paulo, Brasil (com clientes também na América Latina, USA e Europa) Quem somos: • Especialistas em tecnologia para dados • Provedor de soluções em Tratamento, Enriquecimento e Integração de Dados • Líder em tecnologia para Data Quality • Mais de 30 funcionários • Diversas empresas multinacionais como clientes • Time gerencial altamente qualificado, com experiência em projetos internacionais ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 3. Produtos e Serviços A DataMotion oferece soluções personalizadas e completas, voltadas às áreas de TI, Integração de Dados, CRM e Database Marketing. A DataMotion possui o expertise necessário para atender as demandas relacionadas a gestão corporativa da qualidade da informação, projetos de migração de dados, MDM, Web Services e processamentos sob medida. ENRIQUECIMENTO CAPTURA DE DATA QUALITY DE DADOS DADOS INTEGRAÇÃO GESTÃO DA DE DADOS INFORMAÇÃO DATABASE DATA MIGRAÇÃO MARKETING WAREHOUSE DE DADOS ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 4. Tecnologia de ETL e Qualidade de Dados Domínio das principais tecnologias do mercado Roda nos ambientes -Ambiente .Net, C#, Java, Python, PHP › Windows › Linux -XML SOAP Web Services, JSON REST › HP-UX -SQLServer, Oracle, MySQL, etc › AIX › IBM AS/400 › Solaris Plataforma de ETL que domina seus dados › Mac OS X Extract – Transform – Load -Lê de uma ou mais fontes de dados -Transforma dados em qualquer formato imaginável -Grava e atualiza dados em qualquer base de destino ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 5. Tratamento de Dados Processos de Validação e Filtros de Dados Conteúdos Geográficos Tratamento de endereços – padronização e auditoria de conteúdo Validação e atualização de CEP utilizando base do DNE dos Correios Separação e padronização dos componentes do logradouro (tipo de logradouro, logradouro, número, complemento, Bairro, CEP, Cidade e UF) Georreferenciamento a partir do endereço Abragência de tratamento para todos os países da América Latina ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 6. Tratamento de Dados Nomes Atribuição de gênero (sexo) Identificação de tipo de pessoa – física ou jurídica Identificação de palavrões – nomes incorretamente digitados Separação de nome composto, primeiro nome, nome do meio e último nome Telefones Tratamento de Telefones – validação e atualização de DDDs e prefixos Documentos Validação do dígito de controle e formatação de CNPJ, CPF e Inscrição Estadual E-mail Verificação e consistência no conteúdo do campo e-mail Ping para verificação da existência do domínio ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 7. Tratamento de Dados Campos genéricos Padronização e formatação de campos genéricos como Cargos, Tabela de Produtos, Parentesco, Estado Civil, etc... Integração com expressões regulares (RegExp) MatchCode Identificação de registros duplicados no cadastro e Visão única de Cliente Parametrização e regras de negócios customizáveis Criação de MatchKeys Fonéticas Geração de arquivo DE/PARA Merge & Purge em campanhas de Marketing/CRM Householding ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 8. Simulação de um Processamento ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 9. Modelo Ideal de Integração ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 10. ETL com Qualidade de Dados ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 11. Integração sem Limites Microsoft .Net and Java Integração de Dados Data Modeling CRM and Analytics Reports Security XML Web Services Base de Dados Corporativa ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 12. Tratamento e Execução em Batch O DataMotion pode tratar em batch virtualmente qualquer tipo de formato de arquivo ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 13. Tratamento de Nome/Empresa Tratamento de nomes, empresas, acentuação, identificação de gênero e nomes duplos ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 14. Tratamento de Endereço Reconhecimento de múltiplos formatos de preenchimento e de localização geográfica ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 15. Busca de Logradouros e CEPs Busca de logradouros utilizando padrões fonéticos de reconhecimento e escrita ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 16. Tratamento de Telefone Tratamento simultâneo de vários telefones em um único campo de entrada ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 18. Análise da Similaridade de Conteúdos O Processo de Análise da Similaridade pode ser utilizado para todo tipo de conteúdo cadastral. Processo ideal para análise de fraude, integração e migração de dados ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 19. Data Quality na Web O DataMotion Web permite a execução de tratamento de dados sob medida via browser ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 20. DataMotion SDK no Visual Studio Aplicação escrita em C# utilizando as APIs do DataMotion ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 21. Data Quality XML Web Service ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 22. Data Quality XML Web Service - Autorizador Fiscal CPF : Nome e Situação do CPF CNPJ : Razão Social, Endereço, CNAE, Natureza Jurídica, Data de Abertura, Situação do CNPJ, Inscrição Estadual, Situação da Inscrição Estadual ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 23. CloverETL IDE que permite rápido desenvolvimento, com testes e execução. Visual job designer Definição dos Metadata Validação de job Inspeção de dados Validação de regras Estatísticas Captura do log XML storage aberto Integração com server ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 24. CloverETL Server Ambiente de execução com automação, gerenciamento e integração. Monitoramento Scheduling Dependências Segurança Gatilhos Real-time API (SOAP/REST/Java JMX) ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 25. CloverETL Engine A core library monta e executa os jobs do CloverETL Extensa arquitetura de plugin Multi threaded Paralelismo Baixo footprint Static Java codebase Jobs em Java ou XML ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 26. DataMotion integrado ao CloverETL ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 27. Data Quality Dashboards Desenvolvimento de soluções customizadas de Dashboards ©2013 DataMotion Tecnologia. Todos direitos reservados
  • 28. DataMotion Tecnologia Rua Gomes de Carvalho 1327 – 11 andar CEP 04547-005 – São Paulo – SP - Brasil (55 11) 3842-2616 http://www.datamotion.com.br ©2013 DataMotion Tecnologia. Todos direitos reservados