SlideShare uma empresa Scribd logo
1 de 23
Baixar para ler offline
Pentaho Kettle Step

    `     `
    Angel Alvarez Serra



             18 Abril 2009




`     `
Angel Alvarez Serra   Pentaho Kettle Step
Introducci´n a ETL.
          o

Introducci´n a Kettle.
          o
    Transformaciones.
    Trabajos.


OpenErp Kettle Step
    Instalaci´n.
             o
    Como Utilizarlo.




                       `     `
                       Angel Alvarez Serra   Pentaho Kettle Step
Introducci´n a ETL
          o



  Herramienta para la obtenci´n, transformaci´n y volcado de datos de
                               o             o
  origenes y destinos diferentes


  Extraer datos de varias fuentes Diversos tipos de base de datos, oracles,
                access... ficheros de texto ( csv, longitud fija, xml ),
                origenes rss, ficheros remotos...
  Transformar Datos Hacer c´lculos, unir tablas, descartar datos, cambiar
                             a
               tipos, lanzar procesos de la base de datos ...
   Volcar datos Volcar a ficheros, base de datos, ficheros remotos...




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Utilidades



      Hacer traspasos de datos completos ante la implantaci´n de un
                                                           o
      nuevo sistema.

      Hacer volcados de informaci´n automatizados hacia el
                                 o
      DataWareHouse.

      Importar datos de ficheros externos, ( ficheros batch de sistemas
      m´biles, noticias econ´micas de ficheros rss...
        o                   o

      Limpieza de datos del sistema actual aplicando complejas
      condiciones de borrado.




                        `     `
                        Angel Alvarez Serra   Pentaho Kettle Step
Otros ETL



  En el mercado existen varios sistemas ETL, tanto comerciales como
  opensource. Requisitos a valorar a la hora de escoger un ETL.


      Facilidad de uso.
      Actividad del proyecto.
      N´mero de transformaciones disponibles y opciones de configuraci´n
       u                                                             o
      de estas.
      Facilidad a la hora de implementar una nueva Transforamci´n.
                                                               o
      Integraci´n con un sistema de Bussiness Intelligent completo.
               o




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Costes del Trabajo con datos


  El manejo de datos es costoso, en la implantaci´n, importaci´n i
                                                 o            o
  exportaci´n, en tiempo, recursos y dinero.
           o

  La Finalidad de los ETL es el augmento de productividad para el trato
  con todo tipo de informaci´n.
                            o



                                                         Atacar cada caso en
                                                         particular.
                                                         Desarrollar un ETL propio.
                                                         ETL comercial.
                                                         ETL opensource.




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Introuducci´n a Kettle
           o


  Transformaciones Entidad b´sica de trabajo, define la obtenci´n, la
                             a                                o
                transfomaci´n, el volcado o qualquier combinaci´n de
                           o                                   o
                estas.




      Trabajos Conjunto de transformaciones, permite el control de
               estados, marca el inicio , final , comunica si el proceso a
               tenido ´xito o no...
                      e




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Pasos (Step) Entidad b´sica de la transformaci´n. Acci´n a realizar.
                      a                       o       o

Saltos (Hops) Define el paso entre diferentes pasos, posibilidad de
              paralelizar la acci´n, copiar datos a diferentes pasos...
                                 o




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Introuducci´n a Kettle
           o


     Interf´ Gr´fica
           ıcie a
        Repositorio Almac´n y organizaci´n de todas las
                           e               o
                     transformaciones.
               Vista Control de todas los ’pasos’ de la transformaci´n
                                                                    o
             Dise˜o A˜adir y editar nuevos pasos a la transformaci´n
                  n    n                                            o
     Panel de ejcuci´n Controla tiempo, n´mero de filas escritas y leidas
                     o                       u
                     por paso, an´lisis de impacto en la base de datos,
                                 a
                     herramientas de depuraci´n...
                                               o
     Linea de comandos
     Pemite la ejecuci´n batch de los trabajos y transformaciones , ya
                      o
     est´n en fichero como el repositorio. Permite la automatizaci´n de
        e                                                        o
     procesos.




                        `     `
                        Angel Alvarez Serra   Pentaho Kettle Step
Transformaciones


      Entradas Obtenci´n de datos,desde ficheros, base de datos,
                       o
               sistema...

        Salidas A˜adir, actualizar o eliminar datos de la base de datos,
                 n
                ficheros, hojas de c´lculo...
                                    a

     B´squeda Buscar valores en tablas, ficheros, llamadas a
      u
              procedimientos, webservices...

  Tranformaciones Aplicar funciones al estilo sql (Sort,Group By
               ),xml,c´lculos...
                      a

       Uniones Unir registros de diferentes transformaciones, producto
               cartesiano, inner, left , right join...




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Transformaciones (continuaci´n)
                            o


      Scripting Facilidades de scripting en lenguajes Sql, Javascript y
                expresiones regulares.

  Data WareHouse Buscar o actualizar datos a nivel de dimensiones.

      Trabajos Acciones para la comunicaci´n con estos, obtener y asignar
                                             o
               variables, devolver el resultado de la transformaci´n...
                                                                  o

         Inline Lectura y escritura de registros a nivel socket.

  Datos Masivos Optimizaci´nes para trabajar con grandes cantidades de
                           o
               datos, por ahora solo oracle.

  Experimental Transformaciones no del todo probadas, Datos Masivos
               para diferentes origenes.



                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Trabajos

       General Controla el flujo del trabajo, llamadas a mas trabajos o
               transformaciones, generar log, finalizar la ejecuci´n...
                                                                 o

           Mail Obtener Mails de cuentas pop para procesar-los, y enviar
                emails.

  Gestor/Gestor Remoto de Ficheros Diferentes acciones de sistema,
                crear, comparar, mover,zip, unzip, ftp, scp..

   Condiciones Comprobar si existen ficheros y datos en la base de datos,
               esperar a una cierta condici´n.
                                           o

      Scripting Shell, Sql, Javascript

           Xml Validador XML, XSL, XSD, transformaci´n XSL
                                                    o

  Volcados Masivos Importar y Exportar grandes cantidades de datos de
               diferentes base de datos.

                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
L´
 ınea de comandos


              Ofrece la posibilidad de ejecutar las diferentes transforamciones y
              trabajos por lineas de comandos.

              Posibilidad de integrar con scripts.

              Automatizaci´n.
                          o

              Posibilidad de ejecutar elementos guardados en el Repositorio.

Ejecutar un trabajo                                              Ejecutar una Transformaci´n
                                                                                          o
kitchen.bat /rep:’Production Repository’                         pan.bat /rep:”Production Repository”
             /job:’Update dimensions’                                  /trans:”update Customer Dimension”
             /dir:/Dimensions                                          /dir:/Dimensions/
             /user:NaN                                                 /user:NaN
             /pass:somepassword                                        /pass:somepassword
             /level:Basic                                              /level:Basic




                                           `     `
                                           Angel Alvarez Serra    Pentaho Kettle Step
Clustering


  Paralelizaci´n de procesos para un gran volumen de datos de forma
              o
  senzilla y r´pida.
              a


         Figura: Master
                                                   Figura: 4 Esclavos en 4 pcs diferentes




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Ejecuci´n y Log
       o




                  `     `
                  Angel Alvarez Serra   Pentaho Kettle Step
Depuraci´n
        o




             `     `
             Angel Alvarez Serra   Pentaho Kettle Step
Introducci´n
          o


  Es un plugin para Kettle para volcar datos a OpenErp, facilitando el
  mapeo de datos.


   Necesidad de
   introducir datos de
   forma consistente en
   OpenErp.
   Marca los campos
   obligatorios
   Facil introducci´n de
                   o
   los campos
   relaciones.




                           `     `
                           Angel Alvarez Serra   Pentaho Kettle Step
Instalaci´n
         o

  Para la instalaci´n del plugin es necesario:
                   o
       Descargar la versi´n de kettle de http://kettle.pentaho.org/
                         o
       Decargar el Plugin
       textbrbzr branch lp:openerp-kettle

  En la estructura de directorios del plugin:
         distrib copiar a KETTLEDIR/plugins/steps
          libext copiar las librerias a KETTLEDIR/libext



  Finalmente ejecutamos KETTLEDIR/spoon.sh y
  buscamos el plugin en transformaciones/output.




                           `     `
                           Angel Alvarez Serra   Pentaho Kettle Step
Como utilizarlo


     Introducir la IP del servidor.
     Introducir el usuario y la contrasenya.




     Obtener y Seleccionar la Base de datos.




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Obterner y Seleccionar los modelos.




                   `     `
                   Angel Alvarez Serra   Pentaho Kettle Step
Obterner los campos y assignar los valores.




                   `     `
                   Angel Alvarez Serra   Pentaho Kettle Step
Estado de OpenErp Kettle Step



  Plugin en estado de desarrollo, con cosas pendientes pero totalmente
  funcional. Se ha utilizado con ´xito en la migraci´n de aplicaciones a
                                 e                  o
  OpenErp.

  Cosas Pendientes:

      traducci´n de los campos.
              o

      Campos selecci´n de openerp.
                    o

      Lavado de cara al di´logo.
                          a




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Preguntas




            `     `
            Angel Alvarez Serra   Pentaho Kettle Step

Mais conteúdo relacionado

Destaque

Business Intelligence and Big Data Analytics with Pentaho
Business Intelligence and Big Data Analytics with Pentaho Business Intelligence and Big Data Analytics with Pentaho
Business Intelligence and Big Data Analytics with Pentaho Uday Kothari
 
Docker Ecosystem: Engine, Compose, Machine, Swarm, Registry
Docker Ecosystem: Engine, Compose, Machine, Swarm, RegistryDocker Ecosystem: Engine, Compose, Machine, Swarm, Registry
Docker Ecosystem: Engine, Compose, Machine, Swarm, RegistryMario IC
 
Pentaho | Data Integration & Report designer
Pentaho | Data Integration & Report designerPentaho | Data Integration & Report designer
Pentaho | Data Integration & Report designerHamdi Hmidi
 
Jenkins Peru Meetup Docker Ecosystem
Jenkins Peru Meetup Docker EcosystemJenkins Peru Meetup Docker Ecosystem
Jenkins Peru Meetup Docker EcosystemMario IC
 
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?Carlos Sanchez
 
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12Puppet
 
Indic threads pune12-accelerating computation in html 5
Indic threads pune12-accelerating computation in html 5Indic threads pune12-accelerating computation in html 5
Indic threads pune12-accelerating computation in html 5IndicThreads
 
Introduction to docker swarm
Introduction to docker swarmIntroduction to docker swarm
Introduction to docker swarmWalid Ashraf
 
Docker swarm introduction
Docker swarm introductionDocker swarm introduction
Docker swarm introductionEvan Lin
 
Load Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINXLoad Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINXNGINX, Inc.
 
Building a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerBuilding a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerWellington Marinho
 
Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)Dennys Hsieh
 
Continuous ETL Testing for Pentaho Data Integration (kettle)
Continuous ETL Testing for Pentaho Data Integration (kettle)Continuous ETL Testing for Pentaho Data Integration (kettle)
Continuous ETL Testing for Pentaho Data Integration (kettle)Slawomir Chodnicki
 
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)Roland Bouman
 
Seven Habits of Highly Effective Jenkins Users (2014 edition!)
Seven Habits of Highly Effective Jenkins Users (2014 edition!)Seven Habits of Highly Effective Jenkins Users (2014 edition!)
Seven Habits of Highly Effective Jenkins Users (2014 edition!)Andrew Bayer
 
Docker Swarm 0.2.0
Docker Swarm 0.2.0Docker Swarm 0.2.0
Docker Swarm 0.2.0Docker, Inc.
 

Destaque (17)

Introduction to GPU Programming
Introduction to GPU ProgrammingIntroduction to GPU Programming
Introduction to GPU Programming
 
Business Intelligence and Big Data Analytics with Pentaho
Business Intelligence and Big Data Analytics with Pentaho Business Intelligence and Big Data Analytics with Pentaho
Business Intelligence and Big Data Analytics with Pentaho
 
Docker Ecosystem: Engine, Compose, Machine, Swarm, Registry
Docker Ecosystem: Engine, Compose, Machine, Swarm, RegistryDocker Ecosystem: Engine, Compose, Machine, Swarm, Registry
Docker Ecosystem: Engine, Compose, Machine, Swarm, Registry
 
Pentaho | Data Integration & Report designer
Pentaho | Data Integration & Report designerPentaho | Data Integration & Report designer
Pentaho | Data Integration & Report designer
 
Jenkins Peru Meetup Docker Ecosystem
Jenkins Peru Meetup Docker EcosystemJenkins Peru Meetup Docker Ecosystem
Jenkins Peru Meetup Docker Ecosystem
 
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
 
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
 
Indic threads pune12-accelerating computation in html 5
Indic threads pune12-accelerating computation in html 5Indic threads pune12-accelerating computation in html 5
Indic threads pune12-accelerating computation in html 5
 
Introduction to docker swarm
Introduction to docker swarmIntroduction to docker swarm
Introduction to docker swarm
 
Docker swarm introduction
Docker swarm introductionDocker swarm introduction
Docker swarm introduction
 
Load Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINXLoad Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINX
 
Building a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerBuilding a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and Docker
 
Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)
 
Continuous ETL Testing for Pentaho Data Integration (kettle)
Continuous ETL Testing for Pentaho Data Integration (kettle)Continuous ETL Testing for Pentaho Data Integration (kettle)
Continuous ETL Testing for Pentaho Data Integration (kettle)
 
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
 
Seven Habits of Highly Effective Jenkins Users (2014 edition!)
Seven Habits of Highly Effective Jenkins Users (2014 edition!)Seven Habits of Highly Effective Jenkins Users (2014 edition!)
Seven Habits of Highly Effective Jenkins Users (2014 edition!)
 
Docker Swarm 0.2.0
Docker Swarm 0.2.0Docker Swarm 0.2.0
Docker Swarm 0.2.0
 

Semelhante a Pentaho Kettle ETL

Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETLSpanishPASSVC
 
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics Spain
 
Periodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourcePeriodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourceStratebi
 
Estructuras repetitivas herramienta case jean
Estructuras repetitivas herramienta case jeanEstructuras repetitivas herramienta case jean
Estructuras repetitivas herramienta case jeanMorelo Alegre JanKee
 
Proceso lineal e intermitente
Proceso lineal e intermitenteProceso lineal e intermitente
Proceso lineal e intermitenteLilianaSamayoa1
 
Etl extracción transformación y carga de datos
Etl extracción transformación y carga de datosEtl extracción transformación y carga de datos
Etl extracción transformación y carga de datosLeonel Ibarra
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informeCarlosTenelema1
 
Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014JOSE AHIAS LOPEZ PORTILLO
 
IdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXToolsIdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXToolsGeneXus
 
Tipos de Sistemas Transaccionales
Tipos de Sistemas TransaccionalesTipos de Sistemas Transaccionales
Tipos de Sistemas TransaccionalesHome
 
Devops meetup 21 de Junio 2017
Devops meetup 21 de Junio 2017Devops meetup 21 de Junio 2017
Devops meetup 21 de Junio 2017Eduardo Diaz
 

Semelhante a Pentaho Kettle ETL (20)

Kafkadb
KafkadbKafkadb
Kafkadb
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014
 
Periodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourcePeriodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open Source
 
Estructuras repetitivas herramienta case jean
Estructuras repetitivas herramienta case jeanEstructuras repetitivas herramienta case jean
Estructuras repetitivas herramienta case jean
 
Proceso lineal e intermitente
Proceso lineal e intermitenteProceso lineal e intermitente
Proceso lineal e intermitente
 
Etl
EtlEtl
Etl
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Etl extracción transformación y carga de datos
Etl extracción transformación y carga de datosEtl extracción transformación y carga de datos
Etl extracción transformación y carga de datos
 
Capítulo 04 objetos fijos
Capítulo 04 objetos fijosCapítulo 04 objetos fijos
Capítulo 04 objetos fijos
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014
 
IdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXToolsIdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXTools
 
Proceso ETL 1.pptx
Proceso ETL 1.pptxProceso ETL 1.pptx
Proceso ETL 1.pptx
 
ETL
ETLETL
ETL
 
ETL
ETLETL
ETL
 
Etl
EtlEtl
Etl
 
120675 180112011233
120675 180112011233120675 180112011233
120675 180112011233
 
Tipos de Sistemas Transaccionales
Tipos de Sistemas TransaccionalesTipos de Sistemas Transaccionales
Tipos de Sistemas Transaccionales
 
Devops meetup 21 de Junio 2017
Devops meetup 21 de Junio 2017Devops meetup 21 de Junio 2017
Devops meetup 21 de Junio 2017
 

Mais de raimonesteve

Tryton Point of Sale - POS
Tryton Point of Sale - POSTryton Point of Sale - POS
Tryton Point of Sale - POSraimonesteve
 
Training. Módolos para centros educativos
Training. Módolos para centros educativosTraining. Módolos para centros educativos
Training. Módolos para centros educativosraimonesteve
 
Zzsaas - OpenERP SaaS
Zzsaas - OpenERP SaaSZzsaas - OpenERP SaaS
Zzsaas - OpenERP SaaSraimonesteve
 
Zoook - Comercio electrónico de OpenERP
Zoook - Comercio electrónico de OpenERPZoook - Comercio electrónico de OpenERP
Zoook - Comercio electrónico de OpenERPraimonesteve
 
Connecting your Python App to OpenERP through OOOP
Connecting your Python App to OpenERP through OOOPConnecting your Python App to OpenERP through OOOP
Connecting your Python App to OpenERP through OOOPraimonesteve
 
OpenERP. L'ERP lliure
OpenERP. L'ERP lliureOpenERP. L'ERP lliure
OpenERP. L'ERP lliureraimonesteve
 
Fernando Estructuras. OpenERP
Fernando Estructuras. OpenERPFernando Estructuras. OpenERP
Fernando Estructuras. OpenERPraimonesteve
 
JasperReports, informes con diseño
JasperReports, informes con diseñoJasperReports, informes con diseño
JasperReports, informes con diseñoraimonesteve
 
Poweremail, el gestor de correo de OpenERP
Poweremail, el gestor de correo de OpenERPPoweremail, el gestor de correo de OpenERP
Poweremail, el gestor de correo de OpenERPraimonesteve
 
Magento - Magquè?
Magento - Magquè?Magento - Magquè?
Magento - Magquè?raimonesteve
 
OpenErp 5 Novedades para el usuario
OpenErp 5 Novedades para el usuarioOpenErp 5 Novedades para el usuario
OpenErp 5 Novedades para el usuarioraimonesteve
 
Generación de informes usando Jasper Reports
Generación de informes usando Jasper ReportsGeneración de informes usando Jasper Reports
Generación de informes usando Jasper Reportsraimonesteve
 
OpenErp - osCommerce y Magento (integración)
OpenErp - osCommerce y Magento (integración)OpenErp - osCommerce y Magento (integración)
OpenErp - osCommerce y Magento (integración)raimonesteve
 
¿Openerp y CMS? RadioTV
¿Openerp y CMS? RadioTV¿Openerp y CMS? RadioTV
¿Openerp y CMS? RadioTVraimonesteve
 

Mais de raimonesteve (15)

Tryton Point of Sale - POS
Tryton Point of Sale - POSTryton Point of Sale - POS
Tryton Point of Sale - POS
 
Training. Módolos para centros educativos
Training. Módolos para centros educativosTraining. Módolos para centros educativos
Training. Módolos para centros educativos
 
Zzsaas - OpenERP SaaS
Zzsaas - OpenERP SaaSZzsaas - OpenERP SaaS
Zzsaas - OpenERP SaaS
 
Zoook - Comercio electrónico de OpenERP
Zoook - Comercio electrónico de OpenERPZoook - Comercio electrónico de OpenERP
Zoook - Comercio electrónico de OpenERP
 
Connecting your Python App to OpenERP through OOOP
Connecting your Python App to OpenERP through OOOPConnecting your Python App to OpenERP through OOOP
Connecting your Python App to OpenERP through OOOP
 
OpenERP. L'ERP lliure
OpenERP. L'ERP lliureOpenERP. L'ERP lliure
OpenERP. L'ERP lliure
 
Fernando Estructuras. OpenERP
Fernando Estructuras. OpenERPFernando Estructuras. OpenERP
Fernando Estructuras. OpenERP
 
JasperReports, informes con diseño
JasperReports, informes con diseñoJasperReports, informes con diseño
JasperReports, informes con diseño
 
Poweremail, el gestor de correo de OpenERP
Poweremail, el gestor de correo de OpenERPPoweremail, el gestor de correo de OpenERP
Poweremail, el gestor de correo de OpenERP
 
Magento - Magquè?
Magento - Magquè?Magento - Magquè?
Magento - Magquè?
 
OpenErp 5 Novedades para el usuario
OpenErp 5 Novedades para el usuarioOpenErp 5 Novedades para el usuario
OpenErp 5 Novedades para el usuario
 
Generación de informes usando Jasper Reports
Generación de informes usando Jasper ReportsGeneración de informes usando Jasper Reports
Generación de informes usando Jasper Reports
 
¿Que es Openerp?
¿Que es Openerp?¿Que es Openerp?
¿Que es Openerp?
 
OpenErp - osCommerce y Magento (integración)
OpenErp - osCommerce y Magento (integración)OpenErp - osCommerce y Magento (integración)
OpenErp - osCommerce y Magento (integración)
 
¿Openerp y CMS? RadioTV
¿Openerp y CMS? RadioTV¿Openerp y CMS? RadioTV
¿Openerp y CMS? RadioTV
 

Último

El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaarkananubis
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativaAdrianaMartnez618894
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..RobertoGumucio2
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 

Último (20)

El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en mina
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativa
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 

Pentaho Kettle ETL

  • 1. Pentaho Kettle Step ` ` Angel Alvarez Serra 18 Abril 2009 ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 2. Introducci´n a ETL. o Introducci´n a Kettle. o Transformaciones. Trabajos. OpenErp Kettle Step Instalaci´n. o Como Utilizarlo. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 3. Introducci´n a ETL o Herramienta para la obtenci´n, transformaci´n y volcado de datos de o o origenes y destinos diferentes Extraer datos de varias fuentes Diversos tipos de base de datos, oracles, access... ficheros de texto ( csv, longitud fija, xml ), origenes rss, ficheros remotos... Transformar Datos Hacer c´lculos, unir tablas, descartar datos, cambiar a tipos, lanzar procesos de la base de datos ... Volcar datos Volcar a ficheros, base de datos, ficheros remotos... ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 4. Utilidades Hacer traspasos de datos completos ante la implantaci´n de un o nuevo sistema. Hacer volcados de informaci´n automatizados hacia el o DataWareHouse. Importar datos de ficheros externos, ( ficheros batch de sistemas m´biles, noticias econ´micas de ficheros rss... o o Limpieza de datos del sistema actual aplicando complejas condiciones de borrado. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 5. Otros ETL En el mercado existen varios sistemas ETL, tanto comerciales como opensource. Requisitos a valorar a la hora de escoger un ETL. Facilidad de uso. Actividad del proyecto. N´mero de transformaciones disponibles y opciones de configuraci´n u o de estas. Facilidad a la hora de implementar una nueva Transforamci´n. o Integraci´n con un sistema de Bussiness Intelligent completo. o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 6. Costes del Trabajo con datos El manejo de datos es costoso, en la implantaci´n, importaci´n i o o exportaci´n, en tiempo, recursos y dinero. o La Finalidad de los ETL es el augmento de productividad para el trato con todo tipo de informaci´n. o Atacar cada caso en particular. Desarrollar un ETL propio. ETL comercial. ETL opensource. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 7. Introuducci´n a Kettle o Transformaciones Entidad b´sica de trabajo, define la obtenci´n, la a o transfomaci´n, el volcado o qualquier combinaci´n de o o estas. Trabajos Conjunto de transformaciones, permite el control de estados, marca el inicio , final , comunica si el proceso a tenido ´xito o no... e ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 8. Pasos (Step) Entidad b´sica de la transformaci´n. Acci´n a realizar. a o o Saltos (Hops) Define el paso entre diferentes pasos, posibilidad de paralelizar la acci´n, copiar datos a diferentes pasos... o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 9. Introuducci´n a Kettle o Interf´ Gr´fica ıcie a Repositorio Almac´n y organizaci´n de todas las e o transformaciones. Vista Control de todas los ’pasos’ de la transformaci´n o Dise˜o A˜adir y editar nuevos pasos a la transformaci´n n n o Panel de ejcuci´n Controla tiempo, n´mero de filas escritas y leidas o u por paso, an´lisis de impacto en la base de datos, a herramientas de depuraci´n... o Linea de comandos Pemite la ejecuci´n batch de los trabajos y transformaciones , ya o est´n en fichero como el repositorio. Permite la automatizaci´n de e o procesos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 10. Transformaciones Entradas Obtenci´n de datos,desde ficheros, base de datos, o sistema... Salidas A˜adir, actualizar o eliminar datos de la base de datos, n ficheros, hojas de c´lculo... a B´squeda Buscar valores en tablas, ficheros, llamadas a u procedimientos, webservices... Tranformaciones Aplicar funciones al estilo sql (Sort,Group By ),xml,c´lculos... a Uniones Unir registros de diferentes transformaciones, producto cartesiano, inner, left , right join... ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 11. Transformaciones (continuaci´n) o Scripting Facilidades de scripting en lenguajes Sql, Javascript y expresiones regulares. Data WareHouse Buscar o actualizar datos a nivel de dimensiones. Trabajos Acciones para la comunicaci´n con estos, obtener y asignar o variables, devolver el resultado de la transformaci´n... o Inline Lectura y escritura de registros a nivel socket. Datos Masivos Optimizaci´nes para trabajar con grandes cantidades de o datos, por ahora solo oracle. Experimental Transformaciones no del todo probadas, Datos Masivos para diferentes origenes. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 12. Trabajos General Controla el flujo del trabajo, llamadas a mas trabajos o transformaciones, generar log, finalizar la ejecuci´n... o Mail Obtener Mails de cuentas pop para procesar-los, y enviar emails. Gestor/Gestor Remoto de Ficheros Diferentes acciones de sistema, crear, comparar, mover,zip, unzip, ftp, scp.. Condiciones Comprobar si existen ficheros y datos en la base de datos, esperar a una cierta condici´n. o Scripting Shell, Sql, Javascript Xml Validador XML, XSL, XSD, transformaci´n XSL o Volcados Masivos Importar y Exportar grandes cantidades de datos de diferentes base de datos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 13. L´ ınea de comandos Ofrece la posibilidad de ejecutar las diferentes transforamciones y trabajos por lineas de comandos. Posibilidad de integrar con scripts. Automatizaci´n. o Posibilidad de ejecutar elementos guardados en el Repositorio. Ejecutar un trabajo Ejecutar una Transformaci´n o kitchen.bat /rep:’Production Repository’ pan.bat /rep:”Production Repository” /job:’Update dimensions’ /trans:”update Customer Dimension” /dir:/Dimensions /dir:/Dimensions/ /user:NaN /user:NaN /pass:somepassword /pass:somepassword /level:Basic /level:Basic ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 14. Clustering Paralelizaci´n de procesos para un gran volumen de datos de forma o senzilla y r´pida. a Figura: Master Figura: 4 Esclavos en 4 pcs diferentes ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 15. Ejecuci´n y Log o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 16. Depuraci´n o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 17. Introducci´n o Es un plugin para Kettle para volcar datos a OpenErp, facilitando el mapeo de datos. Necesidad de introducir datos de forma consistente en OpenErp. Marca los campos obligatorios Facil introducci´n de o los campos relaciones. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 18. Instalaci´n o Para la instalaci´n del plugin es necesario: o Descargar la versi´n de kettle de http://kettle.pentaho.org/ o Decargar el Plugin textbrbzr branch lp:openerp-kettle En la estructura de directorios del plugin: distrib copiar a KETTLEDIR/plugins/steps libext copiar las librerias a KETTLEDIR/libext Finalmente ejecutamos KETTLEDIR/spoon.sh y buscamos el plugin en transformaciones/output. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 19. Como utilizarlo Introducir la IP del servidor. Introducir el usuario y la contrasenya. Obtener y Seleccionar la Base de datos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 20. Obterner y Seleccionar los modelos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 21. Obterner los campos y assignar los valores. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 22. Estado de OpenErp Kettle Step Plugin en estado de desarrollo, con cosas pendientes pero totalmente funcional. Se ha utilizado con ´xito en la migraci´n de aplicaciones a e o OpenErp. Cosas Pendientes: traducci´n de los campos. o Campos selecci´n de openerp. o Lavado de cara al di´logo. a ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 23. Preguntas ` ` Angel Alvarez Serra Pentaho Kettle Step