Pentaho: Inteligência de
Negócios utilizando Software
           Livre.

               Festival Latino Americano de Instalação de
              Software Livre – São Paulo - 9 de abril de 2011
Por que BI?



    Utilizando estratégias de Inteligência de
Negócios (Business Intelligence - BI) é possível
  tomar decisões mais rápidas e seguras para
sua empresa. E utilizando a ferramenta certa de
   BI você garante o sucesso de seu projeto!
Projeto de BI
Pensadores (DW)


              Bill Inmon
    http://www.inmoncif.com/home/

                  &

             Ralph Kimball
http://www.rkimball.com/html/about.html
Star Schema
Ferramentas de BI

Os grandes fornecedores de ferramentas de BI são:
Open Source BI

No mundo de BI Open Source encontramos:
Pentaho

O Pentaho atualmente é a plataforma de
 inteligência de negócios de código aberto mais
 popular e poderosa no mundo.

No link abaixo você encontra um video contando
 a história da Pentaho de forma divertida

http://blog.professorcoruja.com/2011/04/pentaho-
  team-2009-pick-pentaho.html
Pentaho Corp.



●
  Fundada em 2004;
●
  Sede em Orlando, Florida, Estados Unidos;
●
  Aportes financeiros de fundos de investimentos
  como Enterprise Associates, investidores do
  SugarCRM, Xensource, Index Ventures,
  MySQL, Zend e outros.
Por que Pentaho?


●
  Funciona;
●
  Tecnologia Java;
●
  Código Aberto;
●
  Robusto;
●
  Confiável;
●
  Gratuito;
●
  Apoio da Comunidade;
●
  Testado por muitas empresas.
Links Importantes




●
  http://wiki.pentaho.com
●
  http://forums.pentaho.com/
●
  http://sourceforge.net/projects/pentaho/
Possibilidades



Permite realizar consultas, relatórios, análise de
 informações (OLAP), painéis (dashboards) para
 controle gerencial, ETL e mineração de dados
 (Data Mining).
Mobilidade


Acesso ao Portal de BI através de Celulares.
Vantagens



  Custo Zero de Licença do Pentaho;

  Desenvolvimento customizado dos Indicadores
de Negócios (Relatórios, Cubos e Dashboards);

  Acesso web aos Indicadores independente de
sistema operacional (Windows, Linux, Mac,
iPhone).
Pentaho BI Suite




  JAVA;

  Padrões Abertos;

  Multi Plataforma;
Equipe Pentaho
Blogs Pentaho

Blog Doug Moran (Pentaho Community Guy)
http://dougmoran.blogspot.com/

Blog Matt Casters (Kettle Guy)
http://www.ibridge.be/

Blog Julian Hyde (Mondrian Guy)
http://julianhyde.blogspot.com/

Blog Thomas Morgner (Reporting Guy)
http://www.sherito.org/

Blog Pedro Alves (CDF Guy)
http://pedroalves-bi.blogspot.com/

Blog Roland Bouman (Author of Pentaho Solutions Book)
http://rpbouman.blogspot.com/
Blogs Pentaho

Nicholas Goodman
http://www.nicholasgoodman.com/bt/blog/

Gretchen Moran
http://gretchenmoran.blogspot.com

Michael Tarallo
http://michaeltarallo.blogspot.com/

James Dixon
http://jamesdixon.wordpress.com/

Will Gorman
http://www.willgorman.com/
Licença



  A plataforma Pentaho é distribuída como Código
Aberto através da Licença Pública da Pentaho
(PPL,do inglês, Pentaho Public License). Uma
cópia desta licença está disponível em
http://www.pentaho.org/license.

  A PPL é similar à Licença Pública do Mozilla
V1.1, com exceção de um atributo adicional.
Pentaho CE ou EE




  Pentaho CE (Community Edition): gratuita;

  Pentaho EE (Enterprise Edition): paga;

Para realizar comparações entre as versões
acesse:

http://www.pentaho.com/products/enterprise/ent
erprise_comparison.php
Clientes Pentaho

Os produtos da empresa Pentaho têm sido utilizados
por organizações como:
Arquitetura BI




         Fonte: Pentaho
Conexão com os
diversos Bancos de
      Dados
Apresentação das
 Ferramentas do
     Pentaho
Kettle (ETL)


  Também conhecido como PDI (Pentaho Data
Integration);

  Realiza integração de dados entre empresas e
sistemas;

  Lê e escreve mais de 10 formatos de SGBD,
como Oracle, PostgreSQL, SQL Server, etc;

  Importa arquivos texto, excel e bases de dados;

  Responsável pelos processos de ETL.
Kettle (ETL)




  Desenvolvido por profissionais que trabalharam
em empresas como a Informatica e SAS;

  Comparavél com as ferramentas comerciais;

  Ambiente gráfico que possibilita a criação dos
processos de ETL de forma visual.
Exemplo ETL
Cubo OLAP

Editor de Texto
Cube Designer
Schema Workbench
Mondrian

●
  Servidor OLAP (online analytical processing);
●
  Open Source;
●
  Escrito em Java;
●
  Suporta consultas MDX (multidimensional
  expressions);
●
  EPL – Eclipse Public License;
●
  Criado por Julian Hyde;
●
  Adquirido pela Pentaho;
Cubo
Cubos OLAP


                                      Schema
                                      Workbench




Cube Designer



                Pivot
                Table/
                Drill
                Down
Schema Mondrian

A dimensional model (logical)
  – Cubes & virtual cubes
  – Shared & private dimensions
  – Calculated measures in cube
    and in query language
  – Parent-child hierarchies

… mapped onto a star/snowflake
 schema (physical)
  – Fact table
  – Dimension tables
  – Joined by foreign key
    relationships
   Fonte: Apresentação Julian Hyde
Exemplo Cubo
jPivot
jPivot
jPivot
Visões jPivot
jPivot
jPivot
Relatórios

Report Designer
JasperReports
BIRT
Report Designer



  Também conhecido como PRD (Pentaho Report
Designer);

  Auxilia na criação de relatórios;

  Muito parecido com outras ferramentas
comerciais;

  Pode-se também utilizar o iReport para criar
relatórios.
Relatórios




Eclipse Birt

                                   Report
                                   Designer
               Ad-Hoc
               Reporting
                                 Jfreereport
Design Studio



•   Utilizado para o desenvolvimento das
    xactions;
•   Ferramenta baseada no Eclipse;
•   Pode ser usada como plug-in do Eclipse.
Data Mining

Weka
WEKA – Data Mining
•   Weka (Waikato Environment for Knowledge
    Analysis)
•   Ferramenta de Data Mining criada em 1993
    pela “University of Waikato” (Nova Zelândia);
•   Desenvolvida em Java;
•   Recebe o SIGKDD Data Mining and
    Knowledge Discovery Service Award em
    2005;
•   Em 2006 é comprada pela Pentaho;
•   GNU – General Public License.
•   Site: http://www.cs.waikato.ac.nz/ml/weka/
WEKA
Weka na CPBR10


  Oficina: Data Mining Weka na Campus Party
2010 pelos Campuseiros Ary Fagundes Bressane
Neto (pesquisador de Inteligência Artificial) e
Flávio Soares Corrêa da Silva (livre docente da
USP)

   Link da Oficina:
http://blog.professorcoruja.com/2010/02/software-
livre-oficina-data-mining-weka.html
Dashboards

Java / JSP / Javascript / Programação
CDF (Community Dashboard Framework)
CDF Dashboard
                     Editor


Ferramenta web criada pela Comunidade (Pedro
Alves e outros) para facilitar o desenvolvimento
de dashboards.

Informações sobre o projeto:
http://code.google.com/p/cdf-de/
Dashboards
Dashboards




                                                   Google Mantle
                                                   Project


Integração com o
Google Maps

                    Pentaho Spreadsheet Services
Dashboards
Dashboards
Dashboards
Dashboards
Dashboards
Conhecendo o
Pentaho BI Server
Pentaho BI Server
PUC (Pentaho
 User Console)
Tradução PUC




http://blog.professorcoruja.com/2009/06/traducao-
         pentaho-bi-server-20-e-30-para.html
BI Mobile
BI Mobile
BI Mobile
BI Mobile
Comunidade

O Perfil da Comunidade Pentaho:

  Empresas Públicas;

  Empresas Privadas;

  Universidades:
   
     Alunos de Graduação;
   
     Alunos de Pós-Graduação;
   
     Professores.
Quantos somos




●
    No Brasil há cerca de 1000 pessoas
    cadastradas nas listas de Pentaho e muitas
    outras que utilizam a ferramenta mas não
    fazem parte destas listas.
Como participamos



●
  Fórum de discussão da Pentaho (Oficial);
●
  IRC;
●
  Twitter;
●
  Listas de discussão;
●
  Blogs;
●
  E-mails;
●
  Encontros nacionais e internacionais.
Evento Internacional




Evento Internacional da Pentaho - Barcelona 2009
Lista de Discussões



●
  Pentaho Brasil
      (pentahobrasil@googlegroups.com)
●
  Pentaho BR
      (pentahobr@yahoogroups.com.br)
Algumas
contribuições para a
   Comunidade...
Introdução


●
    Acesse os links abaixo para uma introdução ao
    Pentaho

        http://blog.professorcoruja.com/2009/03/ent
          endendo-o-pentaho-faq.html

        http://blog.professorcoruja.com/2011/01/intr
          oducao-ao-pentaho.html
Instalação

●
    Acesse os links abaixo para aprender a fazer
    uma instalação básica e uma outra um pouco
    mais avançada do Pentaho

        http://blog.professorcoruja.com/2009/09/co
          mo-instalar-o-pentaho.html

        http://blog.professorcoruja.com/2011/01/ins
          talacao-avancada-do-pentaho-bi.html
Universidades


●
    Colaborações de Universidades Brasileiras

        http://blog.professorcoruja.com/2011/01/ma
          terial-bi-suite-pentaho-desenvolvido.html

        http://blog.professorcoruja.com/2011/01/ma
          nual-de-utilizacao-do-pentaho-feito.html
Dashboards



●
    Video-aula de como criar um dashboard

        http://blog.professorcoruja.com/2011/02/vid
          eo-aula-gratuita-criacao-de-um.html
Mondrian



●
    Entenda mais sobre o Mondrian OLAP Server

        http://blog.professorcoruja.com/2010/05/ent
          endendo-o-mondrian-olap-server.html
Tabelas Agregadas

●
    Entenda mais sobre tabelas agregadas

        http://blog.professorcoruja.com/2010/11/me
          lhore-performance-de-seus-cubos-
          olap.html

        http://blog.professorcoruja.com/2010/11/pe
          ntaho-aggregation-designer-
          overview.html
Tabelas Agregadas


●
    Entenda mais sobre o Mondrian OLAP Server

        http://blog.professorcoruja.com/2010/11/me
          lhore-performance-de-seus-cubos-
          olap.html
Videos

●
    Assista alguns videos:

        http://blog.professorcoruja.com/2011/01/vid
          eo-gratuito-palestra-pentaho-
          campus.html

        http://blog.professorcoruja.com/2010/09/vid
          eo-gratuito-oficina-de-pentaho.html
Caso de Sucesso



●
    Dia % Brasil

http://www.slideshare.net/caiomsouza/it4biz-
 caso-de-sucesso-pentaho-dia-brasil
Obrigado


    Caio Moreno de Souza

       caio@it4biz.com.br
    caiomsouza@gmail.com
    twitter.com/caiomsouza
http://blog.professorcoruja.com

Pentaho: Inteligência de Negócios utilizando Software Livre - FliSOL São Paulo - 2011

  • 1.
    Pentaho: Inteligência de Negóciosutilizando Software Livre. Festival Latino Americano de Instalação de Software Livre – São Paulo - 9 de abril de 2011
  • 2.
    Por que BI? Utilizando estratégias de Inteligência de Negócios (Business Intelligence - BI) é possível tomar decisões mais rápidas e seguras para sua empresa. E utilizando a ferramenta certa de BI você garante o sucesso de seu projeto!
  • 3.
  • 4.
    Pensadores (DW) Bill Inmon http://www.inmoncif.com/home/ & Ralph Kimball http://www.rkimball.com/html/about.html
  • 5.
  • 6.
    Ferramentas de BI Osgrandes fornecedores de ferramentas de BI são:
  • 7.
    Open Source BI Nomundo de BI Open Source encontramos:
  • 8.
    Pentaho O Pentaho atualmenteé a plataforma de inteligência de negócios de código aberto mais popular e poderosa no mundo. No link abaixo você encontra um video contando a história da Pentaho de forma divertida http://blog.professorcoruja.com/2011/04/pentaho- team-2009-pick-pentaho.html
  • 9.
    Pentaho Corp. ● Fundada em 2004; ● Sede em Orlando, Florida, Estados Unidos; ● Aportes financeiros de fundos de investimentos como Enterprise Associates, investidores do SugarCRM, Xensource, Index Ventures, MySQL, Zend e outros.
  • 10.
    Por que Pentaho? ● Funciona; ● Tecnologia Java; ● Código Aberto; ● Robusto; ● Confiável; ● Gratuito; ● Apoio da Comunidade; ● Testado por muitas empresas.
  • 11.
    Links Importantes ● http://wiki.pentaho.com ● http://forums.pentaho.com/ ● http://sourceforge.net/projects/pentaho/
  • 12.
    Possibilidades Permite realizar consultas,relatórios, análise de informações (OLAP), painéis (dashboards) para controle gerencial, ETL e mineração de dados (Data Mining).
  • 13.
    Mobilidade Acesso ao Portalde BI através de Celulares.
  • 14.
    Vantagens  CustoZero de Licença do Pentaho;  Desenvolvimento customizado dos Indicadores de Negócios (Relatórios, Cubos e Dashboards);  Acesso web aos Indicadores independente de sistema operacional (Windows, Linux, Mac, iPhone).
  • 15.
    Pentaho BI Suite  JAVA;  Padrões Abertos;  Multi Plataforma;
  • 16.
  • 17.
    Blogs Pentaho Blog DougMoran (Pentaho Community Guy) http://dougmoran.blogspot.com/ Blog Matt Casters (Kettle Guy) http://www.ibridge.be/ Blog Julian Hyde (Mondrian Guy) http://julianhyde.blogspot.com/ Blog Thomas Morgner (Reporting Guy) http://www.sherito.org/ Blog Pedro Alves (CDF Guy) http://pedroalves-bi.blogspot.com/ Blog Roland Bouman (Author of Pentaho Solutions Book) http://rpbouman.blogspot.com/
  • 18.
    Blogs Pentaho Nicholas Goodman http://www.nicholasgoodman.com/bt/blog/ GretchenMoran http://gretchenmoran.blogspot.com Michael Tarallo http://michaeltarallo.blogspot.com/ James Dixon http://jamesdixon.wordpress.com/ Will Gorman http://www.willgorman.com/
  • 19.
    Licença  Aplataforma Pentaho é distribuída como Código Aberto através da Licença Pública da Pentaho (PPL,do inglês, Pentaho Public License). Uma cópia desta licença está disponível em http://www.pentaho.org/license.  A PPL é similar à Licença Pública do Mozilla V1.1, com exceção de um atributo adicional.
  • 20.
    Pentaho CE ouEE  Pentaho CE (Community Edition): gratuita;  Pentaho EE (Enterprise Edition): paga; Para realizar comparações entre as versões acesse: http://www.pentaho.com/products/enterprise/ent erprise_comparison.php
  • 21.
    Clientes Pentaho Os produtosda empresa Pentaho têm sido utilizados por organizações como:
  • 22.
    Arquitetura BI Fonte: Pentaho
  • 23.
    Conexão com os diversosBancos de Dados
  • 24.
  • 25.
    Kettle (ETL)  Também conhecido como PDI (Pentaho Data Integration);  Realiza integração de dados entre empresas e sistemas;  Lê e escreve mais de 10 formatos de SGBD, como Oracle, PostgreSQL, SQL Server, etc;  Importa arquivos texto, excel e bases de dados;  Responsável pelos processos de ETL.
  • 26.
    Kettle (ETL)  Desenvolvido por profissionais que trabalharam em empresas como a Informatica e SAS;  Comparavél com as ferramentas comerciais;  Ambiente gráfico que possibilita a criação dos processos de ETL de forma visual.
  • 27.
  • 28.
    Cubo OLAP Editor deTexto Cube Designer Schema Workbench
  • 29.
    Mondrian ● ServidorOLAP (online analytical processing); ● Open Source; ● Escrito em Java; ● Suporta consultas MDX (multidimensional expressions); ● EPL – Eclipse Public License; ● Criado por Julian Hyde; ● Adquirido pela Pentaho;
  • 30.
  • 31.
    Cubos OLAP Schema Workbench Cube Designer Pivot Table/ Drill Down
  • 32.
    Schema Mondrian A dimensionalmodel (logical) – Cubes & virtual cubes – Shared & private dimensions – Calculated measures in cube and in query language – Parent-child hierarchies … mapped onto a star/snowflake schema (physical) – Fact table – Dimension tables – Joined by foreign key relationships Fonte: Apresentação Julian Hyde
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
    Report Designer  Também conhecido como PRD (Pentaho Report Designer);  Auxilia na criação de relatórios;  Muito parecido com outras ferramentas comerciais;  Pode-se também utilizar o iReport para criar relatórios.
  • 42.
    Relatórios Eclipse Birt Report Designer Ad-Hoc Reporting Jfreereport
  • 43.
    Design Studio • Utilizado para o desenvolvimento das xactions; • Ferramenta baseada no Eclipse; • Pode ser usada como plug-in do Eclipse.
  • 44.
  • 45.
    WEKA – DataMining • Weka (Waikato Environment for Knowledge Analysis) • Ferramenta de Data Mining criada em 1993 pela “University of Waikato” (Nova Zelândia); • Desenvolvida em Java; • Recebe o SIGKDD Data Mining and Knowledge Discovery Service Award em 2005; • Em 2006 é comprada pela Pentaho; • GNU – General Public License. • Site: http://www.cs.waikato.ac.nz/ml/weka/
  • 46.
  • 47.
    Weka na CPBR10  Oficina: Data Mining Weka na Campus Party 2010 pelos Campuseiros Ary Fagundes Bressane Neto (pesquisador de Inteligência Artificial) e Flávio Soares Corrêa da Silva (livre docente da USP)  Link da Oficina: http://blog.professorcoruja.com/2010/02/software- livre-oficina-data-mining-weka.html
  • 48.
    Dashboards Java / JSP/ Javascript / Programação CDF (Community Dashboard Framework)
  • 49.
    CDF Dashboard Editor Ferramenta web criada pela Comunidade (Pedro Alves e outros) para facilitar o desenvolvimento de dashboards. Informações sobre o projeto: http://code.google.com/p/cdf-de/
  • 50.
  • 51.
    Dashboards Google Mantle Project Integração com o Google Maps Pentaho Spreadsheet Services
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
  • 64.
  • 65.
    Comunidade O Perfil daComunidade Pentaho:  Empresas Públicas;  Empresas Privadas;  Universidades:  Alunos de Graduação;  Alunos de Pós-Graduação;  Professores.
  • 66.
    Quantos somos ● No Brasil há cerca de 1000 pessoas cadastradas nas listas de Pentaho e muitas outras que utilizam a ferramenta mas não fazem parte destas listas.
  • 67.
    Como participamos ● Fórum de discussão da Pentaho (Oficial); ● IRC; ● Twitter; ● Listas de discussão; ● Blogs; ● E-mails; ● Encontros nacionais e internacionais.
  • 68.
    Evento Internacional Evento Internacionalda Pentaho - Barcelona 2009
  • 69.
    Lista de Discussões ● Pentaho Brasil (pentahobrasil@googlegroups.com) ● Pentaho BR (pentahobr@yahoogroups.com.br)
  • 70.
  • 71.
    Introdução ● Acesse os links abaixo para uma introdução ao Pentaho http://blog.professorcoruja.com/2009/03/ent endendo-o-pentaho-faq.html http://blog.professorcoruja.com/2011/01/intr oducao-ao-pentaho.html
  • 72.
    Instalação ● Acesse os links abaixo para aprender a fazer uma instalação básica e uma outra um pouco mais avançada do Pentaho http://blog.professorcoruja.com/2009/09/co mo-instalar-o-pentaho.html http://blog.professorcoruja.com/2011/01/ins talacao-avancada-do-pentaho-bi.html
  • 73.
    Universidades ● Colaborações de Universidades Brasileiras http://blog.professorcoruja.com/2011/01/ma terial-bi-suite-pentaho-desenvolvido.html http://blog.professorcoruja.com/2011/01/ma nual-de-utilizacao-do-pentaho-feito.html
  • 74.
    Dashboards ● Video-aula de como criar um dashboard http://blog.professorcoruja.com/2011/02/vid eo-aula-gratuita-criacao-de-um.html
  • 75.
    Mondrian ● Entenda mais sobre o Mondrian OLAP Server http://blog.professorcoruja.com/2010/05/ent endendo-o-mondrian-olap-server.html
  • 76.
    Tabelas Agregadas ● Entenda mais sobre tabelas agregadas http://blog.professorcoruja.com/2010/11/me lhore-performance-de-seus-cubos- olap.html http://blog.professorcoruja.com/2010/11/pe ntaho-aggregation-designer- overview.html
  • 77.
    Tabelas Agregadas ● Entenda mais sobre o Mondrian OLAP Server http://blog.professorcoruja.com/2010/11/me lhore-performance-de-seus-cubos- olap.html
  • 78.
    Videos ● Assista alguns videos: http://blog.professorcoruja.com/2011/01/vid eo-gratuito-palestra-pentaho- campus.html http://blog.professorcoruja.com/2010/09/vid eo-gratuito-oficina-de-pentaho.html
  • 79.
    Caso de Sucesso ● Dia % Brasil http://www.slideshare.net/caiomsouza/it4biz- caso-de-sucesso-pentaho-dia-brasil
  • 80.
    Obrigado Caio Moreno de Souza caio@it4biz.com.br caiomsouza@gmail.com twitter.com/caiomsouza http://blog.professorcoruja.com