O objetivo geral desse trabalho é mostrar a importância de um sistema de inteligência de negócios nas empresas, demonstrando que a utilização adequada de um sistema de apoio à decisão ajuda na tomada de decisões estratégicas de forma acertada.
Qualquer empresa que deseja competir de forma inteligente precisa voltar seus
olhos para seus dados internos e para os dados disponíveis no mercado, organizando-os de forma a transformar esse amontoado de dados em informações relevantes para a tomada de decisão.
Grande parte das informações encontra-se espalhadas em sistemas da empresa, em
pastas compartilhadas, nos computadores dos funcionários, sistemas paralelos, sistemas legados, etc. Organizar essa enormidade de dados torna-se um grande desafio para os gestores da empresa.
O documento discute o modelo OSI de redes de computadores, descrevendo suas sete camadas, funções e interações. As camadas são Física, Enlace, Rede, Transporte, Sessão, Apresentação e Aplicação. Cada camada é responsável por tarefas específicas na transmissão e recepção de dados através da rede.
O documento descreve o protocolo HTTP, que é utilizado para transferência de dados na Internet entre cliente e servidor. Ele usa um mecanismo de requisição-resposta e opera na porta 80 por padrão. O HTTP suporta vários métodos como GET, POST, PUT e DELETE.
MDL é uma linguagem minimalista baseada em UML e MDD que tem como objetivo modelar elementos de software com ênfase em MDA. Ela possui apenas dois tipos de diagramas - Behavioral e Structural - que visam documentar projetos de forma ágil com regras simplificadas.
Banco de Dados - Transações e Controle de ConcorrênciaJuliano Padilha
O documento discute transações e controle de concorrência em bancos de dados. Explica o que são transações, suas propriedades ACID e estados. Também aborda o controle de concorrência, escalonamento serializável, bloqueios, e problemas clássicos como atualização perdida e leitura suja.
O documento discute estratégias de recuperação de falhas em bancos de dados, incluindo manter um log de transações, checkpoints periódicos e abordagens como "roubada" e "não forçada" para atualizar páginas no disco e recuperar o estado do banco de dados após falhas.
1) O documento discute transações em bancos de dados, definindo-as como unidades lógicas de trabalho envolvendo diversas operações. 2) Transações podem ser implícitas ou explícitas e precisam seguir as propriedades ACID (atomicidade, consistência, isolamento e durabilidade). 3) O documento também aborda deadlocks, principais comandos de transação e níveis de isolamento.
O documento descreve diversos tipos de servidores e sistemas operacionais servidores, incluindo suas funções e requisitos mínimos. É também discutido vários níveis de RAID e suas vantagens e desvantagens, assim como o conceito de hot swap que permite a troca de discos sem reiniciar o sistema.
O documento discute o modelo OSI de redes de computadores, descrevendo suas sete camadas, funções e interações. As camadas são Física, Enlace, Rede, Transporte, Sessão, Apresentação e Aplicação. Cada camada é responsável por tarefas específicas na transmissão e recepção de dados através da rede.
O documento descreve o protocolo HTTP, que é utilizado para transferência de dados na Internet entre cliente e servidor. Ele usa um mecanismo de requisição-resposta e opera na porta 80 por padrão. O HTTP suporta vários métodos como GET, POST, PUT e DELETE.
MDL é uma linguagem minimalista baseada em UML e MDD que tem como objetivo modelar elementos de software com ênfase em MDA. Ela possui apenas dois tipos de diagramas - Behavioral e Structural - que visam documentar projetos de forma ágil com regras simplificadas.
Banco de Dados - Transações e Controle de ConcorrênciaJuliano Padilha
O documento discute transações e controle de concorrência em bancos de dados. Explica o que são transações, suas propriedades ACID e estados. Também aborda o controle de concorrência, escalonamento serializável, bloqueios, e problemas clássicos como atualização perdida e leitura suja.
O documento discute estratégias de recuperação de falhas em bancos de dados, incluindo manter um log de transações, checkpoints periódicos e abordagens como "roubada" e "não forçada" para atualizar páginas no disco e recuperar o estado do banco de dados após falhas.
1) O documento discute transações em bancos de dados, definindo-as como unidades lógicas de trabalho envolvendo diversas operações. 2) Transações podem ser implícitas ou explícitas e precisam seguir as propriedades ACID (atomicidade, consistência, isolamento e durabilidade). 3) O documento também aborda deadlocks, principais comandos de transação e níveis de isolamento.
O documento descreve diversos tipos de servidores e sistemas operacionais servidores, incluindo suas funções e requisitos mínimos. É também discutido vários níveis de RAID e suas vantagens e desvantagens, assim como o conceito de hot swap que permite a troca de discos sem reiniciar o sistema.
Este documento discute o PostgreSQL, incluindo sua instalação, definição de dados, manipulação de dados e funções. Aborda tópicos como criação de bancos de dados, esquemas, tabelas e campos, além de consultas, funções internas e triggers.
O documento fornece uma introdução aos sistemas operativos, definindo-os como um conjunto de programas que permitem a interação entre o usuário, hardware e aplicativos. Explora conceitos-chave como processos, memória, arquivos e periféricos, e classifica sistemas operativos de acordo com fatores como número de usuários e programação simultânea.
O documento discute os processos e técnicas de teste de software, abordando tópicos como ciclo de vida de testes, métodos de teste, métricas e tecnologias. Ele destaca a importância da adoção de processos de qualidade para melhorar o desenvolvimento de software, reduzir custos e riscos.
O documento discute a evolução da arquitetura de sistemas, desde modelos monolíticos até modelos distribuídos em nuvem. Apresenta diferentes modelos como cliente-servidor, web, n camadas e orientado a serviços. Também discute tecnologias como WebServices, REST e JSON que permitem a integração entre sistemas distribuídos.
O documento descreve os modelos de especificação para sistemas, incluindo diagramas de fluxo de dados (DFD) que mostram como os dados são processados, e modelos estruturais como o modelo entidade-relacionamento que define a estrutura lógica dos dados.
Escalabilidade, Sharding, Paralelismo e Bigdata com PostgreSQL? Yes, we can!Matheus Espanhol
Palestra sobre escalabilidade e sharding no PostgreSQL. Apresentada no evento PgDay Campinas no dia 7 de Agosto de 2015. Exemplos apresentados disponíveis em https://github.com/matheusespanhol/postgresql-tutorials
Banco de Dados II Aula Dinâmica 1 (Perguntas e Respostas)Leinylson Fontinele
Este documento descreve as regras para uma dinâmica de perguntas e respostas em grupo sobre banco de dados. Os participantes serão divididos em 3 grupos com 4 integrantes cada. Cada grupo terá 120 segundos para responder perguntas e pontuará de acordo com acertos individuais e em equipe. O objetivo é testar o conhecimento dos participantes sobre conceitos de banco de dados.
Banco de Dados II Aula 11 - Gerenciamento de transação (transações - fundamen...Leinylson Fontinele
A aula apresentou os fundamentos e características do gerenciamento de transações em bancos de dados, incluindo: (1) o que são transações e seus estados, (2) as propriedades ACID que devem ser atendidas, (3) comandos SQL para transações como COMMIT e ROLLBACK, e (4) exemplos de transações.
A rede neural supervisionada chamada perceptron multicamadascesar do amaral
1) O documento discute o uso de redes neurais supervisionadas e árvores de decisão para analisar os dados de uma concessionária de automóveis.
2) Os dados incluem informações sobre clientes e suas respostas a ofertas de garantia estendida.
3) As técnicas de aprendizagem de máquina são aplicadas usando o software Weka para identificar padrões nos dados e prever as respostas dos clientes.
O documento apresenta uma introdução sobre dados, informação e banco de dados. Explica que dados representam entidades enquanto informação é um conjunto de dados associados a um contexto. Também descreve os principais componentes de um sistema de banco de dados, como a base de dados, o gerenciador de banco de dados e suas linguagens.
Este documento fornece uma introdução ao Microsoft Access 2010, descrevendo seus principais componentes e funções. Em 3 frases ou menos:
O documento apresenta o Microsoft Access 2010 como uma ferramenta para gerenciar bancos de dados, desde pequenas coleções de dados até sistemas complexos. Ele descreve os principais elementos da interface do usuário do Access e como planejar, criar e trabalhar com tabelas, consultas, formulários e relatórios. O texto serve como um guia introdutório para aqueles que desejam aprender a utilizar as funcionalidades bás
O documento descreve um sistema operativo servidor, especificamente o Windows Server 2008 R2. Ele discute o que é um sistema operativo servidor, exemplos como o Windows 2003 e Windows Server 2008 R2, e as características e requisitos mínimos de hardware do Windows Server 2008 R2.
SNMP é um protocolo de gerenciamento de rede que permite monitorar e controlar dispositivos em uma rede IP. Ele define um modelo de informação padrão chamado MIB (Management Information Base) que descreve os atributos de gerenciamento de cada dispositivo gerenciado, bem como as operações que podem ser executadas neles.
Os principais componentes do SNMP são:
- Agentes: Software residente nos dispositivos de rede que coleta e mantém informações de gerenciamento locais.
- Gerentes: Software que executa no sistema de gerenciamento de rede para comunicar-se com os agentes,
O documento discute a hierarquia de memória em sistemas de computadores. Explica que a hierarquia de memória visa dar a ilusão de memória ilimitada e rápida ao programador ao usar diferentes níveis de memória, com capacidade e velocidade variando entre os níveis. Define termos como acerto, falta e taxa de acertos para descrever o funcionamento da hierarquia.
1. O documento discute os conceitos fundamentais de bancos de dados, incluindo o que é um banco de dados, operações comuns, tipos de sistemas de banco de dados, e componentes como SGBD e usuários.
2. A arquitetura de banco de dados é explicada, com os níveis internos, conceituais e externos, mapeamentos entre eles e o papel do SGBD.
3. O modelo de entidade-relacionamento é introduzido como um modelo de dados conceitual para descrever dados e relações por me
O documento discute os conceitos básicos de banco de dados, definindo-o como uma estrutura lógica que armazena um conjunto de dados relacionados. Também define o que são dados e apresenta exemplos.
O documento descreve comandos do MS-DOS para gerenciar arquivos, diretórios e configurações do sistema como ipconfig, netstat, ping e shutdown. Inclui explicações sobre formatação e recuperação de dados, além de comandos para copiar, mover, renomear arquivos.
O documento descreve o que são triggers no SQL, como são associados a tabelas específicas e executados automaticamente sempre que há modificações nos dados da tabela. Explica também que triggers não podem ser chamados diretamente e fazem parte da mesma transação que disparou sua execução. Fornece orientações sobre como criar triggers e como funcionam para inserções, exclusões e atualizações.
Boas práticas no desenvolvimento de softwareFelipe
Um pequeno conjunto de boas práticas para o desenvolvimento de software. O conteúdo é recomendado para desenvolvedores iniciantes ou intermediários. O foco é em desenvolvimento Web, baseado em Sistemas de Informação, com uma linguagem fracamente tipada. Os exemplos são dados na linguagem PHP.
1) O documento apresenta os conceitos básicos de bancos de dados, incluindo características da abordagem de banco de dados, atores envolvidos e exemplos.
2) É fornecido um exemplo detalhado de um banco de dados universitário com tabelas de alunos, disciplinas e notas.
3) As fases de projeto de banco de dados são descritas, incluindo especificação, projeto conceitual, lógico e físico.
1. O relatório descreve as atividades realizadas durante um estágio na empresa de tecnologia Papagaio, onde o estagiário trabalhou no desenvolvimento do projeto FarmáciaJá, um sistema web para facilitar a compra e venda de produtos farmacêuticos.
2. As principais tarefas incluíram o cadastro, edição e listagem de produtos no sistema, integrando a lógica do backend com a interface do frontend.
3. O estágio proporcionou ao aluno experiência prática na área de desenvolvimento web usando Django e familiarização com process
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreIT4biz IT Solutions
O documento fornece uma introdução abrangente sobre a plataforma de inteligência de negócios open source Pentaho. Em três frases:
1) A plataforma Pentaho é uma solução completa de BI que inclui ferramentas para ETL, análise OLAP, relatórios, dashboards e mineração de dados usando tecnologias como Kettle, Mondrian, Report Designer e Weka.
2) Ela é gratuita, de código aberto, multiplataforma e possui uma grande comunidade global de usuários em diversos set
Este documento discute o PostgreSQL, incluindo sua instalação, definição de dados, manipulação de dados e funções. Aborda tópicos como criação de bancos de dados, esquemas, tabelas e campos, além de consultas, funções internas e triggers.
O documento fornece uma introdução aos sistemas operativos, definindo-os como um conjunto de programas que permitem a interação entre o usuário, hardware e aplicativos. Explora conceitos-chave como processos, memória, arquivos e periféricos, e classifica sistemas operativos de acordo com fatores como número de usuários e programação simultânea.
O documento discute os processos e técnicas de teste de software, abordando tópicos como ciclo de vida de testes, métodos de teste, métricas e tecnologias. Ele destaca a importância da adoção de processos de qualidade para melhorar o desenvolvimento de software, reduzir custos e riscos.
O documento discute a evolução da arquitetura de sistemas, desde modelos monolíticos até modelos distribuídos em nuvem. Apresenta diferentes modelos como cliente-servidor, web, n camadas e orientado a serviços. Também discute tecnologias como WebServices, REST e JSON que permitem a integração entre sistemas distribuídos.
O documento descreve os modelos de especificação para sistemas, incluindo diagramas de fluxo de dados (DFD) que mostram como os dados são processados, e modelos estruturais como o modelo entidade-relacionamento que define a estrutura lógica dos dados.
Escalabilidade, Sharding, Paralelismo e Bigdata com PostgreSQL? Yes, we can!Matheus Espanhol
Palestra sobre escalabilidade e sharding no PostgreSQL. Apresentada no evento PgDay Campinas no dia 7 de Agosto de 2015. Exemplos apresentados disponíveis em https://github.com/matheusespanhol/postgresql-tutorials
Banco de Dados II Aula Dinâmica 1 (Perguntas e Respostas)Leinylson Fontinele
Este documento descreve as regras para uma dinâmica de perguntas e respostas em grupo sobre banco de dados. Os participantes serão divididos em 3 grupos com 4 integrantes cada. Cada grupo terá 120 segundos para responder perguntas e pontuará de acordo com acertos individuais e em equipe. O objetivo é testar o conhecimento dos participantes sobre conceitos de banco de dados.
Banco de Dados II Aula 11 - Gerenciamento de transação (transações - fundamen...Leinylson Fontinele
A aula apresentou os fundamentos e características do gerenciamento de transações em bancos de dados, incluindo: (1) o que são transações e seus estados, (2) as propriedades ACID que devem ser atendidas, (3) comandos SQL para transações como COMMIT e ROLLBACK, e (4) exemplos de transações.
A rede neural supervisionada chamada perceptron multicamadascesar do amaral
1) O documento discute o uso de redes neurais supervisionadas e árvores de decisão para analisar os dados de uma concessionária de automóveis.
2) Os dados incluem informações sobre clientes e suas respostas a ofertas de garantia estendida.
3) As técnicas de aprendizagem de máquina são aplicadas usando o software Weka para identificar padrões nos dados e prever as respostas dos clientes.
O documento apresenta uma introdução sobre dados, informação e banco de dados. Explica que dados representam entidades enquanto informação é um conjunto de dados associados a um contexto. Também descreve os principais componentes de um sistema de banco de dados, como a base de dados, o gerenciador de banco de dados e suas linguagens.
Este documento fornece uma introdução ao Microsoft Access 2010, descrevendo seus principais componentes e funções. Em 3 frases ou menos:
O documento apresenta o Microsoft Access 2010 como uma ferramenta para gerenciar bancos de dados, desde pequenas coleções de dados até sistemas complexos. Ele descreve os principais elementos da interface do usuário do Access e como planejar, criar e trabalhar com tabelas, consultas, formulários e relatórios. O texto serve como um guia introdutório para aqueles que desejam aprender a utilizar as funcionalidades bás
O documento descreve um sistema operativo servidor, especificamente o Windows Server 2008 R2. Ele discute o que é um sistema operativo servidor, exemplos como o Windows 2003 e Windows Server 2008 R2, e as características e requisitos mínimos de hardware do Windows Server 2008 R2.
SNMP é um protocolo de gerenciamento de rede que permite monitorar e controlar dispositivos em uma rede IP. Ele define um modelo de informação padrão chamado MIB (Management Information Base) que descreve os atributos de gerenciamento de cada dispositivo gerenciado, bem como as operações que podem ser executadas neles.
Os principais componentes do SNMP são:
- Agentes: Software residente nos dispositivos de rede que coleta e mantém informações de gerenciamento locais.
- Gerentes: Software que executa no sistema de gerenciamento de rede para comunicar-se com os agentes,
O documento discute a hierarquia de memória em sistemas de computadores. Explica que a hierarquia de memória visa dar a ilusão de memória ilimitada e rápida ao programador ao usar diferentes níveis de memória, com capacidade e velocidade variando entre os níveis. Define termos como acerto, falta e taxa de acertos para descrever o funcionamento da hierarquia.
1. O documento discute os conceitos fundamentais de bancos de dados, incluindo o que é um banco de dados, operações comuns, tipos de sistemas de banco de dados, e componentes como SGBD e usuários.
2. A arquitetura de banco de dados é explicada, com os níveis internos, conceituais e externos, mapeamentos entre eles e o papel do SGBD.
3. O modelo de entidade-relacionamento é introduzido como um modelo de dados conceitual para descrever dados e relações por me
O documento discute os conceitos básicos de banco de dados, definindo-o como uma estrutura lógica que armazena um conjunto de dados relacionados. Também define o que são dados e apresenta exemplos.
O documento descreve comandos do MS-DOS para gerenciar arquivos, diretórios e configurações do sistema como ipconfig, netstat, ping e shutdown. Inclui explicações sobre formatação e recuperação de dados, além de comandos para copiar, mover, renomear arquivos.
O documento descreve o que são triggers no SQL, como são associados a tabelas específicas e executados automaticamente sempre que há modificações nos dados da tabela. Explica também que triggers não podem ser chamados diretamente e fazem parte da mesma transação que disparou sua execução. Fornece orientações sobre como criar triggers e como funcionam para inserções, exclusões e atualizações.
Boas práticas no desenvolvimento de softwareFelipe
Um pequeno conjunto de boas práticas para o desenvolvimento de software. O conteúdo é recomendado para desenvolvedores iniciantes ou intermediários. O foco é em desenvolvimento Web, baseado em Sistemas de Informação, com uma linguagem fracamente tipada. Os exemplos são dados na linguagem PHP.
1) O documento apresenta os conceitos básicos de bancos de dados, incluindo características da abordagem de banco de dados, atores envolvidos e exemplos.
2) É fornecido um exemplo detalhado de um banco de dados universitário com tabelas de alunos, disciplinas e notas.
3) As fases de projeto de banco de dados são descritas, incluindo especificação, projeto conceitual, lógico e físico.
1. O relatório descreve as atividades realizadas durante um estágio na empresa de tecnologia Papagaio, onde o estagiário trabalhou no desenvolvimento do projeto FarmáciaJá, um sistema web para facilitar a compra e venda de produtos farmacêuticos.
2. As principais tarefas incluíram o cadastro, edição e listagem de produtos no sistema, integrando a lógica do backend com a interface do frontend.
3. O estágio proporcionou ao aluno experiência prática na área de desenvolvimento web usando Django e familiarização com process
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreIT4biz IT Solutions
O documento fornece uma introdução abrangente sobre a plataforma de inteligência de negócios open source Pentaho. Em três frases:
1) A plataforma Pentaho é uma solução completa de BI que inclui ferramentas para ETL, análise OLAP, relatórios, dashboards e mineração de dados usando tecnologias como Kettle, Mondrian, Report Designer e Weka.
2) Ela é gratuita, de código aberto, multiplataforma e possui uma grande comunidade global de usuários em diversos set
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreCaio Moreno
O documento fornece uma introdução à inteligência de negócios (BI) utilizando a plataforma de código aberto Pentaho. Em menos de 3 frases, o documento descreve: 1) O que é BI e como pode ser usado para tomar melhores decisões de negócios; 2) A plataforma Pentaho é gratuita e pode ser usada para criar indicadores, relatórios, dashboards e análises para apoiar a tomada de decisões; 3) A comunidade global de usuários do Pentaho contribui para o desenvolvimento e compartilhamento de
Pentaho inteligência de negócios utilizando software livre campus party 2011Campus Party Brasil
O documento discute como as estratégias de Business Intelligence (BI) podem ajudar as empresas a tomarem decisões mais rápidas e seguras por meio de ferramentas como data warehouse, cubos OLAP, relatórios e dashboards. O Pentaho é apresentado como uma plataforma de código aberto para BI que oferece essas funcionalidades de forma gratuita.
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Caio Moreno
O documento discute como as estratégias de Business Intelligence (BI) podem ajudar as empresas a tomarem decisões mais rápidas e seguras por meio de ferramentas como data warehouse, cubos OLAP, relatórios e dashboards. O Pentaho é apresentado como uma plataforma de código aberto para BI que oferece essas funcionalidades de forma gratuita.
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...IT4biz IT Solutions
O documento discute estratégias de inteligência de negócios (BI) para tomar decisões mais rápidas e seguras nas empresas. Apresenta a ferramenta de código aberto Pentaho como uma opção para projetos de BI que permite relatórios, análises, dashboards e mineração de dados de forma gratuita. Discutem os principais componentes da suíte Pentaho como Kettle para ETL, Mondrian para OLAP e Weka para mineração de dados.
Este documento apresenta os serviços e soluções da empresa Infoschema para implementação de sistemas SAP, incluindo consultoria ERP, serviços de automação de processos, business intelligence e desenvolvimento de aplicações customizadas utilizando plataformas como SAP Netweaver e Tableau. A Infoschema defende uma abordagem baseada em serviços e componentes reutilizáveis para atender requisitos específicos de cada cliente.
SISTEMA WEB PARA ADMINISTRAÇÃO, GERENCIAMENTO E SUPORTE À DECISÃO EM PROJETOS...João Gabriel Lima
Este documento apresenta um sistema web para gerenciamento de projetos de pesquisa desenvolvido como trabalho de conclusão de curso. O sistema possui módulos para controle financeiro, acompanhamento de atividades, geração de atas de reuniões, rede social e suporte à decisão por meio de gráficos e estatísticas. O sistema foi desenvolvido utilizando tecnologias web como PHP, HTML5, CSS e banco de dados MySQL para atender as necessidades de gestão de projetos da Universidade Federal do Pará.
E-OBRAS: Proposta de Desenvolvimento do Protótipo de Sistema para Secretarias...Paulo Steinhauser
Este documento descreve o desenvolvimento de um protótipo de sistema para secretarias municipais de obras utilizando a linguagem Java. O documento discute a criação de versões desktop e móvel do protótipo para melhor gerenciamento de solicitações de serviços e agenda. As tecnologias usadas incluem Java, MySQL, UML, JSF e ferramentas para dispositivos móveis.
E-OBRAS: Proposta de Desenvolvimento do Protótipo de Sistema para Secretarias...Paulo Steinhauser
TCC intitulado E-Obras, no qual é abordado o projeto de criação de um sistema de gerenciamento de Secretarias de Obras utilizando a linguagem de programação JAVA, tanto para Web quanto para dispositivos móveis. Também aborda tópicos como a LP em si, Banco de Dados, Orientação a Objetos dentre outros assuntos.
O documento apresenta o Planejamento Estratégico de Tecnologia da Informação e Comunicação (PETIC) da Universidade Federal de Sergipe para o período de 2010 a 2012. O PETIC descreve o contexto atual de TI na universidade, identificando desafios como sistemas desintegrados e falta de políticas formais. Ele também define o cenário desejado, com a adoção de novas ferramentas e melhorias na infraestrutura e gestão de pessoal. O PETIC foi elaborado após análise das cinco áreas de TI da
Desenvolvimento ágil e pontos de função: gerenciando o projeto de maneira ági...Vanessa Campos
O documento apresenta uma palestra sobre desenvolvimento ágil e pontos de função, discutindo como gerenciar projetos de forma ágil e alinhada à metodologia IFPUG de medição de pontos de função. Apresenta os princípios do desenvolvimento ágil e como a empresa Dextra lida com projetos usando uma abordagem que combina desenvolvimento ágil com estimativas iniciais e medições finais usando pontos de função.
O documento descreve uma apresentação sobre ciência de dados e ferramentas R para analisar dados na empresa Mobiltec. Apresenta a jornada de aprendizado do gerente de TI da empresa com R, e como aplica essas ferramentas para importar, transformar, visualizar e criar relatórios e dashboards com dados da empresa usando R, Shiny e RMarkdown. O objetivo é melhorar a visibilidade operacional e estratégica da empresa.
O documento descreve o planejamento de implantação de um sistema ERP na empresa XPTO, incluindo:
1. Uma apresentação da estrutura da empresa XPTO e a necessidade de um sistema integrado de gestão.
2. Detalhes sobre o que é um sistema ERP e seus principais módulos como gestão de pessoas, vendas, finanças e manufatura.
3. O planejamento para a implantação do sistema ERP na matriz em São Paulo e backup na filial do Rio de Janeiro, incluindo a aquisição de hardware, software e
Aspectos Atuais em Sistemas de InformaçãoElvis Fusco
O documento discute as tendências e desafios do mercado de trabalho para profissionais de TI no Brasil. Apresenta a carência de profissionais qualificados, as funções em evolução e as tecnologias emergentes, e prevê um crescimento acentuado na área nos próximos anos, com a abertura de 100 mil novos empregos a partir de 2010.
O documento apresenta uma palestra sobre mineração de dados utilizando a ferramenta Pentaho Data Mining (WEKA). A palestra aborda tópicos como: o que é Pentaho e seus módulos, diferença entre KDD e data mining, fases do processo KDD, exemplos de aplicação de data mining, classificadores, a ferramenta WEKA e avaliação de classificadores.
O documento discute soluções de gestão empresarial integrada, incluindo tipos de software, arquitetura funcional, fornecedores e potencial do mercado de código aberto. Resume os principais pontos como padronização de processos, integração e visualização em tempo real, e o potencial de crescimento do mercado brasileiro de soluções de gestão.
O documento discute uma solução para processar dados em tempo real e por lotes para atender clientes em múltiplos canais. A pesquisa propõe o Apache Storm para ingestão e análise de dados em streaming de redes sociais e outros dados por lotes. A arquitetura Hortonworks suporta essa solução híbrida de processamento em tempo real e por lotes.
Tabalho apresentado como forma de
avaliação na disciplina Sistemas de
Informações Empresariais, do curso de
Pós-Graduação em Gestão de Projetos
de Tecnologia da Informação da UFS.
Semelhante a Integração de ferramentas de código aberto (java, pentaho e android) e mapas, aplicada a projetos de inteligência de negócios (20)
Pentaho World 2018: Hands-on Training: Tackling Data Science Challenges with ...Caio Moreno
Bring your own device and join us for an interactive session and hands-on experience with Pentaho. We’ll provide a hosted virtual machine for the first 30 people in the room so you can click along with your instructor while you solve common data challenges. This session addresses how data scientists strive to find the right balance of complexity, performance and accuracy in their predictive models. Unfortunately, up to 80% of a data scientist’s time is spent on data preparation instead of analyzing the data and applying advanced algorithms. With integrations for languages like R and Python, and for machine learning packages like Weka and Spark MLlib; Pentaho streamlines the process of training, tuning, building and testing models. In this session, you will learn how to use Pentaho Data Integration to efficiently prepare data, engineer features, test models, and deploy and operationalize the model.
Caio Moreno
Professional Services Senior Consultant
Pentaho, a Hitachi Group Company
James O'Reilly
Training & Development Specialist
Pentaho, a Hitachi Group Company
Pentaho World 2018: Network Rail: Predicting the Result of Incidents with Big...Caio Moreno
Network Rail owns and operates the entire rail infrastructure in the UK; their challenge is to keep all the trains running on time and to maximize the services provided by the rail providers that run on its infrastructure. Network Rail needed to predict the results of train delay incidents and how to best deal with them to make sure the service runs smoothly. With the UK rail network being the busiest and oldest in the world, this is no easy task and relies on the power of big data and data science!
Anya Rumyantseva
Data Scientist
Pentaho, a Hitachi Group Company
Michael Fish
Sales Engineer
Pentaho, a Hitachi Group Company
Caio Moreno
Professional Services Senior Consultant
Pentaho, a Hitachi Group Company
Pentaho World 2017: Automated Machine Learning (AutoML) and Pentaho (Thursday...Caio Moreno
The demand for machine learning experts has outpaced the supply. To address this gap, there have been big strides in the development of user-friendly machine learning software that can be used by non-experts and experts, alike. AutoML software can be used for automating a large part of the machine learning workflow, which includes automatic training and tuning of many models within a user-specified time-limit. This presentation aims to demo the process of how AutoML open source tools and Pentaho together can help customers save time in the process of creating a model and deploying this model into production.
Caio Moreno
Professional Services Senior Consultant
Pentaho, a Hitachi Group Company
Source:
https://www.pentahoworld.com/
Date: Thursday, October 26th, 2017
#PCM15: - How to monitor the use and performance of BI Server using the Plug-...Caio Moreno
How to monitor the use and performance of BI Server using the Plug-ins: Pentaho CE Audit and Pentaho Performance Monitoring.
Speaker: Caio Moreno de Souza
#PCM15 (Pentaho Community Meetup)
London - 6 and 7 Nov 2015.
We also talked in this presentation about: Saiku Chart Plus, pdiR, SparklPDIR, Data Science, Pentaho with Docker and about a real BI Project called EDW_CENIPA.
Encontro da Comunidade Pentaho. Aprenda mais sobre a mais poderosa e conheci...Caio Moreno
Caio Moreno de Souza apresentou sobre a Pentaho Suite, uma poderosa solução open source para Business Intelligence, Big Data e Data Mining. Ele destacou o poder da comunidade Pentaho no Brasil e no mundo e como ela pode ajudar empresas a lidar com dados. Caio também explicou como iniciar o uso da Pentaho Suite e apresentou casos de sucesso no Brasil envolvendo Big Data, Data Mining e integração com R.
Relatório descritivo do curso de Educação a Distância: Construindo um Pro...Caio Moreno
Relatório descritivo do curso de Educação a Distância: Construindo um Projeto de Voluntariado Educativo.
Este relatório é parte do Trabalho de Conclusão do Curso de Graduação em Tecnologia e Mídias Digitais com Habilitação em Educação a Distância da Pontifícia Universidade Católica de São Paulo. Trata-se do projeto de curso-piloto na modalidade de Educação a Distância do Instituto Faça Parte, cujo título é: “Construindo um Projeto de Voluntariado Educativo”.
Relatamos a trajetória percorrida para a elaboração deste curso: as atividades de análise e planejamento, o desenho de instrução, o desenvolvimento, a produção, a implantação e o acompanhamento.
Caio Moreno de Souza
Deleni Mesquita
Palestra sobre BI Open Source @ USP (Out/2011)Caio Moreno
Palestra sobre BI Open Source @ USP
Data da realização: 18 de Outubro de 2011
Local: USP - Auditório Vermelho
Palestrante: Caio Moreno de Souza (a.k.a Professor Coruja).
Curso de Pós-graduação em Business IntelligenceCaio Moreno
Este documento anuncia um curso de especialização em Tecnologias de Business Intelligence oferecido pela UNIOESTE com inscrições abertas até 20 de junho de 2011. O curso tem duração de um ano e meio com aulas aos sábados e objetiva capacitar profissionais em estratégias de recuperação e análise de dados para tomada de decisões empresariais.
Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em inst...Caio Moreno
Palestra:
Pentaho: Implementando um Projeto de BI baseado em ferramentas livres em instituições públicas.
Autores:
Caio Moreno de Souza
Juan José Ortilles Ruiz
http://papers.consegi.gov.br/pub/programacao/511
http://blog.professorcoruja.com/2011/05/palestra-sobre-bi-open-source-consegi.html
Alianza IT4biz (Brasil) y StrateBI (España)Caio Moreno
Las compañías Stratebi y IT4biz, especialistas en Business Intelligence Open Source con presencia en España y Brasil, anuncian un acuerdo estratégico para ofrecer servicios de desarrollo, implementación y formación en tecnologías Open Source, principalmente Business Intelligence, a un mayor número de clientes en ambos lados del Atlántico. El acuerdo permitirá a las dos compañías colaborar e integrar mejor sus servicios y soluciones de negocio.
Aliança IT4biz (Brasil) e StrateBI (Espanha)Caio Moreno
O documento descreve um acordo entre as empresas Stratebi e IT4Biz para oferecer serviços de desenvolvimento, implementação e formação em tecnologias Open Source, especialmente Business Intelligence, para clientes no Brasil e Espanha. As duas empresas são especialistas em Pentaho e trabalharam juntas em projetos de grande porte nos últimos anos. O acordo permitirá que ofereçam melhores serviços e soluções de negócios aos clientes em ambos os lados do Atlântico.
Pentaho: Inteligência de Negócios utilizando Software Livre - FliSOL São Paul...Caio Moreno
Este documento fornece um resumo da plataforma de Business Intelligence (BI) de código aberto Pentaho. Ele descreve as principais ferramentas da Pentaho como Kettle para ETL, Mondrian para OLAP, jPivot e Report Designer para relatórios, Weka para mineração de dados e CDF para dashboards. O documento também discute a comunidade Pentaho no Brasil e contribuições para ensinar outros sobre como usar a plataforma Pentaho.
IT4biz - Caso de Sucesso Pentaho - Dia % BrasilCaio Moreno
A Dia é uma cadeia de distribuição fundada na Espanha em 1979 que se expandiu para outros países da Europa, América Latina e Ásia. No Brasil, a Dia opera sob o nome Dia % Brasil e conta com cerca de 400 lojas em São Paulo e mais de 9,5 milhões de clientes por mês. A IT4biz desenvolveu soluções de business intelligence e data warehouse utilizando software livre para gerar indicadores que melhoram a tomada de decisão da Dia % Brasil.
O documento descreve o ReembolsoFácil, um sistema de gestão de reembolso desenvolvido para ajudar viajantes a manter registros de despesas de forma simples. Existem versões gratuita e paga, sendo que a versão paga oferece relatórios gerenciais e integração com ERP. O sistema será lançado oficialmente na Campus Party 2011 e aqueles interessados podem se candidatar como testadores beta.
O documento anuncia uma palestra e oficina sobre Pentaho, uma suíte de Business Intelligence de código aberto, que ocorrerá na Campus Party 2011 em São Paulo. O palestrante Caio Moreno de Souza apresentará como o Pentaho pode ajudar empresas a analisar dados e tomar melhores decisões. Uma oficina prática sobre Pentaho também será oferecida.
Pentaho: inteligência de negócios utilizando software livreCaio Moreno
O documento discute o Pentaho, uma plataforma de software livre para inteligência de negócios. Apresenta os benefícios do Pentaho, como ser gratuito, de código aberto e confiável. Também discute os desafios de sua adoção no Brasil, como a desconfiança e desconhecimento do mercado, e propõe soluções como a capacitação de profissionais e empresas e a divulgação da ferramenta. Por fim, apresenta as ferramentas do Pentaho e como contribuir para seu desenvolvimento.
Encontro da Comunidade Pentaho - CONSEGI 2010 - Brasília - DF - 20 de Agosto ...Caio Moreno
O documento resume uma apresentação sobre a comunidade Pentaho no Brasil. Ele descreve quem compõe a comunidade Pentaho no país, estimando em cerca de 800 membros, e como eles participam através de fóruns, IRC, blogs e encontros. Também lista áreas onde membros podem contribuir, como tradução, resolução de bugs e documentação.
O documento apresenta o programa IT4biz BI Mobile 1.0, que permite acessar indicadores de BI em celulares Android. Ele descreve as funcionalidades do aplicativo e simula seu uso, também discutindo o crescimento do mercado mobile e da plataforma Android.
A linguagem C# aproveita conceitos de muitas outras linguagens,
mas especialmente de C++ e Java. Sua sintaxe é relativamente fácil, o que
diminui o tempo de aprendizado. Todos os programas desenvolvidos devem
ser compilados, gerando um arquivo com a extensão DLL ou EXE. Isso torna a
execução dos programas mais rápida se comparados com as linguagens de
script (VBScript , JavaScript) que atualmente utilizamos na internet
As classes de modelagem podem ser comparadas a moldes ou
formas que definem as características e os comportamentos dos
objetos criados a partir delas. Vale traçar um paralelo com o projeto de
um automóvel. Os engenheiros definem as medidas, a quantidade de
portas, a potência do motor, a localização do estepe, dentre outras
descrições necessárias para a fabricação de um veículo
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...Faga1939
Este artigo tem por objetivo apresentar como ocorreu a evolução do consumo e da produção de energia desde a pré-história até os tempos atuais, bem como propor o futuro da energia requerido para o mundo. Da pré-história até o século XVIII predominou o uso de fontes renováveis de energia como a madeira, o vento e a energia hidráulica. Do século XVIII até a era contemporânea, os combustíveis fósseis predominaram com o carvão e o petróleo, mas seu uso chegará ao fim provavelmente a partir do século XXI para evitar a mudança climática catastrófica global resultante de sua utilização ao emitir gases do efeito estufa responsáveis pelo aquecimento global. Com o fim da era dos combustíveis fósseis virá a era das fontes renováveis de energia quando prevalecerá a utilização da energia hidrelétrica, energia solar, energia eólica, energia das marés, energia das ondas, energia geotérmica, energia da biomassa e energia do hidrogênio. Não existem dúvidas de que as atividades humanas sobre a Terra provocam alterações no meio ambiente em que vivemos. Muitos destes impactos ambientais são provenientes da geração, manuseio e uso da energia com o uso de combustíveis fósseis. A principal razão para a existência desses impactos ambientais reside no fato de que o consumo mundial de energia primária proveniente de fontes não renováveis (petróleo, carvão, gás natural e nuclear) corresponde a aproximadamente 88% do total, cabendo apenas 12% às fontes renováveis. Independentemente das várias soluções que venham a ser adotadas para eliminar ou mitigar as causas do efeito estufa, a mais importante ação é, sem dúvidas, a adoção de medidas que contribuam para a eliminação ou redução do consumo de combustíveis fósseis na produção de energia, bem como para seu uso mais eficiente nos transportes, na indústria, na agropecuária e nas cidades (residências e comércio), haja vista que o uso e a produção de energia são responsáveis por 57% dos gases de estufa emitidos pela atividade humana. Neste sentido, é imprescindível a implantação de um sistema de energia sustentável no mundo. Em um sistema de energia sustentável, a matriz energética mundial só deveria contar com fontes de energia limpa e renováveis (hidroelétrica, solar, eólica, hidrogênio, geotérmica, das marés, das ondas e biomassa), não devendo contar, portanto, com o uso dos combustíveis fósseis (petróleo, carvão e gás natural).
Em um mundo cada vez mais digital, a segurança da informação tornou-se essencial para proteger dados pessoais e empresariais contra ameaças cibernéticas. Nesta apresentação, abordaremos os principais conceitos e práticas de segurança digital, incluindo o reconhecimento de ameaças comuns, como malware e phishing, e a implementação de medidas de proteção e mitigação para vazamento de senhas.
Integração de ferramentas de código aberto (java, pentaho e android) e mapas, aplicada a projetos de inteligência de negócios
1. UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
ESPECIALIZAÇÃO EM TECNOLOGIA JAVA
CAIO MORENO DE SOUZA
INTEGRAÇÃO DE FERRAMENTAS DE CÓDIGO ABERTO (JAVA,
PENTAHO E ANDROID) E MAPAS, APLICADA A PROJETOS DE
INTELIGÊNCIA DE NEGÓCIOS.
MONOGRAFIA DE ESPECIALIZAÇÃO
CURITIBA
2010
1
2. CAIO MORENO DE SOUZA
INTEGRAÇÃO DE FERRAMENTAS DE CÓDIGO ABERTO (JAVA,
PENTAHO E ANDROID) E MAPAS, APLICADA A PROJETOS DE
INTELIGÊNCIA DE NEGÓCIOS.
Monografia apresentada ao programa de
Pós-Graduação em Informática da Universidade
Tecnológica Federal do Paraná para a
obtenção do título de Especialista em Tecnologia Java.
Orientador: Prof. Dr. Gustavo A. Giménez Lugo.
CURITIBA
2010
2
4. RESUMO
DE SOUZA, Caio Moreno. Integração de ferramentas de código aberto (java, pentaho
e android) e mapas, aplicada a projetos de inteligência de negócios. 2010. 57 f.
Monografia (Especialização em Tecnologia Java) – Programa de Pós-Graduação em
Tecnologia, Universidade Tecnológica Federal do Paraná. Curitiba, 2010.
O objetivo geral desse trabalho é mostrar a importância de um sistema de
inteligência de negócios nas empresas, demonstrando que a utilização adequada de um
sistema de apoio à decisão ajuda na tomada de decisões estratégicas de forma acertada.
Qualquer empresa que deseja competir de forma inteligente precisa voltar seus
olhos para seus dados internos e para os dados disponíveis no mercado, organizando-os de
forma a transformar esse amontoado de dados em informações relevantes para a tomada de
decisão.
Grande parte das informações encontra-se espalhadas em sistemas da empresa, em
pastas compartilhadas, nos computadores dos funcionários, sistemas paralelos, sistemas
legados, etc. Organizar essa enormidade de dados torna-se um grande desafio para os
gestores da empresa.
Palavras-chave: Armazém de dados; Inteligência de Negócios; software livre; estratégias
competitivas, tecnologia java, descoberta de conhecimento, mineração de dados, mapas,
sistemas de apoio a decisão, código aberto, google android.
4
5. ABSTRACT
DE SOUZA, Caio Moreno. Integration of open source tools (java, pentaho and
Android) and maps, applied to business intelligence projects. 2010. 57 p. Monografia
(Especialização em Tecnologia Java) – Programa de Pós-Graduação em Tecnologia,
Universidade Tecnológica Federal do Paraná. Curitiba, 2010.
The aim of this study is to show the importance of a Business Intelligence system
for enterprises, demonstrating that proper use of a decision support system helps in making
right strategic decisions.
Any company that wants to compete intelligently must turn their eyes to its internal
data and to the data available on the market, arranging them in order to transform this mass
of data into relevant information for decision making.
Much of the information is scattered in enterprise systems, shared folders, on
employees' computers, parallel systems, legacy systems, etc.. Organize this huge amount of
data becomes a major challenge for company managers.
Keywords: Data Warehouse; Business Intelligence; free software; competitive strategies,
java technology, knowledge discovery, data mining, maps, systems decision support, open
source, google android.
5
6. LISTA DE FIGURAS
Figura 1: Funcionamento Tecnologia Java
Figura 2: Funcionamento Tecnologia Java
Figura 3: Cubo OLAP
Figura 4: Visão Geral de um Projeto de BI com Pentaho
Figura 5: Servidor de BI Pentaho
Figura 6: Arquitetura Servidor de BI Pentaho
Figura 7: Tela de Login Portal BI
Figura 8: Tela Interna Portal BI
Figura 9: Modelo Estrela – Cubo Faturamento
Figura 10: Tabela Fato_Venda
Figura 11: Tabela Dim_CanalVenda
Figura 12: Tabela Dim_Tempo
Figura 13: Tabela Dim_Cliente
Figura 14: Tabela Dim_Produto
Figura 15: Tabela Dim_Vendedor
Figura 16: Exemplo de ETL usando o PDI
Figura 17: Cubo OLAP Faturamento
Figura 18: Criando uma nova visão no Cubo OLAP de Faturamento
Figura 19: Escolhendo as métricas
Figura 20: Visão por Produto
Figura 21: Faturamento por Canal de Venda
Figura 22: Faturamento por Canal de Venda
Figura 23: Faturamento por Produtos
Figura 24: Faturamento por Vendedores
Figura 25: Faturamento por Vendedores (Gráfico)
Figura 26: Quantidade de Produtos Vendidos por Vendedores (Gráfico)
Figura 27: Faturamento por Vendedores e Período (Tempo)
Figura 28: Filtrando a dimensão Produtos
Figura 29: Recurso de Drill Through
Figura 30: Possibilidades JPivot
Figura 31: Painel Faturamento
Figura 32: Painel Faturamento por Estado
Figura 33: Simulação do Aplicativo para acessar o Portal de BI no Google Android
Figura 34: Aplicativo IT4biz BI Mobile – Android
Figura 35: Tela de Login Portal BI acessado via Google Android
Figura 36: Exemplo de um Painel visualizado através do Google Android
Figura 37: Exemplo de outro Painel visualizado através do Google Android
Figura 38: Exemplo de Cubo OLAP visualizado através do Google Android
6
7. LISTA DE ABREVIATURAS
BD Banco de Dados
JCP ( Java Community Process) – Processo da Comunidade Java
DW (Data Warehouse) – Armazém de dados
OLAP (On-Line Analytic Processing) – Processamento Analítico On-Line
OLTP On-Line Transaction Processing – Processamento de Transação On-Line
PDF Portable Document Format – Formato Portátil de documento
SGBD Sistema Gerenciador de Banco de Dados
SQL (Structured Query Language) – Linguagem Estruturada de Query
PSW Pentaho Schema Workbench
PDS Pentaho Design Studio
PRD Pentaho Report Designer
PDI Pentaho Data Integration
PUC Pentaho User Console
PAC Pentaho Adminstration Console
PME Pentaho Metadata Editor
WAQR Web-based Adhoc Query and Reporting
API Application Programming Interface
BI (Business Intelligence) – Inteligência de Negócios
ETL Extract, Transform and Load
ETC Extração, Transformação e Carga
JDBC Java Database Connectivity
JNDI Java Naming and Directory Interface
JRE Java Runtime Environment
JVM Java Virtual Machine
KETTLE Kettle, Extraction, Transport, Transformation and Loading Environment
MDX Multi-Dimensional Expressions
PCI Pre-Configured Installation
PPL Pentaho Public License
XML Extensible Markup Language
DDL Data Definition Language
CEO Chefe Executive Oficer
7
8. SUMÁRIO
RESUMO ....................................................................................................................................... 4
ABSTRACT ................................................................................................................................... 5
LISTA DE FIGURAS ..................................................................................................................... 6
LISTA DE ABREVIATURAS ......................................................................................................... 7
SUMÁRIO...................................................................................................................................... 8
1. INTRODUÇÃO ........................................................................................................................ 10
1.1 Apresentação ...................................................................................................................... 10
1.2 Descrição do problema ........................................................................................................11
1.3 Justificativa .........................................................................................................................11
1.4 Objetivo geral ..................................................................................................................... 12
1.5 Objetivos específicos .......................................................................................................... 12
1.6 Metodologia ....................................................................................................................... 12
2 INTELIGÊNCIA DE NEGÓCIOS ............................................................................................ 13
2.1 História............................................................................................................................... 13
2.2 Ferramentas de Inteligência de Negócios disponíveis no mercado ...................................... 14
2.3 Tecnologia Java e Código Aberto ...................................................................................... 14
2.3.1 O movimento Open Source e sua história .................................................................... 14
2.3.2 Linux .......................................................................................................................... 15
2.3.3 Principais projetos de código aberto aplicados a sistemas de inteligência de
negócios............................................................................................................................... 15
2.3.4 História da Tecnologia Java e conceitos ....................................................................... 16
2.3.5 Características da Tecnologia Java ............................................................................... 19
2.3.6 Tecnologia Java e de Código Aberto aplicada a Sistemas de Inteligência de
Negócios .............................................................................................................................. 20
3 ARMAZÉM DE DADOS .......................................................................................................... 21
3.1 Características .................................................................................................................... 21
3.2 Construção......................................................................................................................... 21
3.3 Extração, transformação e carga dos dados - ETC .............................................................. 22
3.4 Acesso aos dados ............................................................................................................... 23
3.5 Ferramentas OLAP ............................................................................................................. 24
3.6 Mineração de Dados .......................................................................................................... 25
4 PENTAHO ................................................................................................................................ 26
4.1 Mobilidade ......................................................................................................................... 27
4.2 Características .................................................................................................................... 27
4.3 Pentaho BI Suite ................................................................................................................. 27
4.4 Pentaho BI Server ............................................................................................................... 28
4.5 PRD (Pentaho Report Designer) ......................................................................................... 30
4.6 PDI (Pentaho Data Integration) ........................................................................................... 30
4.7 PSW (Pentaho Schema Workbench).................................................................................... 30
4.8 WEKA................................................................................................................................ 30
5. CONSTRUINDO UMA SOLUÇÃO DE BI PROFISSIONAL .................................................. 31
5.1 Instalação das ferramentas de Inteligência de Negócios ...................................................... 31
5.2 Processos de ETL ............................................................................................................... 33
5.2.1 Definindo os indicadores ............................................................................................. 33
5.2.2 Modelagem Dimensional ............................................................................................. 33
5.2.3 Descrição das dimensões, fatos e campos .................................................................... 35
5.2.4 Criando os processos de ETL no Kettle ....................................................................... 38
5.3 Cubos OLAP ...................................................................................................................... 39
5.4 Painel com Mapas............................................................................................................... 49
8
9. 5.5 Google Android .................................................................................................................. 51
5.5.1 Acessando o sistema de Inteligência de Negócios pelo celular Google Android ........... 51
5.5.2 BI Touch e BI Mobile: informações estratégicas na palma da sua mão......................... 54
6. CONCLUSÕES ........................................................................................................................ 55
7. BIBLIOGRAFIA ...................................................................................................................... 56
9
10. 1. INTRODUÇÃO
A globalização tem exigido de qualquer empresa o conhecimento de seu negócio e
do negócio de seus concorrentes. Porém, grande parte das informações encontra-se
espalhada em sistemas da empresa, em pastas compartilhadas, nos computadores dos
funcionários, sistemas paralelos, sistemas legados, etc. Organizar essa enormidade de
dados torna-se um grande desafio para os gestores da empresa. Qualquer empresa que
deseja competir de forma inteligente precisa voltar seus olhos para seus dados internos e
para os dados disponíveis no mercado, organizando-os de forma a transformar esse
amontoado de dados em informações relevantes para a tomada de decisão.
1.1 Apresentação
Com certa freqüência o crescimento de uma empresa traz o desenvolvimento de
sistemas paralelos desenvolvidos em Excel, Access e outras ferramentas e tecnologias,
tornando o processo de organização dos dados um processo doloroso e extremamente caro,
acessível apenas para grandes empresas que possuem recursos milionários para investir em
Sistemas de Inteligência de Negócios (Business Intelligence).
Todos os anos mais e mais empresas têm investido no desenvolvimento, suporte,
customização e financiamento de projetos de código aberto, tornando o processo de
desenvolvimento de software (programa) algo mais acessível para as empresas. Temos
visto diversas empresas utilizarem tecnologias antigamente utilizadas por poucos, e que
agora estão à disposição de qualquer empresa.
O grande desafio é ajudar as empresas a desenvolver um projeto de Inteligência de
Negócios utilizando tecnologias de código aberto. Um projeto deste porte exige da
empresa o domínio de uma série de ferramentas e produtos. Com a utilização de tecnologia
de código aberto as empresas passam a não precisar investir milhões em programas de
computadores e passam a investir em serviços, os quais muitas vezes podem ser feitos
internamente.
Entende-se como problema a ser pesquisado e resolvido a falta de informação que
muitas empresas possuem a respeito de diversas ferramentas e tecnologias de código aberto
que podem ser utilizadas em projetos de Sistema de Apoio à Decisão, o que reduz o custo
de um projeto de Inteligência de Negócios absurdamente.
A idéia é ajudar qualquer empresa que tenha interesse em desenvolver um sistema
de apoio à decisão, mas não tem os recursos financeiros necessários, a ter acesso às
informações que tornem esse desejo realidade.
10
11. 1.2 Descrição do problema
Com a globalização as pequenas, médias e grandes empresas precisam tornar-se
cada vez mais competitivas para conseguirem sobreviver no cenário nacional e mundial.
As grandes empresas sabem disso e a cada ano investem mais dinheiro em ferramentas de
BI com o objetivo de conhecer melhor seu próprio negócio, realizar comparações com a
concorrência e previsões de crescimento.
Apesar destas tecnologias custarem muito dinheiro já existem alternativas gratuitas
no mercado, permitindo às pequenas e médias empresas a beneficiarem-se de tecnologia
semelhante às tecnologias existentes nas grandes empresas, sem a necessidade de grandes
investimentos.
1.3 Justificativa
Toda empresa precisa estar apta a tomar decisões baseadas em dados estatísticos,
utilizando um sistema de apoio à decisão que possa responder às perguntas de negócio
feitas por seus executivos.
O grande problema da maioria das empresas é a variedade de informações do
mesmo cenário. Isto acontece pois os analistas utilizam fontes diferentes e montam
diferentes resultados do mesmo cenário, causando assim uma tremenda confusão para a
empresa, uma vez que não existe um repositório central de informações gerenciais, o
chamado armazém de dados.
De acordo com Immon (1997), o conceito de armazém de dados (data warehouse -
DW) pode ser definido como: “conjunto de dados baseados em assuntos, integrados, não-
voláteis e variáveis em relação ao tempo, para apoio às decisões gerenciais”.
A solução para esse problema é a adoção de um sistema de Inteligência de
Negócios, onde todos os executivos da empresa analisam suas informações baseadas em
dados confiáveis extraídos de fontes seguras, possibilitando assim a tomada de decisão de
forma acertada.
Um projeto de Inteligência de Negócios baseado em ferramentas de código aberto
pode ser a solução ideal para pequenas, médias e grandes empresas, dos mais diversos
setores, devido ao baixo custo de investimento e a alta qualidade, o que torna a relação
custo beneficio extremamente favorável.
11
12. 1.4 Objetivo geral
O objetivo geral desse trabalho é demonstrar a importância de um sistema de apoio
à decisão nas pequenas, médias e grandes empresas dos mais diversos setores.
1.5 Objetivos específicos
Os objetivos específicos desse trabalho são:
Definir as tecnologias necessárias para o desenvolvimento de um sistema de
inteligência de negócios;
Demonstrar o uso destas tecnologias através de um estudo de caso de uma empresa
fictícia;
Ajudar pequenas e médias empresas (privadas ou públicas) a desenvolver com
poucos recursos financeiros uma solução de Inteligência Competitiva, ou pelo
menos servir de material de pesquisa para o planejamento de uma futura
implementação de uma estratégia de Inteligência de Negócios;
Servir de referência para futuras pesquisas sobre descoberta de conhecimento
utilizando ferramentas de código aberto.
1.6 Metodologia
A presente monografia foi elaborada visando demonstrar as tecnologias necessárias
para a criação de um sistema de apoio à decisão baseado em programas de código aberto. A
metodologia utiliza foi a demonstração, através de exemplo baseado em uma empresa
fictícia, com necessidades semelhantes à de empresas reais, de como desenvolver um
sistema de apoio à decisão.
Na primeira etapa abordamos alguns conceitos importantes explicados através de
uma pesquisa bibliográfica bastante extensa, resultante de fontes de pesquisas bastante
confiáveis e recomendadas no mundo corporativo e acadêmico.
Durante a segunda etapa abordamos um cenário de uma empresa fictícia, para a
qual desenvolvemos o projeto de Inteligência de Negócios na prática, criando um modelo
de projeto que poderá ser implementado em diversas empresas.
12
13. 2 INTELIGÊNCIA DE NEGÓCIOS
O processo de desenvolvimento de uma solução profissional de Inteligência de
Negócios esbarra em uma série de novos conceitos, os quais abordaremos de uma forma
prática e simples.
O conceito principal que explicaremos neste momento é Inteligência de Negócios.
Atualmente muitos diretores executivos/gerais (em inglês Chief Executive Officer, CEO)
colocaram como prioridade a implantação de uma solução de BI, tornando o termo
Inteligência de Negócios extremamente popular. Porém essa necessidade não é nova, as
empresas sempre tiveram a necessidade de sistemas que transformassem dados em
informações relevantes.
O termo Inteligência de Negócios, resumidamente, significa coletar dados de
diversas fontes, organizá-los, analisá-los e compartilhá-los com os executivos mais
importantes da empresa; estes então transformam essas informações relevantes em
decisões importantes para o futuro da empresa.
2.1 História
Desde a década de 80 encontramos no mercado o termo Inteligência Empresarial
difundido pelo Gartner Group. Através desse as empresas exploram informações internas
contidas em um armazém de dados e externas disponíveis no mercado com o intuito de se
auto avaliarem e avaliar seus concorrentes, desenvolvendo comparações e estratégias de
crescimento e aumento de fatias de mercado, sempre com os objetivos de guiar a
organização ao crescimento, à maior lucratividade, maior satisfação de seus clientes,
menor perda, maior velocidade, ou seja, ao sucesso empresarial.
O processo de auto-avaliação e de estudo de seus concorrentes não é algo novo e
podemos encontrar exemplos disso no livro “A arte da Guerra”, de Sun Tzu (TZU, 2000);
neste encontramos ensinamentos que dizem que para se obter sucesso na guerra, a pessoa
deve deter todo o conhecimento de suas fraquezas e virtudes, além de todo o conhecimento
das fraquezas e virtudes do inimigo. O contrário pode levar à derrota e à destruição. Outro
exemplo clássico é a trilogia “O Poderoso Chefão”, de Mario Puzo, que aborda, no
decorrer da história, a necessidade de estudar seus concorrentes constantemente (PUZO,
2000). Sobre essa metodologia de estudo da concorrência, Kotler também afirma que “
Uma empresa precisa saber sobre seus concorrentes (…) seus objetivos, estratégias,
pontos fortes e fracos e padrões de resposta.” (KOTLER, 1999).
O Prof. PhD. Ralph Kimball é um dos precursores dos conceitos de armazém de
dados e sistemas de apoio à decisão realizando pesquisas e conceitos desde 1982. Seus
estudos influenciam até hoje a maioria dos projetos de Inteligência de Negócios das
empresas no Brasil e no mundo. A metodologia Kimball, mais conhecida como modelagem
dimensional, ensina como tornar sistemas transacionais em sistemas orientados ao mundo
empresarial, permitindo uma maior organização, melhor compreensão e rapidez
(KIMBALL, 1996).
Com o passar dos anos muitas ferramentas foram criadas com o intuito de ajudar na
criação de uma solução de Inteligência de Negócios e o termo tornou-se extremamente
popular no mundo dos negócios.
13
14. 2.2 Ferramentas de Inteligência de Negócios disponíveis no mercado
Atualmente as empresas que desejam implantar uma solução de Inteligência de
Negócios encontram uma série de fornecedores de ferramentas, tornando a tarefa de
escolha da ferramenta uma decisão difícil e estratégica.
Os fornecedores mais conhecidos no mercado atualmente são: SAP, IBM, Oracle,
Microsoft, SAS, MicroStrategy, Qlikview, Pentaho e Jasper.
Neste trabalho utilizaremos as ferramentas desenvolvidas pela empresa Pentaho. A
Pentaho desenvolve uma versão chamada “Community Edtion” destinada às empresas que
desejam implantar uma solução de Inteligência de Negócios totalmente aberta, ou seja, sem
a necessidade de compra de licença de uso das ferramentas. Esta pode ser a solução para
muitas empresas que desejam uma solução profissional de Inteligência de Negócios sem a
necessidade de grandes investimentos.
2.3 Tecnologia Java e Código Aberto
Java, segundo o glossário disponível no site da Sun, é marca registrada da Sun
“para um conjunto de tecnologias que permite a criação e execução segura de programas
para ambientes desktop e ambientes de rede.” (SUN, 2010).
Ainda segundo o endereço web supracitado, essa tecnologia “permite que você
jogue online, converse com pessoas ao redor do mundo, calcule o seu financiamento de
sua hipoteca e veja imagens em 3D, isso é apenas para citar algumas coisas . É também
integrante dos aplicativos de intranet e outras soluções de e-business que formam a base
da computação corporativa.” (SUN, 2010).
O termo Open Source, traduzido para o português, significa código aberto. De
acordo com a empresa Open Source Initiative: “Open source não significa apenas acesso
ao código-fonte. Os termos de distribuição de software de código aberto devem obedecer
aos seguintes critérios: redistribuição livre, código fonte, trabalhos derivados, integridade
do código fonte do autor, sem discriminação contra pessoas ou grupos, sem discriminação
contra campos de trabalho, distribuição da licença, a licença não deve ser específica a um
produto, licença não deve restringir outro software e a licença deve ser tecnologicamente
neutra.” (OSI, 2010)
2.3.1 O movimento Open Source e sua história
Em fevereiro de 1998 Todd Anderson, Chris Peterson, Jon “Maddog” Hall, Larry
Augustin, Sam Ockman e Eric Raymond reuniram-se e criaram o termo Open Source.
Também utiliza-se a sigla FLOSS (Free/Libre and Open Source Software) (OSI, 2010).
Outro importante personagem é Richard Stallman que em 1985 fundou a Free
Software Foundation (FSF, Fundação para o Software Livre), uma organização sem fins
lucrativos que se dedica à eliminação de restrições sobre a cópia, redistribuição,
entendimento e modificação de programas de computadores. Uma de suas maiores
contribuições foi o sistema operacional GNU e o Manifesto GNU, publicado em 1985 no
Dr. Dobb's Journal of Software Tools, o qual é considerado por muitos como a principal
fonte filosófica do software livre.
Com a popularização destes ideais muitas pessoas e empresas começaram a
desenvolver softwares e a disponibilizá-los de forma gratuita na internet para que outras
pessoas pudessem utilizá-los, modificá-los e distribuí-los sem custo, começando com o que
conhecemos hoje por comunidade software livre.
14
15. De acordo com a Free Software Foundation em seu artigo “The Free Software
Definition”, entende-se:
“O software livre é uma questão de liberdade dos usuários de executar, copiar,
distribuir, estudar, modificar e melhorar o software. Mais precisamente, o que significa
que os usuários do programa tenham as quatro liberdades essenciais:
A liberdade de executar o programa, para qualquer propósito (liberdade 0).
A liberdade de estudar como o programa funciona, e alterá-lo para ele fazer o que
quiser (liberdade 1). Acesso ao código-fonte é uma condição para isso.
A liberdade de redistribuir cópias de modo que você possa ajudar ao seu próximo
(liberdade 2).
A liberdade de distribuir cópias de suas versões modificadas para os outros
(liberdade 3). Ao fazer isso você pode dar a toda a comunidade a oportunidade de
beneficiar de suas alterações. O acesso ao código-fonte é uma condição para
isso.”(GNU,2010).
2.3.2 Linux
A palavra Linux, sem dúvida alguma, é a palavra mais conhecida no mundo pelas
pessoas que não conhecem sobre software livre, código aberto ou qualquer palavra
associada ao movimento open source. Qualquer usuário de computador sabe dizer que
Linux é um sistema operacional gratuito, porém poucos o associam com o movimento
open source.
Em 1991, o estudante finlandês Linus Torvalds começou de forma independente o
Linux, um projeto que mudaria o mundo e daria uma visibilidade enorme à comunidade. O
que ele fez foi desenvolver um sistema operacional extremamente importante para o futuro
da humanidade. Linus Benedict Torvalds, nascido em 28 de dezembro de 1969 na cidade
de Helsínquia, Finlandia é o criador do núcleo (kernel) do sistema operacional
GNU/Linux, mais conhecido como Linux. O objetivo inicial era criar um sistema
operacional similar ao Unix e o projeto foi lançado em 1991 onde Linus enviou uma
mensagem para a Usenet dizendo que ele estava disposto a divulgar o código-fonte e
contar com a colaboração de outros programadores. A primeira versão oficial do núcleo do
linux, versão 0.02, foi lançada no dia 5 de outubro de 1991.
2.3.3 Principais projetos de código aberto aplicados a sistemas de inteligência de
negócios
Após uma breve explicação sobre conceitos importantes chegou a hora de listar
alguns projetos importantes que se caracterizam como projetos de código aberto aplicados
ao desenvolvimento de uma solução de BI.
São eles:
Linux: sistema operacional livre, estável, robusto, confiável e gratuito, muito
utilizado como servidores de inteligência de negócios. Algumas distribuições
Linux são: SUSE, Debian, CentOS, Ubuntu e Fedora (LINUX, 2010).
MySQL e PostgreSQL: são duas opções de bancos de dados muito utilizadas
15
16. em projetos de inteligência de negócios, ambos possuem uma versão
comunidade que pode muito bem ser utilizada para a construção do Armazém
de Dados (MySQL e PostgreSQL, 2010).
Pentaho BI Suite: uma série de ferramentas de BI desenvolvidas com
tecnologia Java. Com essas ferramentas as empresas podem construir cubos
OLAP, relatórios customizados, processos de ETL e disponibilizar tudo através
de um portal web baseado em um web container (PENTAHO, 2010).
Squirrel: cliente Universal de SQL desenvolvido em Java, muito útil para a
criação de consultas SQL e execução em diversos bancos de dados através de
uma conexão JDBC (SQUIRREL, 2010).
Apache Tomcat: conteiner java muito utilizado em aplicações web. A
plataforma de BI Pentaho utiliza o tomcat como servidor web padrão
(TOMCAT, 2010).
Java: tecnologia desenvolvida pela Sun Microsystems que permite o
desenvolvimento de aplicações para desktop, web e celulares. Algumas das
grandes vantagens da tecnologia Java são: portabilidade, robustez, segurança,
liberdade, código aberto e a credibilidade da Sun MicroSystem no mundo de
desenvolvimento de software. (SUN, 2010)
Eclipse: IDE de desenvolvimento muito utilizada no desenvolvimento de
painéis melhor trabalhados (ECLIPSE, 2010).
Jasper: outra Suite de BI concorrente da Suite Pentaho. Utiliza-se muito no
mundo livre o produto chamado JasperReports junto com a IDE para criação de
relatórios, o chamado iReports (JASPER, 2010).
2.3.4 História da Tecnologia Java e conceitos
Como pode em tão pouco tempo a tecnologia Java estar tão presente em nossas
vidas? Recentemente a Sun Microsystems, empresa criadora da tecnologia Java, divulgou
uma propaganda chamada Java is Everywhere e nos fez refletir a influência que essa
tecnologia tem em nossas vidas. De acordo com o site da Sun encontramos tecnologia
Java em: “computadores de bordo, brinquedos, carros, aviões, foguetes, e até mesmo a
NASA Mars Rover. Ela traz a interatividade com a Internet, gráficos em tempo real para
televisão, imagens instantâneas para câmeras e jogos multi-player para telefones celulares
e desktops. Ele se conecta as maiores empresas e empresas de pequeno porte para os seus
empregados, clientes e dados. E ela garante que a grande maioria das transações
eletrônicas no varejo, finanças, governo, ciência e medicina. Em suma a tecnologia Java,
vai onde quer que vá.” (SUN, 2010).
Porém nem sempre foi assim. Voltando ao passado, mais precisamente em 1995,
uma equipe de programadores chefiada por James Gosling, atualmente conhecido como o
pai do Java, iniciava a linguagem de programação orientada a objetos, atualmente
conhecida como Java.
Em 1991 o projeto chamava-se Green Project e os mentores eram Patrick
Naughton, Mike Sheridan e James Gosling. Eles tinham como objetivo planejar a “próxima
onda” do mundo digital, pois acreditavam que no futuro haveria uma convergência dos
computadores com os equipamentos e eletrodomésticos usados pelas pessoas no seu dia-a-
16
17. dia.
O grande crescimento da tecnologia Java aconteceu com a popularização da
internet que possibilitou que a tecnologia fosse utilizada em diversas aplicações web.
A grande vantagem da tecnologia Java é o que chamamos de JVM (Java Virtual
Machine), um programa que carrega e executa os aplicativos Java, convertendo os
bytecodes em código executável de máquina. Esse programa é o responsável pelo
gerenciamento dos aplicativos, à medida que são executados. Todo computador ou
dispositivo que deseja executar um programa Java precisa ter instalado uma JVM. Na
prática, graças à máquina virtual Java, os programas escritos em Java podem funcionar em
qualquer plataforma de hardware e software que possua uma versão da JVM, tornando
assim essas aplicações independentes da plataforma onde funcionam.
Atualmente a tecnologia Java está dividida em três partes principais (conforme
figura):
Java Standard Edition para aplicações desktop;
Java Enterprise Edition (Java EE), Enterprise Java Beans (EJB) para
aplicações corporativas;
Java Server Pages, servlets, struts, JSF, etc para aplicações web;
Java Micro Edition (Java ME) para aplicações móveis.
Figura 1 – Funcionamento Tecnologia Java
Fonte: UTFPR – Apontamento das aulas de Linguagem Java (LINHARES, 2009)
17
18. Exemplo.java
public class Exemplo
{
public static void main (String [] args)
{
System.out.println(“Exemplo”);
System.exit(0);
}
}
Compilador Java
Exemplo.class
--------------------
-------------------
--------------------
--------------------
(bytecode Java)
Máquina virtual Máquina virtual Máquina virtual
Java Java Java
Código nativo Código nativo PC Código nativo
PDA celular
Figura 2 – Funcionamento Tecnologia Java
Fonte: UTFPR – Apontamento das aulas de Linguagem Java (LINHARES, 2009)
A frase mais importante no mundo Java idealizada por seus criadores é: “Write
once, run everywhere.”. A tradução para o português é: “Escrever uma vez/ executar em
qualquer local” (BATES & SIERRA, 2009).
18
19. 2.3.5 Características da Tecnologia Java
A cada dia a tecnologia Java apresenta mais e mais vantagens para sua adoção, a
maior delas é a independência de plataforma, ou seja, um programa feito em Java pode
rodar em qualquer plataforma, basta que o dispositivo tenha uma JVM.
Abaixo listamos algumas das características da tecnologia Java.
Gratuita – licença GPL;
Padronizada, com uma especificação bem definida;
Mantida pela JCP (Java Community Process);
Orientada a Objetos;
Liberdade de escolha de fornecedores de tecnologia e suporte;
Independente de Plataforma - o mesmo código roda em qualquer plataforma,
sem a necessidade de recompilação;
As aplicações podem ser trocadas de servidores de aplicação;
Não existe “vendor lock-in”- caso insatisfação com relação ao fornecedor, é
possível procurar outro;
Suporte extensivo a aplicações multi-camadas;
Incentivo ao desenvolvimento orientado a objetos;
Reutilização de componentes com responsabilidades únicas;
Possibilidade de testes unitários por componentes;
Vasto conjunto de bibliotecas básicas prontas, chamadas de APIs;
Vários frameworks que ajudam na implementação de padrões de projetos;
Ferramentas para documentação de código;
Maior comunidade de desenvolvedores do mundo;
Milhares de artigos, revistas, fóruns, etc;
Suporte e apoio das maiores companhias de software do mundo;
Garbage Collector - desalocação de memória automática por processo de
coletor de lixo;
Segurança – pode executar programas via rede com restrições de execução;
Facilidades de Internacionalização – suporta nativo a caracteres Unicode;
Carga dinâmica de código – as classes são carregadas somente no momento em
que precisam ser utilizadas.
Algumas empresas que compõem a JCP (Java Community Process) são:
Sun Microsystems;
IBM;
Oracle;
BEA Systems;
RedHat;
Novell;
Xerox;
Comunidade Java.
19
20. 2.3.6 Tecnologia Java e de Código Aberto aplicada a Sistemas de Inteligência de
Negócios
Atualmente existem duas empresas importantes no mundo da tecnologia Java
aplicada à sistemas de Inteligência de Negócios, são elas: Jasper e Pentaho.
A empresa Jasper produz uma Suite de Inteligência de Negócios de código aberto
bastante robusta e importante; seu produto mais conhecido é o JasperReports junto com a
IDE de desenvolvimento de Relatórios chamada iReports. Muitos desenvolvedores Java
utilizam as ferramentas da Jasper para o desenvolvimento de relatórios em programas
desenvolvidos em Java.
No ano de 2004 algumas pessoas, oriundas das mais importantes empresas do setor
de Inteligência de Negócios, juntaram-se e fundaram a empresa Pentaho, com o objetivo de
criar uma plataforma de código aberto de Inteligência de Negócios.
A estratégia utilizada foi reunir as melhores ferramentas de código aberto
disponíveis no mercado e criar uma única suite de BI contendo todas as ferramentas
necessárias para uma solução completa de Inteligência de Negócios de código aberto. Para
isso foi necessário adquirir projetos e pessoas. O mais interessante é o fato de todas essas
ferramentas terem sido desenvolvidas em Java, mais uma vez provando a grande ligação
entre a tecnologia Java e o mundo de código aberto.
Antes da criação do Projeto Pentaho existiam quatro projetos de código aberto
importantes relacionados ao mundo de Inteligência de Negócios, são eles: Mondrian,
Kettle, JFreeReport e Weka.
O projeto Mondrian, fundado por Julian Hyde, possibilitava à comunidade de
código aberto um servidor OLAP alternativo às opções disponíveis no mercado. Com essa
ferramenta era possível integrar cubos OLAP em uma aplicação Java utilizando Jpivot,
Mondrian e Apache Tomcat.
A parte de relatórios era possível graças ao projeto JFreeReport, fundado por
Thomas Morgner. Como alternativa de código aberto para ferramentas de mineração de
dados podia-se utilizar uma ferramenta muito conhecida entre pesquisadores de
Universidades no mundo todo, a chamada Weka (Waikato Environment for Knowledge
Analysis), criada em 1993 pela Universidade de Wakato, Nova Zelândia.
O último projeto, e extremamente importante, chamado Kettle (Extraction,
Transformation, Transportation and Loading of data) criado por Matt Casters, trata-se de
uma ferramenta de ETL desenvolvida em Java.
Em outras palavras, todas essas ferramentas de código aberto, desenvolvidas em
Java, possuíam cada uma um criador e estavam disponíveis na internet. Então, à partir da
criação da Pentaho e da aquisição de todas essas ferramentas e de seus principais
desenvolvedores, surgiu o que conhecemos como o Suite Pentaho de BI, atualmente
disponível em duas formas: Community Edition e Enterprise Edition.
Desde Junho de 2005 todas as ferramentas que fazem parte do Projeto Pentaho
encontram-se disponíveis no site de download sourceforge.net e qualquer empresa pode
baixá-las e utilizar em um projeto profissional de Inteligência de Negócios.
20
21. 3 ARMAZÉM DE DADOS
Define-se Armazém de Dados (DW) como sendo o local onde são armazenados os
dados importantes de uma empresa; esses dados são catalogados de forma organizada e
estruturada. Na grande maioria das vezes utiliza-se a modelagem multi-dimensional na
construção de um DW.
Segundo Inmon (1997), idealizador do conceito, Armazém de Dados “é uma
coleção de dados integrados, orientados por assunto, variáveis com o tempo e não
voláteis, usados para dar suporte ao processo gerencial de tomada de decisão”.
3.1 Características
• Integrado: Através de um processo que chamamos de ETL (Extração,
Transformação e Carga) os dados, oriundos de diversas fontes de dados, são extraídos,
combinados, limpos, eliminados, desnormalizados, normalizados, calculados, etc; então
são enviados de forma organizada e consolidada para o DW, de forma que passa a ter um
único significado perante a empresa;
• Orientado por assuntos: Os dados do armazém de dados são organizados de modo
a facilitar a análise dos dados;
• Variante no Tempo: Os dados não são atualizáveis, ou seja, são relativos a um
determinado instante de tempo, o que proporciona o armazenamento histórico dos dados;
• Não volátil: Significa dizer que o armazém de dados permite apenas a carga
inicial dos dados e consultas a estes dados, ou seja, após serem integrados, transformados e
incluídos, os dados não podem ser alterados.
3.2 Construção
De acordo com Kimball (1997), o processo de construção de um armazém de dados
é composto de nove etapas. São elas:
1) Selecionar o processo de negócio a ser modelado – por exemplo: analisar o
faturamento da empresa medindo quantidade de produtos vendidos e valor
das vendas;
2) Definir a granularidade (nível de detalhes) do processo de negócio;
3) Escolher as dimensões que se aplicam à cada linha da tabela de fatos;
4) Identificar os fatos numéricos (métricas) que preenchem cada linha da
tabela de fatos – por exemplo: quantidade de produtos vendidos e valor
das vendas;
5) Armazenar os dados pré-calculados na tabela de fatos;
21
22. 6) Fazer a carga das tabelas de dimensão;
7) Preparar dimensões para suportar evoluções (mudanças);
8) Definir a amplitude de tempo do histórico do banco de dados;
9) Definir o espaço de tempo (periodicidade dos indicadores) com que os
dados devem ser extraídos e carregados no DW.
3.3 Extração, transformação e carga dos dados - ETC
A etapa mais trabalhosa na construção de um armazém de dados é o que chamamos
de ETL, sigla em inglês para ''Extract, Transform and Load'', e que traduzido para o
português significa Extrair, Transformar e Carregar.
Sucintamente, este processo consiste em encontrar os dados importantes que serão
analisados, extrair esses dados das diversas fontes de dados, realizar as transformações
necessárias (que podem ser limpeza, combinação, eliminação, cálculos, etc) e realizar a
carga de dados no armazém de dados. Desta forma a empresa começa a guardar seus dados
importantes em um banco de dados único, modelado de forma multi-dimensional.
Para entender esse processo é necessário entender alguns conceitos explicados
abaixo:
A) Fonte de dados - Na grande maioria dos DW, os dados provêm de várias fontes
diferentes e independentes, podendo ser essas fontes as bases de dados dos sistemas
transacionais, planilhas excel, etc.
B) Extração - Significa a leitura e entendimento das fontes de dados e a cópia das partes
necessárias para a área de transformação de dados, com o intuito de serem trabalhadas
posteriormente. Um grande desafio no processo de extração é determinar quais dados são
realmente importantes e quais tipos de filtros aplicar. Essa tarefa é uma das atividades que
mais consome tempo na construção do DW. Uma dica é perguntar ao patrocinador do
projeto quais são as informações relevantes ao projeto e simplificar ao máximo o processo
de extração, poupando recursos e tempo. Não vale a pena ter diversas informações no DW,
o ideal é ter apenas as informações mais importantes ao negócio.
C) Transformação – Esta etapa do processo de ETL é valiosa para o negócio; consiste em
realizar uma série de atividades sobre os dados extraídos, de modo a convertê-los em
formato adequado para carga no armazém de dados. Algumas etapas da transformação dos
dados de origem são:
1) Limpeza
Correção do uso incorreto ou inconsistente de códigos e caracteres especiais;
Tratamento de dados perdidos;
Correção de valores duplicados ou errados.
Sua finalidade é deixar os elementos de dados dentro de formatos padrões
(uniformizados), não duplicados, corretos, consistentes e espelhando a realidade.
22
23. 2) Eliminação
Constitui em desconsiderar os campos e dados que não são úteis ao DW.
3) Combinação
Realizada quando as fontes de dados possuem exatamente os mesmos valores de
chaves representando registros iguais ou complementares.
4) Desnormalização e Normalização
O processo padrão de transformação é reunir as hierarquias de dados, separadas em
várias tabelas devido à normalização, dentro de uma única dimensão, de forma
desnormalizada. Pode ocorrer, entretanto, que dados provenientes do processo de
extração estejam completamente desnormalizados dentro de arquivos texto. Nesse
caso pode ser que seja necessário normalizar partes dos registros.
5) Cálculos, derivação e alocação
São transformações a serem aplicadas às regras do negócio identificadas durante o
processo de levantamento de requisitos.
3.4 Acesso aos dados
Acessar os dados pode ser um momento critico e difícil. Isso é devido à grande
variedade de bancos de dados disponíveis no mercado e também à dificuldade que muitas
empresas enfrentam para conseguir acesso aos dados da empresa (visto que muitas vezes
estes são guardados a sete chaves pela área de segurança da informação).
A ferramenta utilizada para acessar os dados é chamada PDI – Kettle. Esta
ferramenta possui uma interface com o desenvolvedor bastante simples, o que possibilita a
conexão com diversos SGDB de maneira muito fácil e amigável; a conexão JDBC é a
forma mais fácil de acessar os diversos bancos de dados.
Em alguns casos os desenvolvedores de uma solução de Inteligência de Negócios
enfrentam a dificuldade de conseguir um usuário de leitura para realizar o processo de
extração. Mas isso pode ser facilmente resolvido com a ajuda de um patrocinador
importante do projeto. Este patrocinador pode muito bem tomar as providências
necessárias para a liberação dos acessos.
Todos os usuários necessários para o acesso às bases de dados transacionais devem
ter privilégios apenas de leitura. Desta forma evita-se a possibilidade de alteração ou
remoção de dados do sistema de origem, causados por algum erro humano. Essa
importante precaução reduz uma série de erros comuns em projetos de Inteligência de
Negócios e ajuda a área de segurança da informação a manter a segurança da empresa.
Em caso de fontes de dados como Excel, Access, arquivos textos, etc, o acesso aos
dados é bastante tranqüilo, visto que a ferramenta de integração de dados utilizada é
bastante robusta e capaz de ler dados em diversos formatos.
23
24. 3.5 Ferramentas OLAP
A grande maioria dos novos usuários de sistemas de Inteligência de Negócios, por
não compreender o suficiente, solicita relatórios, quando na verdade o que querem, e o que
precisam, são ferramentas de análises de dados. Essas ferramentas são as chamadas
ferramentas OLAP. O termo OLAP em inglês significa On-line Analytical Processing.
Inmon (1999) nos dá uma definição sobre o OLAP, (...) é uma tecnologia de
software que permite a analistas, gerentes e executivos obterem os dados de uma forma
rápida, consistente e com acesso interativo para uma grande variedade de possíveis visões
da informação na empresa. Mais sucintamente, OLAP é um conjunto de funcionalidades
que tem, como principal objetivo, facilitar a análise multidimensional.
Uma ferramenta OLAP é capaz de executar consultas MDX e trabalhar com o que
chamamos Cubos OLAP. Nesses cubos é possível cruzar os dados, possibilitando a criação
de diversas visões dos mesmos dados. No exemplo abaixo observamos como é possível
cruzar os dados por produtos, lojas e período.
Figura 3 – Cubo OLAP
Fonte: IT4biz
Um cubo OLAP é composto de uma tabela fato e algumas tabelas de dimensões. As
definições e exemplos desses termos seguem abaixo:
1) Tabela Fato – Tabela onde armazenam-se as chaves das dimensões e as
métricas.
2) Métricas – São os parâmetros quantitativos / valores do negócio que desejam
ser medidos; ficam armazenados na tabela fato.
24
25. Exemplo de métricas: quantidade média de produtos vendidos, valor total em reais,
gastos por cliente, etc.
3) Tabela Dimensão – Tabela onde armazenam-se os dados da dimensão.
Exemplos de algumas tabelas de dimensões são: produtos, lojas, tempo,
fornecedores, etc. Exemplo de uma dimensão hierárquica “Localização do Cliente” tendo o
seguinte agrupamento:
País -> Estado -> Cidade.
Existem duas formas de modelar um Cubo OLAP: o modelo estrela (star schema) e
modelo flocos de neve (snow flake schema).
3.6 Mineração de Dados
A mineração de dados é bastante complexa e envolve conhecimentos estatísticos a
fim de saber qual procedimento deve ser utilizado.
Normalmente as empresas, após contarem com um armazém de dados estruturado,
começam a analisar de forma mais profunda seus dados utilizando técnicas de mineração
de dados.
Na Suite Pentaho a ferramenta de mineração de dados chama-se WEKA (Waikato
Environment for Knowledge Analysis). A ''WEKA'' é uma ferramenta bastante conhecida
pelas Universidades no Brasil e no mundo. Ela foi desenvolvida pela Universidade de
Wakato, Nova Zelândia, e trazida recentemente para o portifólio de produtos da Pentaho,
tornando-se a ferramenta oficial de mineração de dados da Suite Pentaho. Porém além
desta (WEKA) existem muitas outras ferramentas poderosas de mineração de dados que
podem ser utilizadas a fim de enriquecer as decisões tomadas pelas empresas.
25
26. 4 PENTAHO
Fundada em 2004 por uma equipe de veteranos da indústria de Inteligência de
Negócios provenientes de empresas como Business Objects, Cognos, Hyperion, JBoss,
Oracle, Red Hat e SAS, a empresa Pentaho Corporation, empresa norte-americana, tornou-
se referência em Inteligência de Negócios de código aberto.
Desde seu inicio a empresa possui sua sede em Orlando, Flórida, e conta com
colaboradores vivendo em diversas partes do mundo. A Pentaho Corporation é a
desenvolvedora principal das ferramentas de Inteligência de Negócios contidas em sua
Suite.
A Pentaho possui aportes financeiros de fundos de investimentos como Enterprise
Associates, investidores do SugarCRM, Xensource, Index Ventures, investidores do
MySQL, Zend e outros.
O modelo de negócio adotado pela Pentaho é o que chamamos em inglês de
subscription model. Trata-se de uma forma de comercializar o software sem pagar pela
licença de uso, onde o fabricante, no caso a Pentaho, provê suporte, serviços e melhorias
no software através de uma mensalidade anual. Porém o cliente pode optar por utilizar a
versão community onde não existe suporte da Pentaho nem custo anual, uma vez que neste
caso o suporte é feito por meio da comunidade de desenvolvedores Pentaho espalhados por
todo o mundo.
A Pentaho coordena e patrocina todos os projetos de código aberto importantes e
cruciais relacionados à sua Suite de BI, como por exemplo os projetos Mondrian, Kettle,
WEKA, entre outros projetos.
No início os projetos mais importantes da Pentaho eram desenvolvidos por pessoas
em todas as partes do mundo e não tinham relação direta com a Pentaho. Porém em 2004,
quando a empresa foi fundada, esses projetos foram incorporados gradualmente pela
Pentaho junto com seus principais desenvolvedores.
Por exemplo, o Kettle, desenvolvido por Matt Casters, foi incorporado pela Pentaho
em 2006 e passou a chamar-se PDI (Pentaho Data Integration); desta forma Matt Casters, o
desenvolvedor mais importante, começou a trabalhar junto com a Pentaho.
Outro exemplo importante é o projeto Mondrian, desenvolvido por Julian Hyde, um
inglês que também foi incorporado, em 2005, junto com seu projeto, à Pentaho.
Além da parte de integração de dados (Kettle) e servidor OLAP (Mondrian)
também era necessária uma solução de relatórios. É exatamente nesta parte que entra o
desenvolvedor Thomas Morgner, que também foi incorporado à Pentaho junto com seu
projeto de código aberto chamado JfreeReporting. Atualmente Thomas é o principal líder
do projeto, rebatizado como Pentaho Reporting.
Por fim, mais uma importante aquisição em 2006 foi o projeto WEKA. Um dos
principais desenvolvedores deste projeto, o Sr. Mark Hall, incorporou-se à Pentaho,
tornando-se o Engenheiro Sênior de Mineração de Dados da Pentaho, e o projeto WEKA
passou a ser conhecido como Pentaho Mineração de Dados.
Outras pessoas importantes na história da Pentaho são: Marc Batchelor (fundador e
Engenheiro Chefe), Richard Daley (fundador e presidente), James Dixon (fundador Chefe
Geek), Doug Moran (fundador e vice-presidente da comunidade) e Will Gorman (vice-
presidente).
26
27. 4.1 Mobilidade
Acesso de KPI's através de celulares com navegadores WEB. Por exemplo: iPhone,
Motorola Milestone(Google Android), etc.
4.2 Características
Projeto 100% Java;
Servidor de BI e ferramentas de desenvolvimento multi plataforma;
Escalável;
Confiável;
Código aberto;
Desenvolvido utilizando padrões abertos e ferramentas de mercado;
Custo Zero de Licença (versão pentaho community);
Possibilidade de customização e integração;
Independente de Fornecedor;
Suporte do fabricante por meio de Subscription Model (pago);
Grande Comunidade de Desenvolvedores no Brasil e no Mundo;
Acesso web aos indicadores de negócio via navegador, independente de sistema
operacional (Windows, Linux, Mac, iPhone, Google Android, etc).
4.3 Pentaho BI Suite
A construção de um projeto de Inteligência de Negócios utilizando o Pentaho pode
ser exemplificada através da figura abaixo.
Figura 4 – Visão Geral de um Projeto de BI com Pentaho
Fonte: IT4biz
27
28. Utiliza-se o PDI - Kettle para o processo de ETL; o armazém de dados pode ser
construído em cima de qualquer base de dados. O servidor de aplicação, chamado BI
Server, também é multi- plataforma. Ele será o responsável pelo controle de acesso e
compartilhamento dos Cubos OLAP, relatórios e painéis construídos baseados no DW. Os
usuários poderão acessar esses indicadores de diversas formas, como por exemplo através
de computadores desktop (Windows, Linux e Mac), computadores pessoais, celulares com
acesso à internet e navegador (iPhone, Android, Nokia, etc), entre outros.
4.4 Pentaho BI Server
O Pentaho BI Server é a aplicação responsável pelo gerenciamento dos indicadores,
compartilhamento entre os usuários, controle de acesso, etc. O Pentaho BI Server pode ser
executado em diversos webserver J2EE, tais como: Tomcat, JBOSS, Glassfish e outros. A
versão atual do Pentaho BI Server é a versão 3.5, e utiliza o Tomcat como webserver
padrão.
Figura 5 – Servidor de BI Pentaho
Fonte: Pentaho
28
29. Figura 6 – Arquitetura Servidor de BI Pentaho
Fonte: Pentaho
29
30. 4.5 PRD (Pentaho Report Designer)
O PRD, sigla para Pentaho Reporting Designer, é a ferramenta de criação de
relatório da Pentaho. A versão atual, chamada PRD 3.5, foi totalmente reescrita por seu
criador Thomas, e apresenta uma série de novas funcionalidades.
Com o PRD é possível criar relatórios com filtros, gráficos, sub-relatórios, entre
outros, em PDF, Excel, ou HTML, e publicá-los diretamente no Pentaho BI Server sem a
necessidade de um conhecimento de programação. A ferramenta é totalmente visual e
permite a criação de relatórios extremamente profissionais. Ela também torna possível a
criação do que chamamos relatório pixel perfect, no qual é possível organizar cada pixel.
4.6 PDI (Pentaho Data Integration)
O PDI é uma das ferramentas mais importantes da Suite de BI da Pentaho, sendo o
responsável pelos processos de ETL (Extração, Transformação e Carga). De uma forma
totalmente visual a ferramenta permite o desenvolvedor de ETL conectar-se a diversos
bancos de dados, extrair dados, copiar, transformá-los, combiná-los, apagá-los, atualizá-
los, enviá-los a diversos locais, criar “jobs”, enviar e-mails, acessar um servidor via ssh,
ftp, realizar tratamentos de erros, e tantas outras tarefas necessárias a um processo de ETL.
Com a utilização do PDI é possível integrar empresas e sistemas de uma forma visual e
organizada.
4.7 PSW (Pentaho Schema Workbench)
O Pentaho Schema Workbench é a ferramenta necessária para a criação dos cubos
OLAP no formato XML. O processo de criação deste esquema pode ser através de um
editor de texto ou, de forma visual, através da aplicação PSW – Pentaho Schema
Workbench.
Os cubos criados no PSW são exibidos no Pentaho BI Server; seu processo de
publicação é bastante simples e intuitivo. Com a ajuda do PSW é possível criar métricas,
dimensões, hierarquias, etc.
4.8 WEKA
A WEKA é a ferramenta de mineração de dados da Suite de BI da Pentaho. Trata-se
de um ambiente gráfico onde é possível aplicar de forma intuitiva modelos estatísticos,
inteligência artificial, e outros modelos, com o fim de enriquecer a base de dados e apoiar o
processo de tomada de decisão.
30
31. 5. CONSTRUINDO UMA SOLUÇÃO DE BI PROFISSIONAL
O processo de instalação das ferramentas de BI é bastante simples, consistindo, na
grande maioria das vezes, em descompactar os arquivos e executar o programa. Nesta
monografia não abordaremos esse processo de instalação; as formas mais avançadas de
instalação do Pentaho BI Server também não serão abordadas nesta monografia.
5.1 Instalação das ferramentas de Inteligência de Negócios
Para este projeto foi preparada uma máquina de desenvolvimento com o sistema
operacional Linux, utilizada como servidor e máquina de desenvolvimento. Em um projeto
real é necessário criar ambientes separados, e, de preferência, utilizar o sistema operacional
Linux para o servidor.
Abaixo seguem duas listas de instalação.
Lista do que deve ser instalado no Servidor Pentaho BI Server e Armazém de
Dados:
Sistema Operacional Linux;
Banco de dados para o Armazém de Dados;
JDK (Java Development Kit);
Pentaho BI Server.
Lista do que deve ser instalado nas maquinas dos desenvolvedores de BI:
Sistema Operacional;
JDK (Java Development Kit);
PSW – Pentaho Schema Workbench;
PRD – Pentaho Report Designer;
PDI – Pentaho Data Integration;
Squirrel – SQL Cliente Universal.
31
32. Figura 7 – Tela de Login Portal BI
Fonte: Sistema Desenvolvido para a Monografia
Figura 8 – Tela Interna Portal BI
Fonte: Sistema Desenvolvido para a Monografia
32
33. 5.2 Processos de ETL
O processo de coleta, organização, limpeza, aplicação de regras de negócios,
fórmulas, combinação de diversas fontes de dados e armazenamento dos dados consume
grande parte do esforço e dos recursos necessários para a realização de um projeto de
Inteligência de Negócios. Esta etapa precisa ser desenvolvida em colaboração com as
pessoas tomadoras de decisão, pois as perguntas de negócio determinam os processos de
ETL.
5.2.1 Definindo os indicadores
Neste estudo de caso definimos como indicador a ser desenvolvido a análise de
faturamento da empresa EXEMPLO. Este indicador terá sua análise de faturamento
(quantidade de vendas e valor das vendas) cruzado com vendedor, canal de venda, cliente,
produto e tempo.
A grande maioria das empresas possui dificuldade em cruzar dados extremamente
importantes, por isso pensamos em um modelo que pudesse ser aplicado por empresas de
todos os tamanhos.
Segundo o SEBRAE: “Planejar ações de vendas e, por meio de avaliações
sistemáticas, ampliar o índice de acerto e corrigir erros cometidos, é uma forma de
empresas aumentarem a competitividade no mercado. A adoção de um controle de vendas
possibilita ao empresário prever receitas futuras e, consequentemente, programar compras
da empresa. Além disso, torna-se mais fácil acompanhar o comportamento mensal das
vendas, as variações devido à sazonalidade, bem como o prazo médio concedido para os
pagamentos realizados a prazo.” (SEBRAE, 2010)
Assim chegamos ao modelo definido neste estudo de caso. As visões definidas são:
Total (R$) e Quantidade de Produtos Vendidos;
◦ Por:
▪ Vendedor;
▪ Canal de Venda;
▪ Cliente;
▪ Produto;
▪ Tempo.
5.2.2 Modelagem Dimensional
Na figura abaixo vemos o modelo dimensional desenvolvido para responder às
perguntas definidas pelos usuários do sistema de apoio à decisão. Neste modelo utilizou-se
o esquema estrela (Star Schema).
No cubo OLAP, definido para analisar o faturamento da empresa, temos a tabela
“fato vendas”. Nesta tabela as quantidades de produtos vendidos e total da venda (R$) são
definidas como métricas, e as dimensões são: vendedores, canal de venda, cliente, produto
e tempo.
Modelo Estrela - Cubo Faturamento
33
34. Figura 9 – Modelo Estrela – Cubo Faturamento
Fonte: Sistema Desenvolvido para a Monografia
34
35. 5.2.3 Descrição das dimensões, fatos e campos
Tabela: fato_venda
Figura 10 – Tabela Fato_Venda
Fonte: Sistema Desenvolvido para a Monografia
Métricas:
qtd_produtos = Quantidade de Produtos vendidos
total_venda = Valor Total (R$) da Venda.
Relacionamentos:
fato_venda.id_cliente → dim_cliente.id_cliente
fato_venda.id_canalvenda → dim_canalvenda.id_canalvenda
fato_venda.id_vendedor → dim_vendedor.id_vendedor
fato_venda.id_produto → dim_produto.id_produto
fato_venda.id_tempo → dim_tempo.id_tempo
Tabela: dim_canalvenda
Figura 11 – Tabela Dim_CanalVenda)
Fonte: Sistema Desenvolvido para a Monografia
Descrição dos Campos:
id_canalvenda → Identificador único do Canal de Venda
cod_canalvenda → Código do Canal de Venda no Sistema de Origem
desc_canalvenda → Descrição do Canal de Venda
35
36. Tabela: dim_tempo
Figura 12 – Tabela Dim_Tempo
Fonte: Sistema Desenvolvido para a Monografia
Descrição dos Campos:
id_tempo → Identificador único do Período
ano → Ano
trimestre → Trimestre
mes → Mês
mesnumero → Número do Mês
Tabela: dim_cliente
Figura 13 – Tabela Dim_Cliente
Fonte: Sistema Desenvolvido para a Monografia
Descrição dos Campos:
id_cliente → Identificador único do Cliente
cod_cliente → Código do Cliente no Sistema de Origem
documento → CNPJ, CPF ou RG
tipo → Pessoa Física ou Pessoa Jurídica
desc_cliente → Descrição do Cliente
36
37. cidade → Cidade do Cliente
estado → Estado do Cliente
pais → Pais do Cliente
latitude → Latitude do Cliente
longitude → Longitude do Cliente
desc_negocio → Descrição do Negócio do Cliente
Tabela: dim_produto
Figura 14 – Tabela Dim_Produto
Fonte: Sistema Desenvolvido para a Monografia
Descrição dos Campos:
id_produto → Identificador único do Produto
cod_produto → Código do Produto no Sistema de Origem
desc_produto → Descrição do Produto
cod_categoria → Código da Categoria
desc_categoria → Descrição da Categoria
status_produto → A = Ativo e I = Inativo
Tabela: dim_vendedor
Figura 15 – Tabela Dim_Vendedor
Fonte: Sistema Desenvolvido para a Monografia
37
38. Descrição dos Campos:
id_vendedor → Identificador único do Vendedor
cod_vendedor → Código do Vendedor no Sistema de Origem
documento → CPF, CNPJ, RG
tipo → vendedor interno, vendedor externo, distribuidor, representante, revendedor
desc_vendedor → Descrição do Vendedor
datanascimento → Data de Nascimento do Vendedor
cidade → Cidade do Vendedor
estado → Estado do Vendedor
pais → Pais do Vendedor
5.2.4 Criando os processos de ETL no Kettle
Utilizaremos a ferramenta PDI – Kettle para desenvolver as rotinas de extrações,
transformações e cargas necessárias para a criação do armazém de dados.
Abaixo vemos os componentes utilizados para a criação de uma dimensão
tradicional e suas funções.
Figura 16 – Exemplo de ETL usando o PDI
Fonte: Sistema Desenvolvido para a Monografia
Componentes:
1) TIN – Extrai Dados → Utilizando o componente Table Input, extraímos os dados
necessários para a dimensão, através de uma consulta SQL realizada na base de dados de
Origem das informações.
2) DIMLKP – Carrega Dimensão → No próximo passo utilizamos o componente
do PDI chamado Dimension Lookup. Este componente verifica se o registro já existe e
permite a inserção (caso o registro não exista) ou atualização do registro (caso o mesmo
exista). O DIMLKP permite a criação e a carga de uma dimensão, sendo também o
responsável pelos controles existentes em uma dimensão.
O processo de criação da “tabela fato” envolve componentes como Table Input,
Database Lookup e outros.
Não abordaremos nesta monografia o processo completo existente da construção
das rotinas necessárias para a criação de um armazém de dados. Gostaríamos apenas de
registrar que todo o processo de ETL pode ser criado utilizando o PDI – Kettle, de forma
totalmente visual e componentizada, como demonstrado no exemplo anterior.
38
39. 5.3 Cubos OLAP
Na figura abaixo temos o Cubo OLAP de faturamento criado para o estudo de caso
desta monografia.
Neste cubo podemos analisar a quantidade de produtos vendidos e o valor total por
produto, vendedor, cliente e canal de venda.
Figura 17 – Cubo OLAP Faturamento
Fonte: Sistema Desenvolvido para a Monografia
39
40. O Cubo OLAP de faturamento permite ao usuário, sem conhecimento técnico
algum, criar, de forma independente, diversas visões de negócio.
Clicando no ícone abaixo, o usuário pode modificar a ordem das dimensões,
adicionar e remover métricas e aplicar filtros.
Abaixo podemos visualizar um exemplo de cubo de faturamento.
Figura 18 – Criando uma nova visão no Cubo OLAP de Faturamento
Fonte: Sistema Desenvolvido para a Monografia
No cubo de faturamento foram definidas três métricas: quantidade de produtos
vendidos, faturamento total e quantidade de vendas. De forma simples o usuário pode
escolher quais métricas ele utilizará para cada visão.
Figura 19 – Escolhendo as métricas
Fonte: Sistema Desenvolvido para a Monografia
40
41. Com o intuito de demonstrar a capacidade de criação de diversas visões das
mesmas informações, mostraremos algumas visões criadas a partir do cubo de faturamento.
Figura 20 – Visão por Produto
Fonte: Sistema Desenvolvido para a Monografia
Figura 21 – Faturamento por Canal de Venda
Fonte: Sistema Desenvolvido para a Monografia
41
42. Figura 22 – Faturamento por Canal de Venda
Fonte: Sistema Desenvolvido para a Monografia
42
43. Figura 23 – Faturamento por Produtos
Fonte: Sistema Desenvolvido para a Monografia
43
44. Figura 24 – Faturamento por Vendedores
Fonte: Sistema Desenvolvido para a Monografia
44
45. Figura 25 – Faturamento por Vendedores (Gráfico)
Fonte: Sistema Desenvolvido para a Monografia
45
46. Figura 26 – Quantidade de Produtos Vendidos por Vendedores (Gráfico)
Fonte: Sistema Desenvolvido para a Monografia
46
47. Figura 27 – Faturamento por Vendedores e Período (Tempo)
Fonte: Sistema Desenvolvido para a Monografia
47
48. Figura 28 – Filtrando a dimensão Produtos
Fonte: Sistema Desenvolvido para a Monografia
Figura 29 – Recurso de Drill Through
Fonte: Sistema Desenvolvido para a Monografia
48
49. O visualizador OLAP JPivot permite ao usuário transformar as informações em
diversos tipos de gráficos e exportar para PDF e Excel. Abaixo vemos os ícones que
permitem essas funcionalidades.
Figura 30 – Possibilidades JPivot.
Fonte: Sistema Desenvolvido para a Monografia
5.4 Painel com Mapas
Com o intuito de ajudar o gestor da empresa foi criado um painel utilizando Java,
jQuery (AJAX), Pentaho e Google Maps. Neste painel é possível identificar a localização
dos clientes da empresa, saber, através das cores, o total de faturamento de cada cliente,
filtrar por faturamento, canal de venda, período, região e estado.
Legenda das cores dos ícones:
- Vermelho = Até 100 mil reais;
- Azul = Acima de 100 mil reais até 300 mil reais;
- Amarelo = Acima de 300 mil reais até 500 mil reais;
- Laranja = Acima de 500 mil reais até 1 milhão;
- Verde = Acima de 1 milhão.
49
50. Figura 31 – Painel Faturamento
Fonte: Sistema Desenvolvido para a Monografia
Figura 32 – Painel Faturamento por Estado
Fonte: Sistema Desenvolvido para a Monografia
50
51. 5.5 Google Android
De acordo com o site do Google: “Android é um software de código aberto criado
para celulares e outros dispositivos. O Android Open Source Project (AOSP), liderado
pelo Google, está encarregado da manutenção e desenvolvimento do Android.” (Google,
2010)
5.5.1 Acessando o sistema de Inteligência de Negócios pelo celular Google Android
O portal de BI desenvolvido para a empresa exemplo poderá ser acessado através
de um aplicativo desenvolvido para rodar em celulares com o sistema operacional Google
Android.
Figura 33 – Simulação do Aplicativo para acessar o Portal de BI no Google Android
Fonte: Sistema Desenvolvido para a Monografia
51
52. O aplicativo necessário para acessar o Portal chama-se IT4biz BI Mobile.
Figura 34 – Aplicativo IT4biz BI Mobile – Android
Fonte: Sistema Desenvolvido para a Monografia
Figura 35 – Tela de Login Portal BI acessado via Google Android
Fonte: Sistema Desenvolvido para a Monografia
52
53. Figura 36 – Exemplo de um Painel visualizado através do Google Android
Fonte: Sistema Desenvolvido para a Monografia
Figura 37 – Exemplo de outro Painel visualizado através do Google Android
Fonte: Sistema Desenvolvido para a Monografia
53
54. Figura 38 – Exemplo de Cubo OLAP visualizado através do Google Android
Fonte: Sistema Desenvolvido para a Monografia
5.5.2 BI Touch e BI Mobile: informações estratégicas na palma da sua mão
Alguns celulares possuem o recurso de tela sensível ao toque (touch screen), o que
possibilita um portal de BI sensível ao toque; desta forma o executivo pode manipular seus
indicadores através do toque.
O futuro é a migração dos aplicativos para os celulares. Acompanhando essa
tendência, o portal de BI desenvolvido para a empresa exemplo poderá ser acessado via
aplicativo próprio desenvolvido para o Google Android.
Cada vez mais as empresas buscam soluções onde as informações estratégicas
possam estar ao fácil alcance das pessoas que tomam as decisões. Pensando nisso
apresentamos, neste portal de BI, a possibilidade de visualização dessas informações em
qualquer celular com acesso à internet e em celulares equipados com a tela sensível e
sistema operacional google android. Através desta solução de BI Mobile e Touch o poder
está literalmente nas mãos dos usuários, de forma rápida e simples.
54
55. 6. CONCLUSÕES
Conclui-se que, com a chegada de ferramentas de código aberto ao setor de
Inteligência de Negócios, tornou-se possível para pequenas, médias e grandes empresas o
investimento na criação de sistemas de apoio à decisão, os quais têm como objetivo
auxiliar os executivos das empresas no processo de tomada de decisão.
Um sistema de Inteligência de Negócios pode atender diversos usuários que
estejam em diversas áreas da empresa, desde áreas operacionais até áreas estratégicas da
mesma.
Com o crescimento do movimento open source diversas empresas têm investido na
criação de soluções baseadas em código livre. Estas soluções podem ajudar diversas
empresas a economizar muito dinheiro e a obter a mesma qualidade de uma ferramenta
proprietária consolidada no mercado.
Apesar das ferramentas necessárias para a criação de um projeto de Inteligência de
Negócios serem, na maioria das vezes, disponibilizadas gratuitamente, o processo de
concepção, planejamento, desenvolvimento, testes e acompanhamento precisam ser
realizados por mão de obra qualificada e especializada.
Estamos vivendo uma era de liberdade, um momento histórico onde empresas, sem
os recursos necessários, podem se beneficiar com as tecnologias antigamente presentes
somente nas grandes empresas.
O modelo de código aberto proporciona às empresas uma liberdade e uma
economia significativa. Estes fatores, que geralmente não existem no modelo proprietário,
são os pontos fortes desse modelo, seu grande diferencial.
55
56. 7. BIBLIOGRAFIA
PUZO, Mario. O Poderoso Chefão. Record, 2000.
TZU, Sun. A arte da Guerra. L&PM, 2000.
KOTLER, Philip. Marketing para o século XXI: como criar, conquistar e dominar
mercados. Futura, 1999.
INMON, W. H. Como Construir o Data Warehouse. Campus, 1997.
KIMBALL, Ralph. The Data Warehouse Toolkit. John Wiley & Sons,Inc, 1996.
BATES & SIERRA. Use a Cabeça! Java. O'REILLY, 2009.
BOUMAN & DONGEN, Pentaho Solutions: Business Intelligence and Data
Warehousing with Pentaho and MySQL. Wiley, 2009.
GORMAN, Will, Pentaho Reporting 3.5 for Java Developers. Packt Publishing, 2009.
ROLDÁN, María. Pentaho 3.2 Data Integration: Beginner's Guide. Packt Publishing,
2010.
Pentaho. Definições sobre o Produto Pentaho BI Suite. Disponível em:
<http://www.pentaho.com>. Acesso em: 16 de Junho de 2010.
DIXON, James. The Beekeeper. Disponível em:
<http://wiki.pentaho.com/display/BEEKEEPER/The+Beekeeper>. Acesso em: 16 de
Junho de 2010.
Google. Projetos do Google para o Android. Disponível em:
<http://code.google.com/intl/pt-BR/android>. Acesso em: 16 de Junho de 2010.
Google. Android Developers. Disponível em: <http://developer.android.com/index.html>.
Acesso em: 16 de Junho de 2010.
Google. The Developer's Guide. Disponível em:
<http://developer.android.com/guide/index.html>
Acesso em: 16 de Junho de 2010.
Google. Android SDK. Disponível em: <http://developer.android.com/sdk/index.html>.
Acesso em: 16 de Junho de 2010.
Google. About the Android Open Source Project. Disponível em:
<http://source.android.com/about/index.html>. Acesso em: 23 de Julho de 2010.
GNU. The Free Software Definition. Disponível em:
<http://www.gnu.org/philosophy/free-sw.html>. Acesso em: 16 de Junho de 2010.
GNU. The GNU Manifesto. Disponível em: <http://www.gnu.org/gnu/manifesto.html>.
Acesso em: 16 de Junho de 2010.
56
57. SUN. Java is Everywhere. Disponível em: <http://br.sun.com/java/everywhere>. Acesso
em: 16 de Junho de 2010.
JPIVOT. Informações sobre o visor OLAP JPivot. Disponível em:
<http://jpivot.sourceforge.net/>. Acesso em: 16 de Junho de 2010.
OSI. Open Source Initiative - Definição de Código Aberto. Disponível em:
<http://www.opensource.org/osd.html>. Acesso em: 16 de Junho de 2010.
OSI. Open Source Initiative - História da iniciativa Open Source. Disponível em:
<http://www.opensource.org/history>. Acesso em: 16 de Junho de 2010.
SUN. Glossário Definição Java. Disponível em:
<http://java.sun.com/docs/glossary.html>. Acesso em: 16 de Junho de 2010.
SUN. Definição Java. Disponível em:
<http://www.java.com/en/download/whatis_java.jsp>. Acesso em: 16 de Junho de 2010.
MySQL. MySQL Community Server. Disponível em:
<http://www.mysql.com/downloads/mysql/>. Acesso em: 16 de Junho de 2010.
PostgreSQL. Definição PostgreSQL. Disponível em: <http://www.postgresql.org/about/>.
Acesso em: 16 de Junho de 2010.
Squirrel. Definições Squirrel. Disponível em: <http://squirrel-sql.sourceforge.net/>.
Acesso em: 16 de Junho de 2010.
Tomcat. Definições Apache Tomcat. Disponível em: <http://tomcat.apache.org/>. Acesso
em: 16 de Junho de 2010.
Eclipse. Definições Eclipse. Disponível em: <http://www.eclipse.org/>. Acesso em: 16 de
Junho de 2010.
Jasper. Definições Jasper. Disponível em: <http://jasperforge.org/projects/jasperreports>.
Acesso em: 16 de Junho de 2010.
Linux. The Linux Foundation. Disponível em: <http://www.linuxfoundation.org/>.
Acesso em: 16 de Junho de 2010.
SEBRAE. Acompanhamento e controle de vendas. Disponível em:
<http://www.sebrae.com.br/momento/tenho-um-negocio-com-menos-de-2-
anos/gestao/falta-controle/integra_bia?ident_unico=396>. Acesso em: 23 de Julho de 2010.
LINHARES, Robson. Apontamento das aulas de Linguagem Java. Disponível em:
<http://www.dainf.ct.utfpr.edu.br/~robson/posjava/2009/>. Acesso em: 20 fevereiro de
2009.
57