Business Analytics

1.032 visualizações

Publicada em

Palestra apresentada na 1ª Escola de Verão - http://escoladeverao.com.br/2013/

Publicada em: Tecnologia
0 comentários
3 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
1.032
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
53
Comentários
0
Gostaram
3
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Business Analytics

  1. 1. Data Science e Business Analytics Prof. Ms. Petrônio Cândido
  2. 2. Tópicos● Business Intelligence● Big Data● NoSQL● Data Mining● Data Science● Business Analytics
  3. 3. Business Intelligence"Um termo guarda-chuva que encobre ferramentas, arquiteturas, metodologias, bancos de dados, etc. integradas em um suíte de software" (Turban et al., 2007 apud Chee, 2009)● Objetivos ○ Auxiliar o processo de tomada de decisão gerencial; ○ Gerar Diferencial competitivo;
  4. 4. Business Intelligence● ERP - Enterprise Resource Planning● DSS - Decision Support Systems● EIS - Executive Information Systems● CRM - Customer Relationship Management
  5. 5. http://jp4.r0tt.com/l_5013ce00-5c4a-11e1-ba5f-a9c495600004.jpg
  6. 6. O macro processo da informação Sistemas de DADOS Produção DADOS BD OLTP Operacional Clientes Funcionários CICLO DO BIOfertas PlanejamentoPromoções Metasetc Promoções CONHECIMENTO Relatórios Gerentes Cubos Data INFORMAÇÃO INFORMAÇÃO Dashboards Warehouse Data Mining DECISÃO
  7. 7. O macro processo da informação Sistemas de DADOS Produção DADOS BD OLTP Operacional Clientes FuncionáriosOfertas PlanejamentoPromoções Metasetc Promoções CONHECIMENTO Relatórios Gerentes Cubos Data INFORMAÇÃO INFORMAÇÃO Dashboards Warehouse Data Mining DECISÃO
  8. 8. Business Intelligence● KPI - Key Performance Indicators● Data Warehouse● Integration Process / ETL● Reporting● OLAP● Dashboards
  9. 9. Processo Pentaho BI Server Data Warehouse Clientes R E Q U I S PDI T O S PRD Schema BD Workbench OperacionalAnalistas de BI Spoon
  10. 10. Processo Pentaho SGDB Servidor de Aplicação BDClientes Operacional BI Server PUC JReport Data R Warehouse E Documentos Q PAC JPivot U I CDE Repositorios S Meta Dados T PDI O PAN, KITCHEN, Web S Mondrian CARTE FERRAMENTAS ADMINISTRATIVASAnalistas PRD PME PDI PSW SPOON PDS CDE PAD de BI
  11. 11. Business Intelligence● Exemplos ○ http://www.paraondefoiomeudinheiro.org. br/dataset/estado-sao-paulo-2012 ○ http://ison.stratebi.es/aerobrasil/ ○ http://www.it4biz.com.br/apps/dados.gov.br/obrasdopac/ ○ http://www.estatisticasfutebolbrasileiro.com/
  12. 12. Business Intelligence● Data Warehouses ○ (Inmon, 2002) e (Kimball, 2002) ○ Conjunto de dados orientado à assunto, integrados, não voláteis, variáveis em relação ao tempo; ○ Dados agregados/sintetizados; ○ Estruturado;
  13. 13. Business Intelligence● De onde vêm os dados? ○ ERPs ○ Planilhas ○ Arquivos de Texto ○ Em sua maioria os dados são estruturados
  14. 14. http://www.kdnuggets.com/images/big-data-cartoon-100000-warehouses.jpg
  15. 15. Business Intelligence● Novas fontes de dados
  16. 16. Business Intelligence● Novas fontes de dados ○ Monitoramento da marca; ○ Monitoramento de campanhas de marketing; ○ Relacionamento com o consumidor; ○ Análise de tendências;
  17. 17. Business Intelligence● Novas fontes de dados ○ Dados estruturados/semi estruturados e não estruturados; ○ Fluxo contínuo; ○ Alta dimensionalidade; ○ Esquema flexível;
  18. 18. Processo de integração - ETL
  19. 19. http://www.priv.gc.ca/information/ar/images/cartoon3.jpg
  20. 20. Big Data● Buzzword da moda...● Quando o tamanho do dados faz parte do problema!● Alta Dimensionalidade ○ Entidades / Atributos / Instâncias
  21. 21. Big Data● 4 Vs (Stapleton, 2011) ○ Volume ■ Terabytes para Petabytes de dados ○ Velocidade ■ Fluxo contínuo e rápido de novos dados ○ Variedade ■ Dados estruturados, semi e não estruturados ○ Veracidade ■ Governança de dados e qualificação entre Consistente, Inconsistente, Incompleto, Ambíguo, ...
  22. 22. https://devcentral.f5.com/blogs/us/the-four-v-rsquos-of-big-data
  23. 23. Big Data● Exemplos ○ Social Media ○ Web Logs ○ Sensor Networks ○ Cadeias de DNA ○ LHC
  24. 24. Big Data● SGBDs relacionais (Codd, 1970) têm capacidade de lidar com esse problema?● ACID x BASE (Pritchett, 2008)● Teorema CAP (Brewer, 2000) ○ Consistency / Availability / Partition Tolerant ○ Escolha apenas 2!
  25. 25. NoSql● Esquemas de dados não relacionais ○ Key-Value Store ○ Document Store ○ Graph Databases ○ Wide Column / Column Oriented ○ ...
  26. 26. NoSql● Esquema flexível● Alta escalabilidade ○ Replicação ○ Particionamento vertical e horizontal ○ Sharding● MapReduce (Dean, 2008)
  27. 27. Juntando tudo● Utilizando NoSQLs como backend para Data Warehouses com Big Data...● Mais dados, mais demandas!● O que fazer com tantos dados?
  28. 28. http://dilbert.com/dyn/str_strip/000000000/00000000/0000000/000000/00000/6000/600/6644/6644.strip.gif
  29. 29. Data Mining Banco de dados + Estatística + Inteligência Artificial + ...
  30. 30. Data Mining● KDD - Knowledge Discovery in Databases (Fayyad, Piatetsky-Shapiro, 1996)● SEMMA (SAS, 2000) ○ Sample, Explore, Modify, Model, Assess● CRISP/DM (Chapman et al., 2000) ○ CRoss-Industry Standard Process for Data Mining
  31. 31. Data Mining (Azevedo, 2008)
  32. 32. Data Science● Indo além do KDD...● Espectro mais amplo do que o KDD;● Enquando a DM é uma metodologia específica, a DS é a aplicação do método científico
  33. 33. Data Science
  34. 34. Data Science● Banco de Dados● Simulação● Inteligência Artificial● Otimização● Inferência Estatística● Análise Multivariada● Séries Temporais● ...
  35. 35. Data Science● Descritive ○ Descreve e modela os dados● Diagnostic ○ Identifica uma ou mais CAUSAS nos dados● Preditive ○ Modela as tendências apontadas pelos dados● Prescritive ○ Indica a melhor tendência a seguir
  36. 36. Business Analytics● Data Science dentro do Business Intelligence● O BI tem um foco mais informativo e descritivo; ○ Acompanhamento da situação do negócio● O BA tem um foco mais preditivo e diagnóstico; ○ Projeção do negócio
  37. 37. BI vs BA Business Intelligence Business Analytics Relatórios ProjeçõesMétodos Gráficos Modelos Indicadores Cenários O que aconteceu? Por que aconteceu? Quando ? Acontecerá novamente?Perguntas Onde? Quando? Como? O que mais poderá Quem? acontecer?
  38. 38. https://community.jivesoftware.com/docs/DOC-30464
  39. 39. Tendências● Genética● Séries Espaço-Temporais ○ Trajetórias ○ Wireless Sensor Networks● Data Warehouses Multimídia● Ubiquitous● Real Time Analysis
  40. 40. Conclusão Intelligence ERPs Data Warehouse LogsArquivos E-mail Big Data Analytics NoSQL Web Social Media INFORMAÇÃO DADO CONHECIMENTO
  41. 41. Referências● Azevedo, A.; Santos, M.F. KDD, SEMMA, and CRISP-DM: A Parallel Overview. Proceedings of the IADIS European Conference on Data Mining, Amsterdam, 2008, pp. 182-185. Disponível em http://recipp.ipp.pt/handle/10400.22/136. Acesso em 28/01/2013.● Brewer, Eric A.: Towards Robust Distributed Systems. Portland, Oregon, July 2000. – Keynote at the ACM Symposium on Principles of Distributed Computing (PODC). Disponível em http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC- keynote.pdf Acesso em 27/01/2013.● Chapman, P. et al. CRISP-DM 1.0 - Step-by-step data mining guide. 2000. Disponível em http://www.crisp-dm.org/CRISPWP-0800.pdf. Acesso em 27/01/2013.● Chee, Timothy; Chan, Lee-Kwun et al. Business Intelligence Systems: State-of- the-art review and contemporary applications. In Symposium on Progress in Information & Communication Technology 2009. p. 96-101.● Codd, Edgar F.: A Relational Model of Data for Large Shared Data Banks. In: Communications of the ACM 13 (1970), June, No. 6, p. 377–387● Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large clusters. Communications of the ACM. p. 107-113. 2008.
  42. 42. Referências● Fayyad, U. M. et al. From data mining to knowledge discovery: an overview. In Fayyad, U. M.et al (Eds.), Advances in knowledge discovery and data mining. AAAI Press / The MIT Press.● Fayyad, U. and Piatetsky-Shapiro, G. and Smyth, P. The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM v. 39, n. 11, p. 27-34. 1996.● Inmon, W.H. Building the data warehouse. J. Wiley. 2002.● MacVittie, Lori. The Four V’s of Big Data. Disponível em https://devcentral.f5. com/blogs/us/the-four-v-rsquos-of-big-data. Acesso em 27/01/2013.● Pritchett, Dan. BASE: An ACID alternative. ACM Queue. 2008. Disponível em http://queue.acm.org/detail.cfm?id=1394128. Acesso em 27/01/2013.● Kimball, R.; Ross, M. et al. The data warehouse toolkit: the complete guide to dimensional modelling. New York: 2002.● SAS Institute. SAS Enterprise Miner – SEMMA. Disponível em http://www.sas. com/technologies/analytics/datamining/miner/semma.html. Acessado em 27/01/2013.● Stapleton, Lisa K. Taming big data. Disponível em http://www.ibm. com/developerworks/data/library/dmmag/DMMag_2011_Issue2/BigData/index. html?cmp=dw&cpb=dwinf&ct=dwnew&cr=dwnen&ccy=zz&csr=051211. Acesso em 27/01/2013.
  43. 43. Perguntas? Dúvidas? Críticas?Sugestões?

×