www.ipvc.pt<br />AnalysisServices<br />■Realizado por: Joel Latino<br />                             joellatino@ipvc.pt<br...
Agenda<br />■ 1. Introdução■ 2. Apresentação da Empresa■ 3. Trabalho desenvolvido■ 4. Conclusões<br />- 2 -<br />@2010, Ad...
1. Introdução<br /><ul><li> Trata-se da realização de um tutorial ao qual tem como objectivo proporcionar ao aluno a aquis...
 Por isso, esta empresa pretende saber mais sobre os seus clientes através do seu histórico de compras.  E usar esses dado...
 Os modelos desenvolvidos são as árvores de decisão, Clustering da Microsoft e NaiveBayes da Microsoft.</li></ul>- 3 -<br ...
2. Apresentação da Empresa<br />■ A Adventure Works Cycles é uma empresa fictícia criada pela Microsoft para simular cenár...
3. Trabalho desenvolvido<br />■ Criar um Projecto Business Inteligence  do tipo Analise Service.<br />■ Definir a conexão ...
3. Trabalho desenvolvido<br />■ Conluiada criação da Estrutura de Data Minig, com todas as técnicas, mencionadas, implemen...
3. Trabalho desenvolvido<br />■ A imagem que se segue ilustra a rede de depenicas criada com a associação da arvore de dec...
3. Trabalho desenvolvido<br />■ Modelo de Clusters, usado a técnica Clustering da Microsoft. A figura 3 demonstra praticam...
3. Trabalho desenvolvido<br />■ A imagem que se segue ilustra o modelo de dependências obtido com base na técnica NaiveBay...
3. Trabalho desenvolvido<br />■ No Lift Chart podemos visualizar os dados relativos a cada modelo implementado, a percenta...
Próximos SlideShares
Carregando em…5
×

Analysis Services

929 visualizações

Publicada em

Uma empresa pretende saber mais sobre os seus clientes através do seu histórico de compras. E usar esses dados para desenvolver previsões que possam ser usadas em marketing. A empresa nunca tinha usado Data Mining antes, por isso, pretendeu-se desenvolver uma nova base de dados especificamente para realizar Data Mining, permitindo desenvolver vários modelos.

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
929
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Analysis Services

  1. 1. www.ipvc.pt<br />AnalysisServices<br />■Realizado por: Joel Latino<br /> joellatino@ipvc.pt<br />■ Orientadores do IPVC: Prof. Jorge Ribeiro<br />Ano lectivo 2009/2010<br />
  2. 2. Agenda<br />■ 1. Introdução■ 2. Apresentação da Empresa■ 3. Trabalho desenvolvido■ 4. Conclusões<br />- 2 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  3. 3. 1. Introdução<br /><ul><li> Trata-se da realização de um tutorial ao qual tem como objectivo proporcionar ao aluno a aquisição de conhecimentos em criar e trabalhar com modelos de Data Mining através do Microsoft Analysis Services.
  4. 4. Por isso, esta empresa pretende saber mais sobre os seus clientes através do seu histórico de compras. E usar esses dados para desenvolver previsões que possam ser usadas em marketing. A empresa nunca tinha usado Data Mining antes, por isso, pretendeu-se desenvolver uma nova base de dados especificamente para realizar Data Mining, permitindo desenvolver vários modelos.
  5. 5. Os modelos desenvolvidos são as árvores de decisão, Clustering da Microsoft e NaiveBayes da Microsoft.</li></ul>- 3 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  6. 6. 2. Apresentação da Empresa<br />■ A Adventure Works Cycles é uma empresa fictícia criada pela Microsoft para simular cenários de negócio com o objectivo de fornecer tutoriais de desenvolvimento aos utilizadores do seu software.<br />■ Trata-se de uma empresa em que o seu negócio consiste na venda de bicicletas aos seus clientes. <br />- 4 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  7. 7. 3. Trabalho desenvolvido<br />■ Criar um Projecto Business Inteligence do tipo Analise Service.<br />■ Definir a conexão á base de dados (Data Source).<br />■ Definir os dados, do Datawarehouse, a utilizar para a técnicas de Data Mining (Data SouceView).<br />■ Criar uma estrutura de Data Mining, onde temos de definir os seguintes aspectos:<br />■ Técnica de Data Mining, neste caso foram as Arvores de Decisão, Clustering da Microsoft e NaiveBayes da Microsoft.<br />■ Tabelas a utilizar no processo de Data Mining.<br />■ Especificação do conjunto de teste.<br />■ Especificar o conjunto de dados de teste, com base na percentagem de dados a utilizar.<br />- 5 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  8. 8. 3. Trabalho desenvolvido<br />■ Conluiada criação da Estrutura de Data Minig, com todas as técnicas, mencionadas, implementadas, obtivemos os seguintes resultados, demonstrados nos slides seguintes.<br />Fig. 1: Arvore de Decisão<br />- 6 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  9. 9. 3. Trabalho desenvolvido<br />■ A imagem que se segue ilustra a rede de depenicas criada com a associação da arvore de decisão mencionada anteriormente.<br />Fig. 2: Rede de dependências com base na árvore de decisão.<br />- 7 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  10. 10. 3. Trabalho desenvolvido<br />■ Modelo de Clusters, usado a técnica Clustering da Microsoft. A figura 3 demonstra praticamente todas as ligações de proximidade enquanto que na figura 4 ilustra apenas as ligações mais fortes. A cor escura das linhas representa a força de aproximação entre cada Cluster.<br />Fig. 3: Diagrama de Cluster com as ligações<br />Fig. 4: Diagrama de Cluster com as ligações mais fortes<br />- 8 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  11. 11. 3. Trabalho desenvolvido<br />■ A imagem que se segue ilustra o modelo de dependências obtido com base na técnica NaiveBayes da Microsoft. Por isso a ordem das ligações mais fracas para as ligações mais fortes são: EnglishOccupation, Marital Status, Region, NumberChildrenAtHome, EnglishEducation, Total Children, CommuteDistance e NumberCarOwned.<br />Fig. 5: Rede de dependências<br />- 9 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  12. 12. 3. Trabalho desenvolvido<br />■ No Lift Chart podemos visualizar os dados relativos a cada modelo implementado, a percentagem de população classificada e a previsão feita.<br />Fig. 6: Lift Chart – representação gráfica da previsão dos modelos criados. <br />- 10 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  13. 13. 3. Trabalho desenvolvido<br />■ A matriz de classificação, mais propriamente a matriz de confusão, permite indicar o numero de classificações correctas versus as previsões efectuadas para os respectivos modelos implementados. <br />Fig. 7: Matriz de classificação dos modelos implementados.<br />- 11 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />
  14. 14. 4. Conclusão<br />No LiftChart o modelo ideal será aquele que se aproxima de uma linha recta, como podemos ver no segundo slide anterior, por isso será o modelo das Arvores de decisão. As árvores de decisão têm uma probabilidade de previsão de 72,84%, segue-se NaiveBayes com 71,45% e por fim o modelo Clustering com 59,65%. Analisando a matriz de classificação obtida pelo modelo de árvores de decisão podemos dizer o seguinte: - Que o número de verdadeiros positivos para obter o valor 0 é de 346, ou seja, previu correctamente 346 casos que as pessoas não compraram bicicleta.- Que o número de falsos positivos é de 161 para o valor 0, isto é, o número de casos em que o modelo previu mal que alguém compraria uma bicicleta.- Que o numero de falsos positivos é de 132 para o valor 1, ou seja, o modelo previu que 132 casos alguém compraria uma bicicleta, mas isso não aconteceu. - Por fim, que o numero de verdadeiros positivos para obter o valor 1 é de 361, isto é, que o modelo previu correctamente que 361 casos alguém compraria uma bicicleta.<br />- 12 -<br />@2010, Adventure Works Cycles- IPVC, Analysis Services - Joel Latino<br />

×