SlideShare uma empresa Scribd logo
1 de 42
Baixar para ler offline
®2012 dp6 - todos os direitos reservados®2012 dp6 - todos os direitos reservados
Text	
  Mining	
  
Técnicas,	
  Algoritmos	
  e	
  outras	
  nerdices	
  
Apresentação	
  
•  Leonardo	
  Naressi	
  
–  CIO	
  da	
  dp6	
  
–  Presidente	
  do	
  Comitê	
  de	
  Digital	
  
Analy9cs	
  da	
  IAB	
  Brasil	
  
–  Professor	
  na	
  ESPM	
  São	
  Paulo	
  
–  @LeoNaressi	
  
–  Linkedin.com/in/LeoNaressi	
  
–  facebook.com/LeoNaressi	
  
–  Leo@dp6.com.br	
  
®2012 dp6 - todos os direitos reservados
O que fazer com Text Mining?
Categorização /
Classificação
Matriz de
Conceitos
Linkagem de
conceitos
Extração de
entidades
Análise de
Sentimentos
Sumarização
Identificação
de autoria
®2012 dp6 - todos os direitos reservados
Coloquem seus óculos...
®2012 dp6 - todos os direitos reservados
OK! Ready!
®2012 dp6 - todos os direitos reservados
Algoritmos mais utilizados
k-Means Naive Bayes
Árvores de
decisão
Singular Value
Decomposition
(SVD)
Support Vector
Machines
(SVM)
TF-IDF
Semântica
latente
®2012 dp6 - todos os direitos reservados
Onde podemos fazer isso?
®2012 dp6 - todos os direitos reservados
R
"   A ferramenta estatística mais famosa do mundo
" http://www.r-project.org
®2012 dp6 - todos os direitos reservados
Weka
"  Ferramenta Open-Source de Modelagem e Mineração
" www.cs.waikato.ac.nz/ml/weka/
®2012 dp6 - todos os direitos reservados
Orange
"  Ferramenta Open-Source de Data Mining
" http://orange.biolab.si
®2012 dp6 - todos os direitos reservados
Google Prediction
"   A caixa preta de análise preditiva do Google
" https://developers.google.com/prediction/
®2012 dp6 - todos os direitos reservados
O que podemos fazer com Google Prediction?
®2012 dp6 - todos os direitos reservados
Cai como uma luva para nossas análises de
conteúdo nas redes sociais!
®2012 dp6 - todos os direitos reservados
Vamos ver como se faz?
®2012 dp6 - todos os direitos reservados
Coloquem seus óculos...
®2012 dp6 - todos os direitos reservados
OK! Ready!
®2012 dp6 - todos os direitos reservados
Uma nuvem de palavras “simples” em R
®2012 dp6 - todos os direitos reservados
Análise de Frequência e Associações em R
®2012 dp6 - todos os direitos reservados
Matriz de Conceitos em R
®2012 dp6 - todos os direitos reservados
Text Mining no SAS Enterprise Miner
®2012 dp6 - todos os direitos reservados
Classificação / Categorização automática com
Google Prediction
®2012 dp6 - todos os direitos reservados
O que queremos fazer?
Coleta de dados
de redes sociais
Amostragem
aleatória
Classificação
humana da
amostra
Criação de Modelo
Preditivo
Treinamento do
modelo com os
dados
classificados
Validação da
performance do
Modelo
Análise preditiva
baseada no
modelo
®2012 dp6 - todos os direitos reservados
Coleta de dados através de monitoramento de
redes sociais
®2012 dp6 - todos os direitos reservados
Amostragem aleatória usando Data Analysis
Toolpak do Excel
®2012 dp6 - todos os direitos reservados
Classificação Humana da amostra
®2012 dp6 - todos os direitos reservados
Criação do modelo preditivo
®2012 dp6 - todos os direitos reservados
Ixi...
®2012 dp6 - todos os direitos reservados
E agora quem poderá me ajudar?
®2012 dp6 - todos os direitos reservados
Não priemos cânico!
http://dp6.bi/google-prediction
®2012 dp6 - todos os direitos reservados
Treinamento do modelo preditivo usando Google
Prediction
®2012 dp6 - todos os direitos reservados
Ixi...
®2012 dp6 - todos os direitos reservados
Para facilitar existe uma integração entre Google
Prediction e Google Spreadsheets J
http://dp6.bi/prediction-planilha
®2012 dp6 - todos os direitos reservados
De novo: Treinamento do modelo preditivo usando
Google Prediction
®2012 dp6 - todos os direitos reservados
Vamos analisar o aprendizado da máquina...
{
"trainingComplete": "2013-09-23T14:48:05.007Z",
"kind": "prediction#training",
"id": "fastfood_tag1",
"created": "2013-09-23T14:13:18.321Z",
"modelInfo": {
"numberLabels": "18",
"numberInstances": "1260",
"classificationAccuracy": "0.62",
"modelType": "classification"
},
"trainingStatus": "DONE"
}
Meu Modelo
Precisão
alcançada
®2012 dp6 - todos os direitos reservados
E o que fazemos com isso agora?
®2012 dp6 - todos os direitos reservados
Realizamos a classificação preditiva automágica!
®2012 dp6 - todos os direitos reservados
Vamos escrever posts aleatórios e checar o que a
bola de cristal nos diz...
®2012 dp6 - todos os direitos reservados
®2012 dp6 - todos os direitos reservados
Confiram comigo no replay...
{
"outputLabel": "Saúde",
"outputMulti": [{ "score": "0.000179", "label": "Atendimento"},
{ "score": "0.006472", "label": "Atribuição Prod."},
{ "score": "0.000018", "label": "Atribuição prod."},
{ "score": "0.002146", "label": "BigMac"},
{ "score": "0.000010", "label": "Bob's"},
{ "score": "0.001280", "label": "Burguer King"},
{ "score": "0.003126", "label": "Campanha"},
{ "score": "0.343566", "label": "Comparativo"},
{ "score": "0.015228", "label": "Consumo"},
{ "score": "0.018360", "label": "Desejo"},
{ "score": "0.002519", "label": "Funcionário"},
{ "score": "0.012200", "label": "Institucional"},
{ "score": "0.000385", "label": "Lovebrand"},
{ "score": "0.000010", "label": "Mc Donalds"},
{ "score": "0.000009", "label": "Outros Lanches"},
{ "score": "0.002906", "label": "PDV"},
{ "score": "0.591548", "label": "Saúde"},
{ "score": "0.000039", "label": "Whooper"
}],
"kind": "prediction#output",
"id": "fastfood_tag1"
}
Maior
probabilidade
estatística
®2012 dp6 - todos os direitos reservados
Leiam!
"   Mineração de Dados da Web
Social
" http://dp6.bi/mining-social
®2012 dp6 - todos os direitos reservados
Não tenham medo!
Obrigado!	
  
•  Leonardo	
  Naressi	
  
–  CIO	
  da	
  dp6	
  
–  Presidente	
  do	
  Comitê	
  de	
  Digital	
  
Analy9cs	
  da	
  IAB	
  Brasil	
  
–  Professor	
  na	
  ESPM	
  São	
  Paulo	
  
–  @LeoNaressi	
  
–  Linkedin.com/in/LeoNaressi	
  
–  facebook.com/LeoNaressi	
  
–  Leo@dp6.com.br	
  

Mais conteúdo relacionado

Destaque

Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Patricia Neubert
 
Trabalho final neurais_v1
Trabalho final neurais_v1Trabalho final neurais_v1
Trabalho final neurais_v1Diego Damasceno
 
Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...
Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...
Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...Rozelma França
 
Projeto de P&D: desvendando uma central solar fotovoltaica de 3 MWp
Projeto de P&D: desvendando uma central solar fotovoltaica de 3 MWpProjeto de P&D: desvendando uma central solar fotovoltaica de 3 MWp
Projeto de P&D: desvendando uma central solar fotovoltaica de 3 MWpsenaimais
 
ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE DADOS GEO...
ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE  DADOS GEO...ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE  DADOS GEO...
ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE DADOS GEO...Thiago Reis da Silva
 
Classificação de dados
Classificação de dadosClassificação de dados
Classificação de dadosFernando Vargas
 
Abe Curso
Abe CursoAbe Curso
Abe Cursoufrj
 
Cap10 - Parte 2 - Anova Um Caminho De Classificação
Cap10 - Parte 2 - Anova Um Caminho De ClassificaçãoCap10 - Parte 2 - Anova Um Caminho De Classificação
Cap10 - Parte 2 - Anova Um Caminho De ClassificaçãoRegis Andrade
 
Trabalhando com palavras-chave e tráfego orgânico no Google Analytics
Trabalhando com palavras-chave e tráfego orgânico no Google Analytics Trabalhando com palavras-chave e tráfego orgânico no Google Analytics
Trabalhando com palavras-chave e tráfego orgânico no Google Analytics Leonardo Naressi
 
Social Advertising Best Practices
Social Advertising Best PracticesSocial Advertising Best Practices
Social Advertising Best PracticesLeonardo Naressi
 
comScore brazil services overview geral abr12
comScore brazil services overview geral   abr12comScore brazil services overview geral   abr12
comScore brazil services overview geral abr12Leonardo Naressi
 
Apresentacao Hitwise Brasil
Apresentacao Hitwise BrasilApresentacao Hitwise Brasil
Apresentacao Hitwise BrasilLeonardo Naressi
 
Metricas de Marketing - Capitulo 1 - Introdução - Paul Ferris
Metricas de Marketing - Capitulo 1 - Introdução - Paul FerrisMetricas de Marketing - Capitulo 1 - Introdução - Paul Ferris
Metricas de Marketing - Capitulo 1 - Introdução - Paul FerrisLeonardo Naressi
 
Métricas, Redes Sociais e Buzz Intelligence
Métricas, Redes Sociais e Buzz IntelligenceMétricas, Redes Sociais e Buzz Intelligence
Métricas, Redes Sociais e Buzz IntelligenceLeonardo Naressi
 
Modelagem e análise de dados em ppc - Search Masters Brasil 2013
Modelagem e análise de dados em ppc - Search Masters Brasil 2013Modelagem e análise de dados em ppc - Search Masters Brasil 2013
Modelagem e análise de dados em ppc - Search Masters Brasil 2013Leonardo Naressi
 
Google Doubleclick Ad Exchange Overview
Google Doubleclick Ad Exchange OverviewGoogle Doubleclick Ad Exchange Overview
Google Doubleclick Ad Exchange OverviewLeonardo Naressi
 

Destaque (20)

Data
DataData
Data
 
Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011
 
Trabalho final neurais_v1
Trabalho final neurais_v1Trabalho final neurais_v1
Trabalho final neurais_v1
 
Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...
Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...
Aplicação de Técnicas de Mineração de Dados para o Mapeamento do Conhecimento...
 
Projeto de P&D: desvendando uma central solar fotovoltaica de 3 MWp
Projeto de P&D: desvendando uma central solar fotovoltaica de 3 MWpProjeto de P&D: desvendando uma central solar fotovoltaica de 3 MWp
Projeto de P&D: desvendando uma central solar fotovoltaica de 3 MWp
 
ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE DADOS GEO...
ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE  DADOS GEO...ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE  DADOS GEO...
ANÁLISE ESPACIAL-TEMPORAL DE DADOS USANDO TÉCNICAS DE MINERAÇÃO DE DADOS GEO...
 
Classificação de dados
Classificação de dadosClassificação de dados
Classificação de dados
 
Abe Curso
Abe CursoAbe Curso
Abe Curso
 
Cap10 - Parte 2 - Anova Um Caminho De Classificação
Cap10 - Parte 2 - Anova Um Caminho De ClassificaçãoCap10 - Parte 2 - Anova Um Caminho De Classificação
Cap10 - Parte 2 - Anova Um Caminho De Classificação
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Trabalhando com palavras-chave e tráfego orgânico no Google Analytics
Trabalhando com palavras-chave e tráfego orgânico no Google Analytics Trabalhando com palavras-chave e tráfego orgânico no Google Analytics
Trabalhando com palavras-chave e tráfego orgânico no Google Analytics
 
Social Advertising Best Practices
Social Advertising Best PracticesSocial Advertising Best Practices
Social Advertising Best Practices
 
comScore brazil services overview geral abr12
comScore brazil services overview geral   abr12comScore brazil services overview geral   abr12
comScore brazil services overview geral abr12
 
Apresentacao Hitwise Brasil
Apresentacao Hitwise BrasilApresentacao Hitwise Brasil
Apresentacao Hitwise Brasil
 
Metricas de Marketing - Capitulo 1 - Introdução - Paul Ferris
Metricas de Marketing - Capitulo 1 - Introdução - Paul FerrisMetricas de Marketing - Capitulo 1 - Introdução - Paul Ferris
Metricas de Marketing - Capitulo 1 - Introdução - Paul Ferris
 
Métricas, Redes Sociais e Buzz Intelligence
Métricas, Redes Sociais e Buzz IntelligenceMétricas, Redes Sociais e Buzz Intelligence
Métricas, Redes Sociais e Buzz Intelligence
 
Machine Learning - Introdução e Aplicações
Machine Learning - Introdução e AplicaçõesMachine Learning - Introdução e Aplicações
Machine Learning - Introdução e Aplicações
 
Modelagem e análise de dados em ppc - Search Masters Brasil 2013
Modelagem e análise de dados em ppc - Search Masters Brasil 2013Modelagem e análise de dados em ppc - Search Masters Brasil 2013
Modelagem e análise de dados em ppc - Search Masters Brasil 2013
 
Google Doubleclick Ad Exchange Overview
Google Doubleclick Ad Exchange OverviewGoogle Doubleclick Ad Exchange Overview
Google Doubleclick Ad Exchange Overview
 
Classificação dos aços
Classificação dos açosClassificação dos aços
Classificação dos aços
 

Semelhante a Text Mining - Social Media Week

Como fazer-os-recrutadores-implorarem-para-te-contratar
Como fazer-os-recrutadores-implorarem-para-te-contratarComo fazer-os-recrutadores-implorarem-para-te-contratar
Como fazer-os-recrutadores-implorarem-para-te-contratarKleber Carvalho
 
I nd t_ecosystem_wp7_silverlight_básico
I nd t_ecosystem_wp7_silverlight_básicoI nd t_ecosystem_wp7_silverlight_básico
I nd t_ecosystem_wp7_silverlight_básicoSergio Cavalcante
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...Diego Nogare
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCRodrigo Dornel
 
Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewRodrigo Dornel
 
ABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasDiego Nogare
 
Integrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaIntegrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaDiego Nogare
 
Como funciona um banco de dados? (Prudente TechDay 2010)
Como funciona um banco de dados? (Prudente TechDay 2010)Como funciona um banco de dados? (Prudente TechDay 2010)
Como funciona um banco de dados? (Prudente TechDay 2010)Fabrício Catae
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceLuca Bastos
 
Aula PPC Intensivo Digitalks
Aula PPC Intensivo DigitalksAula PPC Intensivo Digitalks
Aula PPC Intensivo DigitalksGerson Ribeiro
 
Organizando a casa. o front end do jeitinho que a mamãe gosta
Organizando a casa. o front end do jeitinho que a mamãe gostaOrganizando a casa. o front end do jeitinho que a mamãe gosta
Organizando a casa. o front end do jeitinho que a mamãe gostaJohnathan Cardoso
 
AMD, BDD, e o Javali
AMD, BDD, e o JavaliAMD, BDD, e o Javali
AMD, BDD, e o JavaliRafael Lyra
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...Diego Nogare
 
Criando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningCriando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningDiego Nogare
 
Design for change: Fatores que influenciam na longevidade de um Software PHP
Design for change: Fatores que influenciam na longevidade de um Software PHPDesign for change: Fatores que influenciam na longevidade de um Software PHP
Design for change: Fatores que influenciam na longevidade de um Software PHPPablo Dall'Oglio
 
ORM - TDC Porto Alegre 2014 Trilha .NET
ORM - TDC Porto Alegre 2014 Trilha .NETORM - TDC Porto Alegre 2014 Trilha .NET
ORM - TDC Porto Alegre 2014 Trilha .NETJorge Maia
 

Semelhante a Text Mining - Social Media Week (20)

Como fazer-os-recrutadores-implorarem-para-te-contratar
Como fazer-os-recrutadores-implorarem-para-te-contratarComo fazer-os-recrutadores-implorarem-para-te-contratar
Como fazer-os-recrutadores-implorarem-para-te-contratar
 
I nd t_ecosystem_wp7_silverlight_básico
I nd t_ecosystem_wp7_silverlight_básicoI nd t_ecosystem_wp7_silverlight_básico
I nd t_ecosystem_wp7_silverlight_básico
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSC
 
Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – Overview
 
ABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasABC da Aprendizagem de Máquinas
ABC da Aprendizagem de Máquinas
 
Integrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaIntegrando Azure Machine Learning na prática
Integrando Azure Machine Learning na prática
 
Como funciona um banco de dados? (Prudente TechDay 2010)
Como funciona um banco de dados? (Prudente TechDay 2010)Como funciona um banco de dados? (Prudente TechDay 2010)
Como funciona um banco de dados? (Prudente TechDay 2010)
 
Diversas Ferramentas de dados
Diversas Ferramentas de dadosDiversas Ferramentas de dados
Diversas Ferramentas de dados
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Oficina Pentaho
Oficina PentahoOficina Pentaho
Oficina Pentaho
 
CVitae- Sergio Della Nina
CVitae- Sergio Della Nina CVitae- Sergio Della Nina
CVitae- Sergio Della Nina
 
Aula PPC Intensivo Digitalks
Aula PPC Intensivo DigitalksAula PPC Intensivo Digitalks
Aula PPC Intensivo Digitalks
 
Organizando a casa. o front end do jeitinho que a mamãe gosta
Organizando a casa. o front end do jeitinho que a mamãe gostaOrganizando a casa. o front end do jeitinho que a mamãe gosta
Organizando a casa. o front end do jeitinho que a mamãe gosta
 
Ementa curso de dados
Ementa curso de dadosEmenta curso de dados
Ementa curso de dados
 
AMD, BDD, e o Javali
AMD, BDD, e o JavaliAMD, BDD, e o Javali
AMD, BDD, e o Javali
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
 
Criando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine LearningCriando modelos preditivos com Azure Machine Learning
Criando modelos preditivos com Azure Machine Learning
 
Design for change: Fatores que influenciam na longevidade de um Software PHP
Design for change: Fatores que influenciam na longevidade de um Software PHPDesign for change: Fatores que influenciam na longevidade de um Software PHP
Design for change: Fatores que influenciam na longevidade de um Software PHP
 
ORM - TDC Porto Alegre 2014 Trilha .NET
ORM - TDC Porto Alegre 2014 Trilha .NETORM - TDC Porto Alegre 2014 Trilha .NET
ORM - TDC Porto Alegre 2014 Trilha .NET
 

Mais de Leonardo Naressi

Data science no marketing - Estatistica e Computacao para entender o Consumidor
Data science no marketing  - Estatistica e Computacao para entender o ConsumidorData science no marketing  - Estatistica e Computacao para entender o Consumidor
Data science no marketing - Estatistica e Computacao para entender o ConsumidorLeonardo Naressi
 
Atribuição de resutados em Social Media
Atribuição de resutados em Social MediaAtribuição de resutados em Social Media
Atribuição de resutados em Social MediaLeonardo Naressi
 
Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)
Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)
Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)Leonardo Naressi
 
Atribuiçao de Resultados em Marketing
Atribuiçao de Resultados em MarketingAtribuiçao de Resultados em Marketing
Atribuiçao de Resultados em MarketingLeonardo Naressi
 
Atribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPM
Atribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPMAtribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPM
Atribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPMLeonardo Naressi
 
Metricas de Marketing - Capitulo 1 - Paul Farris
Metricas de Marketing  - Capitulo 1 - Paul FarrisMetricas de Marketing  - Capitulo 1 - Paul Farris
Metricas de Marketing - Capitulo 1 - Paul FarrisLeonardo Naressi
 
Data-Driven Marketing - Intercon 2012 Métricas
Data-Driven Marketing - Intercon 2012 MétricasData-Driven Marketing - Intercon 2012 Métricas
Data-Driven Marketing - Intercon 2012 MétricasLeonardo Naressi
 
Future in focus brazil mar2012 final
Future in focus brazil mar2012 finalFuture in focus brazil mar2012 final
Future in focus brazil mar2012 finalLeonardo Naressi
 
Apresentacao Comite de Metricas IAB - Maio/2012
Apresentacao Comite de Metricas IAB - Maio/2012Apresentacao Comite de Metricas IAB - Maio/2012
Apresentacao Comite de Metricas IAB - Maio/2012Leonardo Naressi
 
Web Analytics no TcheSEO 2011
Web Analytics no TcheSEO 2011Web Analytics no TcheSEO 2011
Web Analytics no TcheSEO 2011Leonardo Naressi
 
Search Intelligence - Social Media e Search Marketing - Proxxima 2011
Search Intelligence - Social Media e Search Marketing - Proxxima 2011Search Intelligence - Social Media e Search Marketing - Proxxima 2011
Search Intelligence - Social Media e Search Marketing - Proxxima 2011Leonardo Naressi
 
O show de Paul McCartney no Brasil nas redes sociais
O show de Paul McCartney no Brasil nas redes sociaisO show de Paul McCartney no Brasil nas redes sociais
O show de Paul McCartney no Brasil nas redes sociaisLeonardo Naressi
 
Cultura de Métricas para SEO (UaiSEO)
Cultura de Métricas para SEO (UaiSEO)Cultura de Métricas para SEO (UaiSEO)
Cultura de Métricas para SEO (UaiSEO)Leonardo Naressi
 
Search Labs 2010 - Metricas Avancadas para SEO
Search Labs 2010 - Metricas Avancadas para SEOSearch Labs 2010 - Metricas Avancadas para SEO
Search Labs 2010 - Metricas Avancadas para SEOLeonardo Naressi
 
Métricas e Otimização - Intercon 2009
Métricas e Otimização - Intercon 2009Métricas e Otimização - Intercon 2009
Métricas e Otimização - Intercon 2009Leonardo Naressi
 
Google Website Optimizer in Obama Landing Pages
Google Website Optimizer in Obama Landing PagesGoogle Website Optimizer in Obama Landing Pages
Google Website Optimizer in Obama Landing PagesLeonardo Naressi
 
conect-mídia (Ibope Mídia)
conect-mídia (Ibope Mídia)conect-mídia (Ibope Mídia)
conect-mídia (Ibope Mídia)Leonardo Naressi
 
Guia Google de Otimização para buscadores (SEO)
Guia Google de Otimização para buscadores (SEO)Guia Google de Otimização para buscadores (SEO)
Guia Google de Otimização para buscadores (SEO)Leonardo Naressi
 
e-Book Web Analytics Uma Visão Brasileira - 2a. edição
e-Book Web Analytics Uma Visão Brasileira - 2a. ediçãoe-Book Web Analytics Uma Visão Brasileira - 2a. edição
e-Book Web Analytics Uma Visão Brasileira - 2a. ediçãoLeonardo Naressi
 

Mais de Leonardo Naressi (20)

Data science no marketing - Estatistica e Computacao para entender o Consumidor
Data science no marketing  - Estatistica e Computacao para entender o ConsumidorData science no marketing  - Estatistica e Computacao para entender o Consumidor
Data science no marketing - Estatistica e Computacao para entender o Consumidor
 
Atribuição de resutados em Social Media
Atribuição de resutados em Social MediaAtribuição de resutados em Social Media
Atribuição de resutados em Social Media
 
Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)
Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)
Atribuição de marketing - Leo Naressi (Proxxima 2014 Garage ESPM)
 
Atribuiçao de Resultados em Marketing
Atribuiçao de Resultados em MarketingAtribuiçao de Resultados em Marketing
Atribuiçao de Resultados em Marketing
 
Atribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPM
Atribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPMAtribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPM
Atribuição de Marketing - Leo Naressi - Proxxima Garage 2014 ESPM
 
Metricas de Marketing - Capitulo 1 - Paul Farris
Metricas de Marketing  - Capitulo 1 - Paul FarrisMetricas de Marketing  - Capitulo 1 - Paul Farris
Metricas de Marketing - Capitulo 1 - Paul Farris
 
Data-Driven Marketing - Intercon 2012 Métricas
Data-Driven Marketing - Intercon 2012 MétricasData-Driven Marketing - Intercon 2012 Métricas
Data-Driven Marketing - Intercon 2012 Métricas
 
Future in focus brazil mar2012 final
Future in focus brazil mar2012 finalFuture in focus brazil mar2012 final
Future in focus brazil mar2012 final
 
Apresentacao Comite de Metricas IAB - Maio/2012
Apresentacao Comite de Metricas IAB - Maio/2012Apresentacao Comite de Metricas IAB - Maio/2012
Apresentacao Comite de Metricas IAB - Maio/2012
 
Web Analytics no TcheSEO 2011
Web Analytics no TcheSEO 2011Web Analytics no TcheSEO 2011
Web Analytics no TcheSEO 2011
 
Search Intelligence - Social Media e Search Marketing - Proxxima 2011
Search Intelligence - Social Media e Search Marketing - Proxxima 2011Search Intelligence - Social Media e Search Marketing - Proxxima 2011
Search Intelligence - Social Media e Search Marketing - Proxxima 2011
 
O show de Paul McCartney no Brasil nas redes sociais
O show de Paul McCartney no Brasil nas redes sociaisO show de Paul McCartney no Brasil nas redes sociais
O show de Paul McCartney no Brasil nas redes sociais
 
Cultura de Métricas para SEO (UaiSEO)
Cultura de Métricas para SEO (UaiSEO)Cultura de Métricas para SEO (UaiSEO)
Cultura de Métricas para SEO (UaiSEO)
 
Search Labs 2010 - Metricas Avancadas para SEO
Search Labs 2010 - Metricas Avancadas para SEOSearch Labs 2010 - Metricas Avancadas para SEO
Search Labs 2010 - Metricas Avancadas para SEO
 
Métricas e Otimização - Intercon 2009
Métricas e Otimização - Intercon 2009Métricas e Otimização - Intercon 2009
Métricas e Otimização - Intercon 2009
 
Google Website Optimizer in Obama Landing Pages
Google Website Optimizer in Obama Landing PagesGoogle Website Optimizer in Obama Landing Pages
Google Website Optimizer in Obama Landing Pages
 
conect-mídia (Ibope Mídia)
conect-mídia (Ibope Mídia)conect-mídia (Ibope Mídia)
conect-mídia (Ibope Mídia)
 
Guia Google de Otimização para buscadores (SEO)
Guia Google de Otimização para buscadores (SEO)Guia Google de Otimização para buscadores (SEO)
Guia Google de Otimização para buscadores (SEO)
 
e-Book Web Analytics Uma Visão Brasileira - 2a. edição
e-Book Web Analytics Uma Visão Brasileira - 2a. ediçãoe-Book Web Analytics Uma Visão Brasileira - 2a. edição
e-Book Web Analytics Uma Visão Brasileira - 2a. edição
 
Indicadores CGI BR 2008
Indicadores CGI BR 2008Indicadores CGI BR 2008
Indicadores CGI BR 2008
 

Text Mining - Social Media Week

  • 1. ®2012 dp6 - todos os direitos reservados®2012 dp6 - todos os direitos reservados Text  Mining   Técnicas,  Algoritmos  e  outras  nerdices  
  • 2. Apresentação   •  Leonardo  Naressi   –  CIO  da  dp6   –  Presidente  do  Comitê  de  Digital   Analy9cs  da  IAB  Brasil   –  Professor  na  ESPM  São  Paulo   –  @LeoNaressi   –  Linkedin.com/in/LeoNaressi   –  facebook.com/LeoNaressi   –  Leo@dp6.com.br  
  • 3. ®2012 dp6 - todos os direitos reservados O que fazer com Text Mining? Categorização / Classificação Matriz de Conceitos Linkagem de conceitos Extração de entidades Análise de Sentimentos Sumarização Identificação de autoria
  • 4. ®2012 dp6 - todos os direitos reservados Coloquem seus óculos...
  • 5. ®2012 dp6 - todos os direitos reservados OK! Ready!
  • 6. ®2012 dp6 - todos os direitos reservados Algoritmos mais utilizados k-Means Naive Bayes Árvores de decisão Singular Value Decomposition (SVD) Support Vector Machines (SVM) TF-IDF Semântica latente
  • 7. ®2012 dp6 - todos os direitos reservados Onde podemos fazer isso?
  • 8. ®2012 dp6 - todos os direitos reservados R "   A ferramenta estatística mais famosa do mundo " http://www.r-project.org
  • 9. ®2012 dp6 - todos os direitos reservados Weka "  Ferramenta Open-Source de Modelagem e Mineração " www.cs.waikato.ac.nz/ml/weka/
  • 10. ®2012 dp6 - todos os direitos reservados Orange "  Ferramenta Open-Source de Data Mining " http://orange.biolab.si
  • 11. ®2012 dp6 - todos os direitos reservados Google Prediction "   A caixa preta de análise preditiva do Google " https://developers.google.com/prediction/
  • 12. ®2012 dp6 - todos os direitos reservados O que podemos fazer com Google Prediction?
  • 13. ®2012 dp6 - todos os direitos reservados Cai como uma luva para nossas análises de conteúdo nas redes sociais!
  • 14. ®2012 dp6 - todos os direitos reservados Vamos ver como se faz?
  • 15. ®2012 dp6 - todos os direitos reservados Coloquem seus óculos...
  • 16. ®2012 dp6 - todos os direitos reservados OK! Ready!
  • 17. ®2012 dp6 - todos os direitos reservados Uma nuvem de palavras “simples” em R
  • 18. ®2012 dp6 - todos os direitos reservados Análise de Frequência e Associações em R
  • 19. ®2012 dp6 - todos os direitos reservados Matriz de Conceitos em R
  • 20. ®2012 dp6 - todos os direitos reservados Text Mining no SAS Enterprise Miner
  • 21. ®2012 dp6 - todos os direitos reservados Classificação / Categorização automática com Google Prediction
  • 22. ®2012 dp6 - todos os direitos reservados O que queremos fazer? Coleta de dados de redes sociais Amostragem aleatória Classificação humana da amostra Criação de Modelo Preditivo Treinamento do modelo com os dados classificados Validação da performance do Modelo Análise preditiva baseada no modelo
  • 23. ®2012 dp6 - todos os direitos reservados Coleta de dados através de monitoramento de redes sociais
  • 24. ®2012 dp6 - todos os direitos reservados Amostragem aleatória usando Data Analysis Toolpak do Excel
  • 25. ®2012 dp6 - todos os direitos reservados Classificação Humana da amostra
  • 26. ®2012 dp6 - todos os direitos reservados Criação do modelo preditivo
  • 27. ®2012 dp6 - todos os direitos reservados Ixi...
  • 28. ®2012 dp6 - todos os direitos reservados E agora quem poderá me ajudar?
  • 29. ®2012 dp6 - todos os direitos reservados Não priemos cânico! http://dp6.bi/google-prediction
  • 30. ®2012 dp6 - todos os direitos reservados Treinamento do modelo preditivo usando Google Prediction
  • 31. ®2012 dp6 - todos os direitos reservados Ixi...
  • 32. ®2012 dp6 - todos os direitos reservados Para facilitar existe uma integração entre Google Prediction e Google Spreadsheets J http://dp6.bi/prediction-planilha
  • 33. ®2012 dp6 - todos os direitos reservados De novo: Treinamento do modelo preditivo usando Google Prediction
  • 34. ®2012 dp6 - todos os direitos reservados Vamos analisar o aprendizado da máquina... { "trainingComplete": "2013-09-23T14:48:05.007Z", "kind": "prediction#training", "id": "fastfood_tag1", "created": "2013-09-23T14:13:18.321Z", "modelInfo": { "numberLabels": "18", "numberInstances": "1260", "classificationAccuracy": "0.62", "modelType": "classification" }, "trainingStatus": "DONE" } Meu Modelo Precisão alcançada
  • 35. ®2012 dp6 - todos os direitos reservados E o que fazemos com isso agora?
  • 36. ®2012 dp6 - todos os direitos reservados Realizamos a classificação preditiva automágica!
  • 37. ®2012 dp6 - todos os direitos reservados Vamos escrever posts aleatórios e checar o que a bola de cristal nos diz...
  • 38. ®2012 dp6 - todos os direitos reservados
  • 39. ®2012 dp6 - todos os direitos reservados Confiram comigo no replay... { "outputLabel": "Saúde", "outputMulti": [{ "score": "0.000179", "label": "Atendimento"}, { "score": "0.006472", "label": "Atribuição Prod."}, { "score": "0.000018", "label": "Atribuição prod."}, { "score": "0.002146", "label": "BigMac"}, { "score": "0.000010", "label": "Bob's"}, { "score": "0.001280", "label": "Burguer King"}, { "score": "0.003126", "label": "Campanha"}, { "score": "0.343566", "label": "Comparativo"}, { "score": "0.015228", "label": "Consumo"}, { "score": "0.018360", "label": "Desejo"}, { "score": "0.002519", "label": "Funcionário"}, { "score": "0.012200", "label": "Institucional"}, { "score": "0.000385", "label": "Lovebrand"}, { "score": "0.000010", "label": "Mc Donalds"}, { "score": "0.000009", "label": "Outros Lanches"}, { "score": "0.002906", "label": "PDV"}, { "score": "0.591548", "label": "Saúde"}, { "score": "0.000039", "label": "Whooper" }], "kind": "prediction#output", "id": "fastfood_tag1" } Maior probabilidade estatística
  • 40. ®2012 dp6 - todos os direitos reservados Leiam! "   Mineração de Dados da Web Social " http://dp6.bi/mining-social
  • 41. ®2012 dp6 - todos os direitos reservados Não tenham medo!
  • 42. Obrigado!   •  Leonardo  Naressi   –  CIO  da  dp6   –  Presidente  do  Comitê  de  Digital   Analy9cs  da  IAB  Brasil   –  Professor  na  ESPM  São  Paulo   –  @LeoNaressi   –  Linkedin.com/in/LeoNaressi   –  facebook.com/LeoNaressi   –  Leo@dp6.com.br