SlideShare uma empresa Scribd logo
1 de 44
LCoN:
Atuação em Big Data
       Leandro Nunes de Castro
        Lnunes@mackenzie.br
            @lndecastro

      Faculdade de Computação e Informática &
  Programa de Pós-Graduação em Engenharia Elétrica
      Laboratório de Computação Natural (LCoN)
            www.mackenzie.br/lcon.html
Sumário
•   Motivação: Dados e Redes Sociais
•   Mineração de Dados
•   Computação Natural
•   Estudos de Caso:
    – Reclame Aqui
    – Análise de Sentimento no Twitter
    – Sistemas de Recomendação
• O LCoN
• Discussão
                                         2
Motivação

Um Universo de Dados
         e
   Redes Sociais
Sobre Dados e Informação
Mineração de Dados

   Conceitos Básicos




                       Image: jannoon028 / FreeDigitalPhotos.net
Pode-se definir a descoberta de
 conhecimento em bancos de dados
 (KDD) como sendo o processo não
 trivial de identificação de padrões
 válidos, novos, potencialmente úteis
 e compreensíveis em grandes bancos
 de dados

                           Image: jannoon028 / FreeDigitalPhotos.net
Processo de KDD




                     Pré-                                                   Validação
Base de Dados                                Análise
                Processamento                                            (Conhecimento)




                                Image: jscreationzs/ digitalart / Vlado / jscreationzs / FreeDigitalPhotos.net
Estatística



    Visualização                                 Matemática




                          Mineração
                          de Dados
Sistemas de
                                                       Engenharia
Informação




              Bancos de                 Inteligência
                Dados                     Artificial
Análises Descritivas



Análises Preditivas
Agrupamento
 Detecção de Anomalias




                                                                           Descrição de
                                                                           Classes e Conceitos




Predição:
Classificação e                                                                             Associação
Estimação         Images: jscreationzs / renjith krishnan / digitalart / sheelamohan / renjith krishnan / FreeDigitalPhotos.net
Computação Natural

   Conceitos Básicos




                       Image: Stuart Miles / FreeDigitalPhotos.net
Imagine um mundo onde os computadores podem
  criar novos universos, e dentro destes universos
  existam formas naturais que reproduzem, crescem
  e pensam. Imagine formas
  vegetais, montanhas, colônias de
  formigas, sistemas imunológicos, e cérebros, todos
  aprendendo e evoluindo, e se tornando mais
  adaptados ao ambiente. Imagine se nossos
  computadores passassem a conter novas formas
  de vida. Pense no que isso afetaria nossas vidas.
  Talvez pudéssemos criar automaticamente projetos
  de casas e música, novas formas de proteger
  computadores contra invasores, novas formas de
  resolver problemas complexos, novos
  organismos, e novas formas de computar.
Agora pare de imaginar.
Seja bem vindo à Computação Natural
                                    Image: Stuart Miles / FreeDigitalPhotos.net
Principais Áreas
• Computação Bioinspirada
  –   Redes Neurais Artificiais
  –   Algoritmos Evolutivos
  –   Inteligência de Enxame
  –   Sistemas Imunológicos Artificiais
• Síntese Computacional da Natureza
  – Geometria Fractal
  – Vida Artificial
• Computação com Novas Matérias Primas
  – Computação de DNA
  – Computação Quântica
Aproximador Universal de Funções

               First layer                         Second layer                          Third layer


    x      1                             y1    2                               y2    3                       y3
        W                                     W                                     W
                           1                                  2
                       u                                    u                                    u3
                                f   1
                                                                      f   2
                                                                                                       f3
    1                                    1                                     1
         b1                                   b2                                    b3

          y 1 = f1 (W1x + b 1)                 y 2 = f2 (W2y1 + b 2)                 y 3 = f3 (W3y2 + b3)


                                 o m               
 F ( x1 , x2 ,..., xm )   α i f   wij x j wi 0 
                                                   
                          i 1     j 1            
Ant-Based Clustering




                          2                              2
       k                               f 
 pp   1 
      k  f                      pd  
                                        k  f 
                                               
       1                               2    

           1                           d (x i , x j ) 
           
f (x i )   s 2           (r ) 1  α  if f  0
                   x j Neigh ( s s )                 
           0
                                                         otherwise
Immunocomputing
               Foreign stimulus


                      Idiotope                                          5
                                                      1
                            Paratope
                                                                3

                                                                            6

                                                 2
                                                                4




                                            
 mij   G D  ei (n  k ), p j (n)   ε  1
                                              
       k    n                               

dci       N1                 N1             N2
                                                           
     k1  m ji ci c j  k 2  mij ci c j   m ji ci y j   k 3 ci
dt        j 1               j 1           j 1          
Bioinspirações
Nomenclatura e Tipos de Dados
                                                        Possui Financiamen Credito
Salário       Estado Cartão de                  Nro de
        Idade                  Imóveis Veículos        Cheque       to
  R$           Civil Crédito                    Filhos
                                                       Especial Pretendido Autorizado
  350    21    Sol.      0       0       0       0      Sim      10.000        Não

  3700   52    Cas.      1       1       2       2      Sim       7.000        Sim

  1200   26    Cas.      1       0       1       1      Não      10.000        Não

  700    25    Sol.      0       0       0       0      Não       5.000        Sim

  8500   50    Cas.      2       1       2       2      Sim      40.000        Sim

  1800   27    Sol.      1       0       1       0      Sim      20.000        Não

  350    20    Sol.      0       0       0       0      Não      10.000        Não


Objetos x Atributos
Tipos de Dados: Nominais, Ordinais, Numéricos
Estudo de Caso 01
Descrição de Classes e Conceitos
      Dados do Reclame Aqui
Panorama Geral do Setor
            Status das Reclamações
                                     Nao Respondido


      20%    7%                      Respondido
                      30%
                                     Replicas
24%
                                     Finalizada - Resolvido
             19%

                                     Finalizada - Nao           Média das Notas
                                     Resolvido
                                                                             5.3
                                                        3.9
                                                                                       2.6

                                                                 0.5



                                                  Média Geral            Média ">0"

                                                Finalizada - Resolvido   Finalizada - Nao Resolvido
Panorama Geral do Setor
              Construção Civil - Piores Atendimentos
                                                                    17%

                                                              13%

                                                        10%

                                                   6%
                                    5% 5% 5% 5% 5%
                              4% 4%
                        3%
2% 2% 2% 2% 2% 2% 2% 3%
Panorama Geral do Setor
                                 Construção Civil
17%

      13%

            9%
                 6% 6%
                       6% 6%
                               4% 4% 4% 4%
                                           3% 3% 2% 2% 2%
                                                          2% 2% 2% 2%
Estudo de Caso 02
Análise de Sentimento em Tweets
      Dados da Rede Globo
Base de Análise
• Para realizar as análises a serem apresentadas
  foram utilizados 206.259 tweets de 127.945
  usuários entre os dias 1 e 31 de dezembro de
  2010.
• Os atributos disponíveis para essa análise
  foram:
  Cliente, Avaliação, Termo, Usuário, Texto e
  Data.
Domingão do Faustão
               Palavras mais comentadas - Domingão do Faustão

11%

      8% 8%
              7% 7% 6% 6%
                          6% 6%
                                5%
                                          4% 4%
                                                4% 4%
 3%                                                         3% 3%
       2% 2% 2% 2%                                  2% 2% 2% 2%
                   2% 2% 1% 1% 1%
                                  1% 1% 1% 1% 1% 1%
                                                     1% 1% 0% 0%




                           Total Top 20    Total Twitters
Comentários Positivos
                     Palavras mais comentadas - Tweets positivos
13%
      11%
            10%

                  7% 7%
                          6% 6%
                                  5% 5%
 3% 3%                              4% 3% 3%
       3%                                    3% 3% 3% 3% 3%
                   2% 2% 2% 2%                               2% 2% 2%
                               1% 1% 1% 1% 1% 1% 1% 1% 1% 1%
                                                              1% 1% 0%




                                  Total Top 20   Total Twitters
Comentários Negativos
                    Palavras mais comentados - Tweets negativos
27%



      16%


            8%
 6%              5% 5%
       3%            4% 4% 3% 3% 3% 3%
             2% 1% 1% 1% 1% 1% 1% 1% 1% 2% 2% 2% 2% 2% 2% 2% 2% 2%
                                         0% 0% 0% 0% 0% 0% 0% 0% 0%




                               Total Top 20   Total Twitters
Influenciadores
                           Qtde de   Percentual de    Qtde de     Qtde de
Id       Usuários
                           Tweets     Tweets (%)     Seguidores   Seguidos
 1         adnoticia         253         0,12%          175         219
 2         annoticia         256         0,12%          271         350
 3   comuniquebrinde         170         0,08%         1.211       1.967
 4      feedrssreader        192         0,09%          350         245
 5             g1            389         0,19%        467.484        21
 6      mariana_viips        155         0,08%          694          67
 7     news_mundo_           224         0,11%          281         895
 8       novinhabru          320         0,16%         2.992       1.963
 9       romariontv          177         0,09%            -           -
10    segundoplanobr         151         0,07%          347           7
11          siteg1           207         0,10%           60           -
12      sjodiel_indica       262         0,13%          855         615
13       standupbot          384         0,19%          386           -
14     tudodoesporte         522         0,25%          894         366
15       tweets24hs          158         0,08%         2.940       3.258
16      vidasemglobo         147         0,07%          600         177
17       waldeterossi        313         0,15%           70          13
18        zocialtv_br        242         0,12%          338         115
19           _invo           720         0,35%          342          22
            TOTAL:          5.242        2,54%
Segmentando os Influenciadores
Segmentando os Influenciadores

Grupo 1         Grupo 2          Grupo 3
  adnoticia    comuniquebrinde   mariana_viips
  annoticia                       novinhabru
                feedrssreader
     g1                           romariontv
news_mundo_    segundoplanobr     standupbot
   siteg1                        tudonoesporte
                sjodiel_indica
waldeterossi                     vidasemglobo
   _invo         tweets24hs       zocialtv_br
Análise dos Grupos

Grupo   Palavras
        Rio, Brasil, Paulo, chuva, lula, mundial, policia, governo, sul, natal,
  1     pais, wikileaks, brasileiros, Dilma, feira, alemão, sudeste, estados,
        justiça, preso.
        Rio, Paulo, Brasil, chuva, insensato, pais, governo, natal, wikileaks,
  2     Dilma, mundial, justiça, policia, brasileiros, segurança, temporais,
        projeto, risco, Cielo, prisão.
        Programa, gosta, assista, Faustão, cine, peça, hoje, ajuda, vídeo,
  3     twitteado, amore, marcos, noticias, castro, Araguaia, Ana, comedy,
        zilza, vote, malhação.
Estudo de Caso 03
Recomendação em Comércio Eletrônico
         Alguns Clientes TUILUX
“Os serviços de recomendação
        personalizada formam um guia
  indispensável no processo de escolha de
     produtos em um e-commerce e visam
 sugerir o produto mais atraente para cada
 cliente, em cada contexto, antes da perda
   de sua atenção. Essa sugestão pode ser
   feita através de vitrines personalizadas
 dentro da loja ou disparando e-mails com
    produtos selecionados exclusivamente
              para cada cliente.”*

* Artigo publicado na revista E-Commerce Brasil, Ano 2, Edição 1, 2012.
                                                                          35
36
Visão Geral sobre Serviços de
           Recomendação
1. Capturar informação sobre
os produtos

  2. Capturar informação sobre
  as interações dos usuários

     3. Aplicar algoritmos de
     seleção de produtos

        4. Mostrar o conteúdo
        selecionado

           5. Monitorar e analisar a
           efetividade da recomendação
                                         37
Página de Produto: Exemplos
                                Cross-sell
                                O que nem os
                                clientes sabiam
                                que queriam




Vitrine
Produtos
Relacionados




                                        38
Discussão
O LCoN

Laboratório de Computação Natural
Missão e Visão
• Missão: Utilizar a computação natural para
  produzir conhecimento científico de
  qualidade, promover a formação de capital
  intelectual altamente qualificado e transformar
  ciência em tecnologia.

• Visão: Ser referência internacional na formação
  de mestres e doutores, e na produção de artigos
  científicos e ferramentas de solução de problemas
  baseadas na computação natural.
Linhas de P&D
• Meta-Aprendizagem para Agrupamento
• Algoritmos bio-inspirados para
  agrupamento nebulosos de dados
• Jogos educacionais
• Detecção de anomalias (fraudes e furtos)
• Análise de sentimento em redes sociais
• Algoritmos de recomendação
• Etc.
Discussão
• Mais informação que nossa capacidade de
  processá-la
• A natureza como fonte de inspiração para o
  desenvolvimento de novos paradigmas de
  computação
• Necessidade de analisar dados de forma
  sistemática e efetiva
• Gerações X, Y e Z!
Obrigado!
Leandro Nunes de Castro
 Lnunes@mackenzie.br
     @lndecastro



                          44

Mais conteúdo relacionado

Destaque

2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerce2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerceLeandro de Castro
 
2016 (Updated): Introdução à Mineração de Dados
2016 (Updated): Introdução à Mineração de Dados2016 (Updated): Introdução à Mineração de Dados
2016 (Updated): Introdução à Mineração de DadosLeandro de Castro
 
1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...
1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...
1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...Leandro de Castro
 
2000: Artificial Immune Systems - Theory and Applications
2000: Artificial Immune Systems - Theory and Applications2000: Artificial Immune Systems - Theory and Applications
2000: Artificial Immune Systems - Theory and ApplicationsLeandro de Castro
 
2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...
2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...
2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...Leandro de Castro
 
2014: Introdução às Redes Neurais Artificiais
2014: Introdução às Redes Neurais Artificiais2014: Introdução às Redes Neurais Artificiais
2014: Introdução às Redes Neurais ArtificiaisLeandro de Castro
 
2015: Análise de Mercado e Plano de Marketing
2015: Análise de Mercado e Plano de Marketing2015: Análise de Mercado e Plano de Marketing
2015: Análise de Mercado e Plano de MarketingLeandro de Castro
 
2001: An Introduction to Artificial Immune Systems
2001: An Introduction to Artificial Immune Systems2001: An Introduction to Artificial Immune Systems
2001: An Introduction to Artificial Immune SystemsLeandro de Castro
 
2016: Metodologia da Pesquisa em Computação
2016: Metodologia da Pesquisa em Computação2016: Metodologia da Pesquisa em Computação
2016: Metodologia da Pesquisa em ComputaçãoLeandro de Castro
 
2015: Fundamentos Teóricos da Computação
2015: Fundamentos Teóricos da Computação2015: Fundamentos Teóricos da Computação
2015: Fundamentos Teóricos da ComputaçãoLeandro de Castro
 
2013: Empreendedorismo: Slides do Curso
2013: Empreendedorismo: Slides do Curso2013: Empreendedorismo: Slides do Curso
2013: Empreendedorismo: Slides do CursoLeandro de Castro
 
2011: Empreendedorismo Digital - Como Dados Viram Negócios
2011: Empreendedorismo Digital - Como Dados Viram Negócios2011: Empreendedorismo Digital - Como Dados Viram Negócios
2011: Empreendedorismo Digital - Como Dados Viram NegóciosLeandro de Castro
 
2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)Leandro de Castro
 
2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune Systems2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune SystemsLeandro de Castro
 
2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...
2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...
2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...Leandro de Castro
 
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample ApplicationsLeandro de Castro
 
2002: Comparing Immune and Neural Networks
2002: Comparing Immune and Neural Networks2002: Comparing Immune and Neural Networks
2002: Comparing Immune and Neural NetworksLeandro de Castro
 
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os ClientesLeandro de Castro
 
2010: Computação Natural e Aplicações
2010: Computação Natural e Aplicações2010: Computação Natural e Aplicações
2010: Computação Natural e AplicaçõesLeandro de Castro
 

Destaque (20)

2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerce2012: Tutorial sobre Sistemas de Recomendação para E-commerce
2012: Tutorial sobre Sistemas de Recomendação para E-commerce
 
2016 (Updated): Introdução à Mineração de Dados
2016 (Updated): Introdução à Mineração de Dados2016 (Updated): Introdução à Mineração de Dados
2016 (Updated): Introdução à Mineração de Dados
 
1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...
1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...
1998: Técnicas de Otimização Não-Linear Irrestrita para o Treinamento de Rede...
 
2000: Artificial Immune Systems - Theory and Applications
2000: Artificial Immune Systems - Theory and Applications2000: Artificial Immune Systems - Theory and Applications
2000: Artificial Immune Systems - Theory and Applications
 
2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...
2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...
2016: Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplica...
 
2014: Introdução às Redes Neurais Artificiais
2014: Introdução às Redes Neurais Artificiais2014: Introdução às Redes Neurais Artificiais
2014: Introdução às Redes Neurais Artificiais
 
2015: Análise de Mercado e Plano de Marketing
2015: Análise de Mercado e Plano de Marketing2015: Análise de Mercado e Plano de Marketing
2015: Análise de Mercado e Plano de Marketing
 
2001: An Introduction to Artificial Immune Systems
2001: An Introduction to Artificial Immune Systems2001: An Introduction to Artificial Immune Systems
2001: An Introduction to Artificial Immune Systems
 
2016: Metodologia da Pesquisa em Computação
2016: Metodologia da Pesquisa em Computação2016: Metodologia da Pesquisa em Computação
2016: Metodologia da Pesquisa em Computação
 
2015: Fundamentos Teóricos da Computação
2015: Fundamentos Teóricos da Computação2015: Fundamentos Teóricos da Computação
2015: Fundamentos Teóricos da Computação
 
2013: Empreendedorismo: Slides do Curso
2013: Empreendedorismo: Slides do Curso2013: Empreendedorismo: Slides do Curso
2013: Empreendedorismo: Slides do Curso
 
2011: Empreendedorismo Digital - Como Dados Viram Negócios
2011: Empreendedorismo Digital - Como Dados Viram Negócios2011: Empreendedorismo Digital - Como Dados Viram Negócios
2011: Empreendedorismo Digital - Como Dados Viram Negócios
 
2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)2004: Computação Natural (Cybertecnica)
2004: Computação Natural (Cybertecnica)
 
2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune Systems2004: Engineering Applications of Artificial Immune Systems
2004: Engineering Applications of Artificial Immune Systems
 
2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...
2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...
2011: Usando Ferramentas de Recomendação Inteligente para Aumento da Taxa de ...
 
2011: TUILUX_FC
2011: TUILUX_FC2011: TUILUX_FC
2011: TUILUX_FC
 
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
2008: Applied AIS - A Roadmap of AIS Research in Brazil and Sample Applications
 
2002: Comparing Immune and Neural Networks
2002: Comparing Immune and Neural Networks2002: Comparing Immune and Neural Networks
2002: Comparing Immune and Neural Networks
 
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
2011: Na Nova Geração do Ecommerce os Produtos Encontrarão os Clientes
 
2010: Computação Natural e Aplicações
2010: Computação Natural e Aplicações2010: Computação Natural e Aplicações
2010: Computação Natural e Aplicações
 

Mais de Leandro de Castro

2021: An Illustrated Journey into Natural Computing
2021: An Illustrated Journey into Natural Computing2021: An Illustrated Journey into Natural Computing
2021: An Illustrated Journey into Natural ComputingLeandro de Castro
 
2019: LCoN - Centro de Excelência em Inteligência Artificial
2019: LCoN - Centro de Excelência em Inteligência Artificial2019: LCoN - Centro de Excelência em Inteligência Artificial
2019: LCoN - Centro de Excelência em Inteligência ArtificialLeandro de Castro
 
2018: What did I learn about Innovation and Entrepreneurship in Israel
2018: What did I learn about Innovation and Entrepreneurship in Israel2018: What did I learn about Innovation and Entrepreneurship in Israel
2018: What did I learn about Innovation and Entrepreneurship in IsraelLeandro de Castro
 
2018 Academic Innovation Opportunities in Brazil
2018 Academic Innovation Opportunities in Brazil2018 Academic Innovation Opportunities in Brazil
2018 Academic Innovation Opportunities in BrazilLeandro de Castro
 
2017: Tópicos em Educação Financeira
2017: Tópicos em Educação Financeira2017: Tópicos em Educação Financeira
2017: Tópicos em Educação FinanceiraLeandro de Castro
 
2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...
2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...
2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...Leandro de Castro
 
2016: Fundamentos Matemáticos para Inteligência Artificial
2016: Fundamentos Matemáticos para Inteligência Artificial2016: Fundamentos Matemáticos para Inteligência Artificial
2016: Fundamentos Matemáticos para Inteligência ArtificialLeandro de Castro
 
2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica
2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica
2010: Plano de Negócios e Incubação de Empresas de Base TecnológicaLeandro de Castro
 

Mais de Leandro de Castro (9)

2021: An Illustrated Journey into Natural Computing
2021: An Illustrated Journey into Natural Computing2021: An Illustrated Journey into Natural Computing
2021: An Illustrated Journey into Natural Computing
 
2019: Folder do LCoN
2019: Folder do LCoN2019: Folder do LCoN
2019: Folder do LCoN
 
2019: LCoN - Centro de Excelência em Inteligência Artificial
2019: LCoN - Centro de Excelência em Inteligência Artificial2019: LCoN - Centro de Excelência em Inteligência Artificial
2019: LCoN - Centro de Excelência em Inteligência Artificial
 
2018: What did I learn about Innovation and Entrepreneurship in Israel
2018: What did I learn about Innovation and Entrepreneurship in Israel2018: What did I learn about Innovation and Entrepreneurship in Israel
2018: What did I learn about Innovation and Entrepreneurship in Israel
 
2018 Academic Innovation Opportunities in Brazil
2018 Academic Innovation Opportunities in Brazil2018 Academic Innovation Opportunities in Brazil
2018 Academic Innovation Opportunities in Brazil
 
2017: Tópicos em Educação Financeira
2017: Tópicos em Educação Financeira2017: Tópicos em Educação Financeira
2017: Tópicos em Educação Financeira
 
2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...
2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...
2017: The Many Faces of Artificial Intelligence: From AI to Big Data - A Hist...
 
2016: Fundamentos Matemáticos para Inteligência Artificial
2016: Fundamentos Matemáticos para Inteligência Artificial2016: Fundamentos Matemáticos para Inteligência Artificial
2016: Fundamentos Matemáticos para Inteligência Artificial
 
2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica
2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica
2010: Plano de Negócios e Incubação de Empresas de Base Tecnológica
 

2012: LCoN Aplicações em Big Data

  • 1. LCoN: Atuação em Big Data Leandro Nunes de Castro Lnunes@mackenzie.br @lndecastro Faculdade de Computação e Informática & Programa de Pós-Graduação em Engenharia Elétrica Laboratório de Computação Natural (LCoN) www.mackenzie.br/lcon.html
  • 2. Sumário • Motivação: Dados e Redes Sociais • Mineração de Dados • Computação Natural • Estudos de Caso: – Reclame Aqui – Análise de Sentimento no Twitter – Sistemas de Recomendação • O LCoN • Discussão 2
  • 3. Motivação Um Universo de Dados e Redes Sociais
  • 4. Sobre Dados e Informação
  • 5. Mineração de Dados Conceitos Básicos Image: jannoon028 / FreeDigitalPhotos.net
  • 6. Pode-se definir a descoberta de conhecimento em bancos de dados (KDD) como sendo o processo não trivial de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis em grandes bancos de dados Image: jannoon028 / FreeDigitalPhotos.net
  • 7. Processo de KDD Pré- Validação Base de Dados Análise Processamento (Conhecimento) Image: jscreationzs/ digitalart / Vlado / jscreationzs / FreeDigitalPhotos.net
  • 8. Estatística Visualização Matemática Mineração de Dados Sistemas de Engenharia Informação Bancos de Inteligência Dados Artificial
  • 10. Agrupamento Detecção de Anomalias Descrição de Classes e Conceitos Predição: Classificação e Associação Estimação Images: jscreationzs / renjith krishnan / digitalart / sheelamohan / renjith krishnan / FreeDigitalPhotos.net
  • 11. Computação Natural Conceitos Básicos Image: Stuart Miles / FreeDigitalPhotos.net
  • 12. Imagine um mundo onde os computadores podem criar novos universos, e dentro destes universos existam formas naturais que reproduzem, crescem e pensam. Imagine formas vegetais, montanhas, colônias de formigas, sistemas imunológicos, e cérebros, todos aprendendo e evoluindo, e se tornando mais adaptados ao ambiente. Imagine se nossos computadores passassem a conter novas formas de vida. Pense no que isso afetaria nossas vidas. Talvez pudéssemos criar automaticamente projetos de casas e música, novas formas de proteger computadores contra invasores, novas formas de resolver problemas complexos, novos organismos, e novas formas de computar. Agora pare de imaginar. Seja bem vindo à Computação Natural Image: Stuart Miles / FreeDigitalPhotos.net
  • 13.
  • 14. Principais Áreas • Computação Bioinspirada – Redes Neurais Artificiais – Algoritmos Evolutivos – Inteligência de Enxame – Sistemas Imunológicos Artificiais • Síntese Computacional da Natureza – Geometria Fractal – Vida Artificial • Computação com Novas Matérias Primas – Computação de DNA – Computação Quântica
  • 15. Aproximador Universal de Funções First layer Second layer Third layer x 1 y1 2 y2 3 y3 W W W 1 2 u u u3  f 1  f 2  f3 1 1 1 b1 b2 b3 y 1 = f1 (W1x + b 1) y 2 = f2 (W2y1 + b 2) y 3 = f3 (W3y2 + b3) o m  F ( x1 , x2 ,..., xm )   α i f   wij x j wi 0    i 1  j 1 
  • 16. Ant-Based Clustering 2 2  k   f  pp   1  k  f  pd   k  f    1   2  1  d (x i , x j )   f (x i )   s 2  (r ) 1  α  if f  0 x j Neigh ( s s )   0  otherwise
  • 17. Immunocomputing Foreign stimulus Idiotope 5 1 Paratope 3 6 2 4     mij   G D  ei (n  k ), p j (n)   ε  1   k   n   dci  N1 N1 N2   k1  m ji ci c j  k 2  mij ci c j   m ji ci y j   k 3 ci dt  j 1 j 1 j 1 
  • 19.
  • 20. Nomenclatura e Tipos de Dados Possui Financiamen Credito Salário Estado Cartão de Nro de Idade Imóveis Veículos Cheque to R$ Civil Crédito Filhos Especial Pretendido Autorizado 350 21 Sol. 0 0 0 0 Sim 10.000 Não 3700 52 Cas. 1 1 2 2 Sim 7.000 Sim 1200 26 Cas. 1 0 1 1 Não 10.000 Não 700 25 Sol. 0 0 0 0 Não 5.000 Sim 8500 50 Cas. 2 1 2 2 Sim 40.000 Sim 1800 27 Sol. 1 0 1 0 Sim 20.000 Não 350 20 Sol. 0 0 0 0 Não 10.000 Não Objetos x Atributos Tipos de Dados: Nominais, Ordinais, Numéricos
  • 21. Estudo de Caso 01 Descrição de Classes e Conceitos Dados do Reclame Aqui
  • 22. Panorama Geral do Setor Status das Reclamações Nao Respondido 20% 7% Respondido 30% Replicas 24% Finalizada - Resolvido 19% Finalizada - Nao Média das Notas Resolvido 5.3 3.9 2.6 0.5 Média Geral Média ">0" Finalizada - Resolvido Finalizada - Nao Resolvido
  • 23. Panorama Geral do Setor Construção Civil - Piores Atendimentos 17% 13% 10% 6% 5% 5% 5% 5% 5% 4% 4% 3% 2% 2% 2% 2% 2% 2% 2% 3%
  • 24. Panorama Geral do Setor Construção Civil 17% 13% 9% 6% 6% 6% 6% 4% 4% 4% 4% 3% 3% 2% 2% 2% 2% 2% 2% 2%
  • 25. Estudo de Caso 02 Análise de Sentimento em Tweets Dados da Rede Globo
  • 26. Base de Análise • Para realizar as análises a serem apresentadas foram utilizados 206.259 tweets de 127.945 usuários entre os dias 1 e 31 de dezembro de 2010. • Os atributos disponíveis para essa análise foram: Cliente, Avaliação, Termo, Usuário, Texto e Data.
  • 27. Domingão do Faustão Palavras mais comentadas - Domingão do Faustão 11% 8% 8% 7% 7% 6% 6% 6% 6% 5% 4% 4% 4% 4% 3% 3% 3% 2% 2% 2% 2% 2% 2% 2% 2% 2% 2% 1% 1% 1% 1% 1% 1% 1% 1% 1% 1% 1% 0% 0% Total Top 20 Total Twitters
  • 28. Comentários Positivos Palavras mais comentadas - Tweets positivos 13% 11% 10% 7% 7% 6% 6% 5% 5% 3% 3% 4% 3% 3% 3% 3% 3% 3% 3% 3% 2% 2% 2% 2% 2% 2% 2% 1% 1% 1% 1% 1% 1% 1% 1% 1% 1% 1% 1% 0% Total Top 20 Total Twitters
  • 29. Comentários Negativos Palavras mais comentados - Tweets negativos 27% 16% 8% 6% 5% 5% 3% 4% 4% 3% 3% 3% 3% 2% 1% 1% 1% 1% 1% 1% 1% 1% 2% 2% 2% 2% 2% 2% 2% 2% 2% 0% 0% 0% 0% 0% 0% 0% 0% 0% Total Top 20 Total Twitters
  • 30. Influenciadores Qtde de Percentual de Qtde de Qtde de Id Usuários Tweets Tweets (%) Seguidores Seguidos 1 adnoticia 253 0,12% 175 219 2 annoticia 256 0,12% 271 350 3 comuniquebrinde 170 0,08% 1.211 1.967 4 feedrssreader 192 0,09% 350 245 5 g1 389 0,19% 467.484 21 6 mariana_viips 155 0,08% 694 67 7 news_mundo_ 224 0,11% 281 895 8 novinhabru 320 0,16% 2.992 1.963 9 romariontv 177 0,09% - - 10 segundoplanobr 151 0,07% 347 7 11 siteg1 207 0,10% 60 - 12 sjodiel_indica 262 0,13% 855 615 13 standupbot 384 0,19% 386 - 14 tudodoesporte 522 0,25% 894 366 15 tweets24hs 158 0,08% 2.940 3.258 16 vidasemglobo 147 0,07% 600 177 17 waldeterossi 313 0,15% 70 13 18 zocialtv_br 242 0,12% 338 115 19 _invo 720 0,35% 342 22 TOTAL: 5.242 2,54%
  • 32. Segmentando os Influenciadores Grupo 1 Grupo 2 Grupo 3 adnoticia comuniquebrinde mariana_viips annoticia novinhabru feedrssreader g1 romariontv news_mundo_ segundoplanobr standupbot siteg1 tudonoesporte sjodiel_indica waldeterossi vidasemglobo _invo tweets24hs zocialtv_br
  • 33. Análise dos Grupos Grupo Palavras Rio, Brasil, Paulo, chuva, lula, mundial, policia, governo, sul, natal, 1 pais, wikileaks, brasileiros, Dilma, feira, alemão, sudeste, estados, justiça, preso. Rio, Paulo, Brasil, chuva, insensato, pais, governo, natal, wikileaks, 2 Dilma, mundial, justiça, policia, brasileiros, segurança, temporais, projeto, risco, Cielo, prisão. Programa, gosta, assista, Faustão, cine, peça, hoje, ajuda, vídeo, 3 twitteado, amore, marcos, noticias, castro, Araguaia, Ana, comedy, zilza, vote, malhação.
  • 34. Estudo de Caso 03 Recomendação em Comércio Eletrônico Alguns Clientes TUILUX
  • 35. “Os serviços de recomendação personalizada formam um guia indispensável no processo de escolha de produtos em um e-commerce e visam sugerir o produto mais atraente para cada cliente, em cada contexto, antes da perda de sua atenção. Essa sugestão pode ser feita através de vitrines personalizadas dentro da loja ou disparando e-mails com produtos selecionados exclusivamente para cada cliente.”* * Artigo publicado na revista E-Commerce Brasil, Ano 2, Edição 1, 2012. 35
  • 36. 36
  • 37. Visão Geral sobre Serviços de Recomendação 1. Capturar informação sobre os produtos 2. Capturar informação sobre as interações dos usuários 3. Aplicar algoritmos de seleção de produtos 4. Mostrar o conteúdo selecionado 5. Monitorar e analisar a efetividade da recomendação 37
  • 38. Página de Produto: Exemplos Cross-sell O que nem os clientes sabiam que queriam Vitrine Produtos Relacionados 38
  • 40. O LCoN Laboratório de Computação Natural
  • 41. Missão e Visão • Missão: Utilizar a computação natural para produzir conhecimento científico de qualidade, promover a formação de capital intelectual altamente qualificado e transformar ciência em tecnologia. • Visão: Ser referência internacional na formação de mestres e doutores, e na produção de artigos científicos e ferramentas de solução de problemas baseadas na computação natural.
  • 42. Linhas de P&D • Meta-Aprendizagem para Agrupamento • Algoritmos bio-inspirados para agrupamento nebulosos de dados • Jogos educacionais • Detecção de anomalias (fraudes e furtos) • Análise de sentimento em redes sociais • Algoritmos de recomendação • Etc.
  • 43. Discussão • Mais informação que nossa capacidade de processá-la • A natureza como fonte de inspiração para o desenvolvimento de novos paradigmas de computação • Necessidade de analisar dados de forma sistemática e efetiva • Gerações X, Y e Z!
  • 44. Obrigado! Leandro Nunes de Castro Lnunes@mackenzie.br @lndecastro 44