Uma introdução a
Machine Learning
      Guilherme Silveira
  http://www.caelum.com.br
a idéia
a idéia

problemas
perguntas
a idéia

problemas             soluções
perguntas             respostas
quem sou eu
quem sou eu
quem sou eu
casa ==> caelum
decidi ir de carro
decidi ir de carro


                     <== piada
pego o carro...
pego o carro...
pego o carro...
assisto o trânsito
  de camarote
decidi ir de metrô
quem conhece
  são paulo?
quem conhece
     são paulo?
quem conhece o metrô
    em são paulo?
Problema?
Problema?




 vista interna
além do trânsito
além do trânsito


minha vida pessoal
mudança
o preço dos imóveis
             Tamanho     Preço
               100      750000
               200      860000
está caro?     150      977000
               140       81900
               160      984000
               180     1127000
               130      638000
                80      647000
                40      346000
p: qual um preço justo
   para esse imóvel?
está caro?
regressão linear   f(x) = ax + b
planilha
planilha
planilha
planilha



preço = 5053x + 57758
planilha



preço = 5053x + 57758
regressão linear   f(x) = ax + b
regressão linear   f(x) = ax + b
regressão linear                f(x) = ax + b



polinômios   f(x) = a + bx + cx^2 + ... + dx^n
regressão linear                f(x) = ax + b



polinômios   f(x) = a + bx + cx^2 + ... + dx^n
regressão linear                           f(x) = ax + b



 polinômios              f(x) = a + bx + cx^2 + ... + dx^n




preço = a + ... + dx^n
p: como estimar o valor de algo?
   possível resposta: regressão
p: como estimar o valor de algo?
   possível resposta: regressão
 p: qual a nota que o aluno vai
      tirar na prova final?
p: como estimar o valor de algo?
   possível resposta: regressão
  p: qual a nota que o aluno vai
       tirar na prova final?
p: qual será a nota do hipólito na
        próxima olimpíada?
p: como estimar o valor de algo?
   possível resposta: regressão
  p: qual a nota que o aluno vai
       tirar na prova final?
p: qual será a nota do hipólito na
        próxima olimpíada?
   p: quanto tempo os alunos
   precisarão para essa prova?
simplicidade++
   bizarro--
função Brad Pitt
função Brad Pitt
 (a função perfeita?)
função Brad Pitt
 (a função perfeita?)
e o número de
           dormitórios?
Tamanho          Preço
  100           750000
  200           860000
  150           977000
  140            81900
  160           984000
  180          1127000
  130           638000
   80           647000
   40           346000
e o número de
           dormitórios?
Tamanho      Dormitório     Preço
  100            2         750000
  200            3         860000
  150            4         977000
  140            3          81900
  160            3         984000
  180            4        1127000
  130            3         638000
   80            3         647000
   40            1         346000
bibliotecas
http://commons.apache.org/math/
http://math.nist.gov/javanumerics/jama/
http://mahout.apache.org/
google: language + regression
chego no trabalho
abro os emails
p: classificação
p: classificação
    É spamzis!
p: classificação
    É spamzis!

     Não é!
p: classificação
    É spamzis!

     Não é!
p: classificação
    É spamzis!    1

     Não é!
p: classificação
    É spamzis!    1

     Não é!       0
treino!
valido!
p: ele é 1?
p: ele é 1?
p: ele é 1?
    acredito que sim, com
       chance de 78%
lista com 1000 itens
lista com 1000 itens




classificação
  humana
lista com 1000 itens




classificação
  humana
lista com 1000 itens




classificação             treino da
  humana                 máquina
lista com 800 itens
  lista com 1000 itens




classificação             treino da
  humana                 máquina
lista com 800 itens
  lista com 1000 itens




classificação             treino da               valida a
  humana                 máquina                qualidade
lista com 800 itens
  lista com 1000 itens
                                                 lista com 200 itens




classificação             treino da               valida a
  humana                 máquina                qualidade
99% de acerto



                          lista com 800 itens
  lista com 1000 itens
                                                 lista com 200 itens




classificação             treino da               valida a
  humana                 máquina                qualidade
p: ele é 1?
r: regressão logística
p: ele é 1?
r: regressão logística
p: ele é 1?
r: regressão logística
            chance de x%
p: o email é spam?
p: o email é spam?
p: o aluno está com dificuldade?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: qual a chance do aluno acertar
          esse exercício?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: qual a chance do aluno acertar
          esse exercício?
p: qual a chance de essa imagem
      ser o número 3? ou 8?
p: o email é spam?
p: o aluno está com dificuldade?
p: o aluno domina o conteúdo?
p: qual a chance do aluno acertar
          esse exercício?
p: qual a chance de essa imagem
      ser o número 3? ou 8?
p: qual a chance de essa imagem
          ser um cancêr?
nota: simplificações desses
         problemas
e o cartão de credito?
você gastou 50
     dia 30
    loja 15
você gastou 30
     dia 30
    loja 17
você gastou 25
     dia 30
    loja 21
você gastou 25
     dia 30
    loja 21
você gastou 2500
     dia 30
      loja 7
dia   valor   loja

30     30     15

30     35     17

30    100      8

1      37      9

30    2500     7
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja    label

30     30     15       0

30     35     17       0

30    100      8       0

1      37      9       0

30    2500     7       1




                     treina
dia    valor   loja   label

30      30     15      0

30      35     17      0

30     100      8      0

1       37      9      0

30     2500     7      1




      treina
dia   valor   loja   label

30      30    15      0

30      35    17      0

30     100     8      0

1       37     9      0

30     2500    7      1




      valida
dia   valor   loja   label

30      30    15      0

30      35    17      0      37% de acerto
30     100     8      0

1       37     9      0

30     2500    7      1




      valida
dia   valor   loja   label

30      30    15      0

30      35    17      0      37% de acerto
30     100     8      0

1       37     9      0

30     2500    7      1




      valida
dia   valor   loja   label

30      30    15      0

30      35    17      0           37% de acerto
30     100     8      0

1       37     9      0

30     2500    7      1




                             eu continuo
                              roubando
      valida
regressão logística é,
 em geral, linear ou
     lerdíssima
regressão logística é,
 em geral, linear ou
     lerdíssima
       regularização
regressão logística é,
 em geral, linear ou
     lerdíssima
       regularização
        polinômios
regressão logística é,
 em geral, linear ou
     lerdíssima
       regularização
        polinômios
          outras
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0
                             treina
30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1
dia   valor   loja   label

30     30     15      0
                             treina
30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1




                             treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina

dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0      treina
30    2500     7      1


      treina

dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0      treina
30    2500     7      1


      treina

dia   valor   loja   label


                             treina
30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0      treina
30    2500     7      1


      treina

dia   valor   loja   label


                             treina
30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1


      treina
                             treina
dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1


         dia
               treina
               valor   loja   label

         30     30     15      0

treina   30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1


               treina
         dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

treina   1      37      9      0

         30    2500     7      1

               treina
dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1


         dia
               treina
               valor   loja   label

         30     30     15      0

treina   30     35     17      0

         30    100      8      0

         1      37      9      0

         30    2500     7      1      treina
               treina
         dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

treina   1      37      9      0

         30    2500     7      1

               treina
dia   valor   loja   label
         treina   30     30     15      0

                  30     35     17      0

                  30    100      8      0
treina            1      37      9      0

                  30    2500     7      1


                        treina
         treina


treina
         treina
87% de acerto

                      dia   valor   loja   label
         treina       30     30     15      0

                      30     35     17      0

                      30    100      8      0
treina                1      37      9      0

                      30    2500     7      1


                            treina
         treina


treina
         treina
87% de acerto

                        dia   valor   loja   label
           treina       30     30     15      0

                        30     35     17      0

                        30    100      8      0
  treina                1      37      9      0

                        30    2500     7      1


                              treina
           treina


  treina
o seu telefone toca
        treina
87% de acerto

                        dia   valor   loja   label
           treina       30     30     15      0

                        30     35     17      0

                        30    100      8      0
  treina                1      37      9      0

                        30    2500     7      1


                              treina
           treina


  treina
o seu telefone toca
        treina
p: o email é spam?




http://neuroph.sourceforge.net/
p: o email é spam?

p: essa movimentação é uma
          fraude?



    http://neuroph.sourceforge.net/
p: o email é spam?

p: essa movimentação é uma
          fraude?

p: qualquer pergunta sim/não
         como antes?
    http://neuroph.sourceforge.net/
acesso o
“banco.caelum.com.br”
dia   valor      loja

30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE

30     5       BUTECO
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

30    149      CAELUM

1     499     FACULDADE   alimentação

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

30     35      MUNI TR

                          profissional
30    149      CAELUM

1     499     FACULDADE   alimentação

30     5       BUTECO
o que é isso?
dia   valor      loja

                          o que é isso?
30     30      MAX PAD

                          profissional
30     35      MUNI TR

                          profissional
30    149      CAELUM

1     499     FACULDADE   alimentação

30     5       BUTECO
p: a movimentação 15 é?
p: a movimentação 15 é
entretenimento ou não? (0 ou 1)
p: a movimentação 15 é
entretenimento ou não? (0 ou 1)
    p: a movimentação 15 é
 alimentação ou não? (0 ou 1)
p: a movimentação 15 é
entretenimento ou não? (0 ou 1)
    p: a movimentação 15 é
 alimentação ou não? (0 ou 1)
    p: a movimentação 15 é
  profissional ou não? (0 ou 1)
dia   valor      loja      categoria

30     30      MAX PAD    alimentação

30     35      MUNI TR    transporte

30    149      CAELUM     profissional

1     499     FACULDADE   profissional

30     5       BUTECO     alimentação
dia   valor      loja      categoria

30     30      MAX PAD    alimentação

30     35      MUNI TR    transporte
                      onde estão os
30    149      CAELUM     0 e 1?
                       profissional

1     499     FACULDADE   profissional

30     5       BUTECO     alimentação
dia   valor      loja     categoria

30     30      MAX PAD       0

30     35      MUNI TR       1

30    149      CAELUM        2

1     499     FACULDADE      2

30     5       BUTECO        0
dia   valor      loja      categoria

30     30      MAX PAD        0

30     35      MUNI TR        1
                          é 0, 1 ou 2?
30    149      CAELUM         2

1     499     FACULDADE       2

30     5       BUTECO         0
dia   valor      loja     categoria

30     30      MAX PAD       é

30     35      MUNI TR     resto

30    149      CAELUM      resto

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor      loja     categoria

30     30      MAX PAD       é

30     35      MUNI TR     resto
                      é 0 ou o resto?
30    149      CAELUM       77%
                           resto

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR       é

30    149      CAELUM      resto

1     499     FACULDADE    resto

30     5       BUTECO        é
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR       é
                      é 1 ou o resto?
30    149      CAELUM       53%
                           resto

1     499     FACULDADE    resto

30     5       BUTECO        é
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR     resto

30    149      CAELUM        é

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor      loja     categoria

30     30      MAX PAD     resto

30     35      MUNI TR     resto
                      é 2 ou o resto?
30    149      CAELUM      64%
                            é

1     499     FACULDADE      é

30     5       BUTECO      resto
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0



dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1



dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0



dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1



dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0


                   entretenimento
dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1



dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

30     30     15      0

30     35     17      0

30    100      8      0

1      37      9      1

30    2500     7      0


                   entretenimento
dia   valor   loja   label

30     30     15      1

30     35     17      0

30    100      8      0

1      37      9      0

30    2500     7      1

                     alimentação
dia   valor   loja   label

30     30     15      0

30     35     17      1

30    100      8      1

1      37      9      0

30    2500     7      0
dia   valor   loja   label

         30     30     15      0

         30     35     17      0

         30    100      8      0

          1     37      9      1

         30    2500     7      0


entretenimento
         dia   valor   loja   label

         30     30     15      1

         30     35     17      0

         30    100      8      0

          1     37      9      0

         30    2500     7      1

 alimentação
         dia   valor   loja   label

         30     30     15      0

         30     35     17      1

         30    100      8      1

          1     37      9      0

         30    2500     7      0


 profissional
dia   valor   loja   label

               30     30     15      0

               30     35     17      0
77%            30    100      8      0

                1     37      9      1

               30    2500     7      0


      entretenimento
               dia   valor   loja   label

               30     30     15      1

               30     35     17      0

               30    100      8      0

                1     37      9      0

               30    2500     7      1

       alimentação
               dia   valor   loja   label

               30     30     15      0

               30     35     17      1

               30    100      8      1

                1     37      9      0

               30    2500     7      0


       profissional
dia   valor   loja   label

               30     30     15      0

               30     35     17      0
77%            30    100      8      0

                1     37      9      1

               30    2500     7      0


      entretenimento
               dia   valor   loja   label

               30     30     15      1

53%            30     35     17      0

               30    100      8      0

                1     37      9      0

               30    2500     7      1

       alimentação
               dia   valor   loja   label

               30     30     15      0

               30     35     17      1

               30    100      8      1

                1     37      9      0

               30    2500     7      0


       profissional
dia   valor   loja   label

               30     30     15      0

               30     35     17      0
77%            30    100      8      0

                1     37      9      1

               30    2500     7      0


      entretenimento
               dia   valor   loja   label

               30     30     15      1

53%            30     35     17      0

               30    100      8      0

                1     37      9      0

               30    2500     7      1

       alimentação
               dia   valor   loja   label

               30     30     15      0

64%            30     35     17      1

               30    100      8      1

                1     37      9      0

               30    2500     7      0


       profissional
77%

      entretenimento

53%

                       treina
       alimentação

64%


       profissional
entretenimento



                 treina
 alimentação




 profissional
entretenimento

entretenimento



                    treina
 alimentação




 profissional
entretenimento

entretenimento



                     treina
 alimentação


         você ficou esperando o
         outro robô aparecer né?
 profissional
One vs All
p: dentre as categorias A,B,C a
 qual categoria ele pertence?
p: dentre as categorias A,B,C a
 qual categoria ele pertence?
  p: o aluno está motivado,
   desanimado, desiludido,
 decepcionado, contente ou
          malandrão?
o aluno não terminou :(
será que eu poderia ter
      ajudado ele?
qto tempo em cada
     exercício?
qto tempo em cada
     exercício?


  alunos   = []
  alunos   << [12, 150, 3, 15]
  alunos   << [4, 170, 32, 25]
  alunos   << [1, 10, 3, 25]
  alunos   << [12, 20, 31, 15]
se ele termina o curso
 em 3 meses ou não
se ele termina o curso
 em 3 meses ou não
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]
se ele termina o curso
 em 3 meses ou não
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]

     labels = [1, 1, 0, 0]
treina
treina
treina
treina
e o guilherme?
e o guilherme?

guilherme = [6, 140, 25, 10]
e o guilherme?

guilherme = [6, 140, 25, 10]

model.predict(Node.features(guilherme))
adivinhe!
SVM
SVM
dados fake
dados fake
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]
dados fake
alunos   = []
alunos   << [12, 150, 3, 15]
alunos   << [4, 170, 32, 25]
alunos   << [1, 10, 3, 25]
alunos   << [12, 20, 31, 15]

     labels = [1, 1, 0, 0]
dados reais
dados reais
dados reais
C utilizado   ACERTOS NO TREINO PREVISOES COM AC
0.08!         93.18%!           85.71%
dados reais
C utilizado   ACERTOS NO TREINO PREVISOES COM AC
0.08!         93.18%!           85.71%




C utilizado! ! ACERTOS NO TREINO!PREVISOES
0.001! !
      !        70.45454545454545!61.90476190476190
0.04! ! !      88.63636363636364!71.42857142857143
0.08! ! !      93.18181818181819!85.71428571428571
0.2! !
    !          100.0! !
                     !           100.0
dados reais
C utilizado   ACERTOS NO TREINO PREVISOES COM AC
0.08!         93.18%!           85.71%




C utilizado! ! ACERTOS NO TREINO!PREVISOES
0.001! !
      !        70.45454545454545!61.90476190476190
0.04! ! !      88.63636363636364!71.42857142857143
0.08! ! !      93.18181818181819!85.71428571428571
0.2! !
    !          100.0! !
                     !           100.0
SVM para classificar
     (0,1, ...)
p: dentre as categorias A,B,C a
 qual categoria ele pertence?
p: dentre as categorias A,B,C a
 qual categoria ele pertence?

p: o aluno vai desistir do curso?

  p: essa pessoa tem perfil de
           terrorista?
grupos de alunos
grupos de alunos
grupos de alunos
user id 15 ?? user id 17
user id 15 ?? user id 17
user id 15 ?==? user id 17
user id 15 ?? user id 17
  user id 15 ?==? user id 17
333784321236738126783 ?==? 1238793923832178612397
user id 15 ?? user id 17
  user id 15 ?==? user id 17
333784321236738126783 ?==? 1238793923832178612397

   dificuldade != facilidade
user id 15 ?? user id 17
  user id 15 ?==? user id 17
333784321236738126783 ?==? 1238793923832178612397

   dificuldade != facilidade
características em comum
características em comum
                   altura???
características em comum
número de respostas erradas
                              altura???
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                               feedbacks dados
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                               feedbacks dados
      notas de feedback recebidos
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                                  feedbacks dados
      notas de feedback recebidos

                          likes
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                                  feedbacks dados
      notas de feedback recebidos

                          likes
          cursos
características em comum
número de respostas erradas
                                    altura???
                        tempo gasto
 número de exercícios feitos
                                   feedbacks dados
      notas de feedback recebidos

                           likes
          cursos
                   quantidade de caracteres
joga no plano
olha eles aqui!
chuta um ponto

X

           X
genial

X

             X
melhora

X

              X
melhora

X

                  X
    X
melhora

X

                  X
    X


                      X
melhora

X

                  X
    X


                      X
melhora

X

                  X
    X


                      X
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
e melhora...
esses são os grupos
grupos esperados:

muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas



                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos esperados:


X
muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas



                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos esperados:


X                              X
muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas



                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos esperados:


X                              X
muitas perguntas,               poucos erros,
 muitos erros                  poucas perguntas




              X
                 poucos erros,
               poucas perguntas,
                ajuda bastante
grupos encontrados:
grupos encontrados:

muitas perguntas,
 poucos erros
grupos encontrados:

muitas perguntas,     muitos erros,
 poucos erros       poucas perguntas
grupos encontrados:

muitas perguntas,                muitos erros,
 poucos erros                  poucas perguntas



                 muitos erros,
               poucas perguntas,
                ajuda bastante
grupos encontrados:

muitas perguntas,                muitos erros,
 poucos erros                  poucas perguntas



                 muitos erros,
               poucas perguntas,
                ajuda bastante
                                         entre
                                         outros
p: como meus _____ se
       agrupam?
p: como meus _____ se
        agrupam?
  p: como os alunos se
       comportam?
p: como meus _____ se
        agrupam?
  p: como os alunos se
       comportam?

p: como os instrutores se
      comportam?
p: como meus _____ se
        agrupam?
  p: como os alunos se
       comportam?

p: como os instrutores se
      comportam?

p: como os exercícios se
      comportam?
p: como meus clientes se
       agrupam?
p: como meus clientes se
        agrupam?
p: como meus produtos se
        agrupam?
p: como meus clientes se
        agrupam?
p: como meus produtos se
        agrupam?

p: como minhas features se
        agrupam?
p: como meus clientes se
        agrupam?
p: como meus produtos se
        agrupam?

p: como minhas features se
        agrupam?

p: como os clientes usam o
         sistema?
resumindo
machine learning
machine learning
regressão linear
machine learning
regressão linear
 classificadores
machine learning
regressão linear
 classificadores
 redes neurais
machine learning
regressão linear
 classificadores
 redes neurais
     logistic
machine learning
regressão linear
 classificadores
 redes neurais
     logistic
    k-cluster
a média de bugs de uma
equipe é X
a média de bugs de uma
equipe é X
“nessa equipe está Y”
metricminer.org.br
se usar o computador
se usar o computador
se usar o computador
      não dirija
se beber não dirija
se beber não dirija
se ler, não dirija
se ler, não dirija
se falar, não dirija
se falar, não dirija
“carros” automáticos
“carros” automáticos
“carros” automáticos
“carros” automáticos
detectando...
detectando...
detectando...
detectando...
detectando...
detectando...
detectando...   margem de erro
o que você quer saber
  sobre um cliente?
o que você quer saber
    sobre um cliente?
o que o cliente quer saber
    sobre ele mesmo?
o que você quer saber
     sobre um cliente?
 o que o cliente quer saber
     sobre ele mesmo?
como os clientes se agrupam?
o que você quer saber
     sobre um cliente?
 o que o cliente quer saber
     sobre ele mesmo?
como os clientes se agrupam?

como seus itens se agrupam?
o que você quer saber
     sobre um cliente?
 o que o cliente quer saber
     sobre ele mesmo?
como os clientes se agrupam?

como seus itens se agrupam?

 quando o cliente fará algo?
nós respondemos 2
nós respondemos 2
  levante as suas
obrigado 1
guilherme.silveira@caelum.com.br
@guilhermecaelum
http://caelum.com.br/online

Introducao a machine learning na educacao

  • 1.
    Uma introdução a MachineLearning Guilherme Silveira http://www.caelum.com.br
  • 2.
  • 3.
  • 4.
    a idéia problemas soluções perguntas respostas
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
    decidi ir decarro <== piada
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
    quem conhece são paulo?
  • 17.
    quem conhece são paulo? quem conhece o metrô em são paulo?
  • 18.
  • 19.
  • 20.
  • 21.
  • 25.
  • 26.
    o preço dosimóveis Tamanho Preço 100 750000 200 860000 está caro? 150 977000 140 81900 160 984000 180 1127000 130 638000 80 647000 40 346000
  • 27.
    p: qual umpreço justo para esse imóvel?
  • 29.
  • 35.
    regressão linear f(x) = ax + b
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
    regressão linear f(x) = ax + b
  • 42.
    regressão linear f(x) = ax + b
  • 43.
    regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n
  • 44.
    regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n
  • 45.
    regressão linear f(x) = ax + b polinômios f(x) = a + bx + cx^2 + ... + dx^n preço = a + ... + dx^n
  • 46.
    p: como estimaro valor de algo? possível resposta: regressão
  • 47.
    p: como estimaro valor de algo? possível resposta: regressão p: qual a nota que o aluno vai tirar na prova final?
  • 48.
    p: como estimaro valor de algo? possível resposta: regressão p: qual a nota que o aluno vai tirar na prova final? p: qual será a nota do hipólito na próxima olimpíada?
  • 49.
    p: como estimaro valor de algo? possível resposta: regressão p: qual a nota que o aluno vai tirar na prova final? p: qual será a nota do hipólito na próxima olimpíada? p: quanto tempo os alunos precisarão para essa prova?
  • 50.
    simplicidade++ bizarro--
  • 51.
  • 52.
    função Brad Pitt (a função perfeita?)
  • 53.
    função Brad Pitt (a função perfeita?)
  • 54.
    e o númerode dormitórios? Tamanho Preço 100 750000 200 860000 150 977000 140 81900 160 984000 180 1127000 130 638000 80 647000 40 346000
  • 55.
    e o númerode dormitórios? Tamanho Dormitório Preço 100 2 750000 200 3 860000 150 4 977000 140 3 81900 160 3 984000 180 4 1127000 130 3 638000 80 3 647000 40 1 346000
  • 56.
  • 57.
  • 58.
  • 60.
  • 61.
  • 62.
    p: classificação É spamzis! Não é!
  • 63.
    p: classificação É spamzis! Não é!
  • 64.
    p: classificação É spamzis! 1 Não é!
  • 65.
    p: classificação É spamzis! 1 Não é! 0
  • 66.
  • 78.
  • 79.
  • 80.
  • 81.
    p: ele é1? acredito que sim, com chance de 78%
  • 82.
  • 83.
    lista com 1000itens classificação humana
  • 84.
    lista com 1000itens classificação humana
  • 85.
    lista com 1000itens classificação treino da humana máquina
  • 86.
    lista com 800itens lista com 1000 itens classificação treino da humana máquina
  • 87.
    lista com 800itens lista com 1000 itens classificação treino da valida a humana máquina qualidade
  • 88.
    lista com 800itens lista com 1000 itens lista com 200 itens classificação treino da valida a humana máquina qualidade
  • 89.
    99% de acerto lista com 800 itens lista com 1000 itens lista com 200 itens classificação treino da valida a humana máquina qualidade
  • 90.
    p: ele é1? r: regressão logística
  • 91.
    p: ele é1? r: regressão logística
  • 92.
    p: ele é1? r: regressão logística chance de x%
  • 93.
    p: o emailé spam?
  • 94.
    p: o emailé spam? p: o aluno está com dificuldade?
  • 95.
    p: o emailé spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo?
  • 96.
    p: o emailé spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance do aluno acertar esse exercício?
  • 97.
    p: o emailé spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance do aluno acertar esse exercício? p: qual a chance de essa imagem ser o número 3? ou 8?
  • 98.
    p: o emailé spam? p: o aluno está com dificuldade? p: o aluno domina o conteúdo? p: qual a chance do aluno acertar esse exercício? p: qual a chance de essa imagem ser o número 3? ou 8? p: qual a chance de essa imagem ser um cancêr?
  • 99.
  • 100.
    e o cartãode credito?
  • 101.
    você gastou 50 dia 30 loja 15
  • 102.
    você gastou 30 dia 30 loja 17
  • 103.
    você gastou 25 dia 30 loja 21
  • 104.
    você gastou 25 dia 30 loja 21
  • 105.
    você gastou 2500 dia 30 loja 7
  • 106.
    dia valor loja 30 30 15 30 35 17 30 100 8 1 37 9 30 2500 7
  • 107.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 108.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 109.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 110.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 111.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 112.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 113.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 114.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 valida
  • 115.
    dia valor loja label 30 30 15 0 30 35 17 0 37% de acerto 30 100 8 0 1 37 9 0 30 2500 7 1 valida
  • 116.
    dia valor loja label 30 30 15 0 30 35 17 0 37% de acerto 30 100 8 0 1 37 9 0 30 2500 7 1 valida
  • 117.
    dia valor loja label 30 30 15 0 30 35 17 0 37% de acerto 30 100 8 0 1 37 9 0 30 2500 7 1 eu continuo roubando valida
  • 118.
    regressão logística é, em geral, linear ou lerdíssima
  • 119.
    regressão logística é, em geral, linear ou lerdíssima regularização
  • 120.
    regressão logística é, em geral, linear ou lerdíssima regularização polinômios
  • 121.
    regressão logística é, em geral, linear ou lerdíssima regularização polinômios outras
  • 122.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 123.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 124.
    dia valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1
  • 125.
    dia valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 126.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 127.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 treina 30 2500 7 1 treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 128.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 treina 30 2500 7 1 treina dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina
  • 129.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 treina 30 2500 7 1 treina dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina treina
  • 130.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia treina valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina
  • 131.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia treina valor loja label 30 30 15 0 treina 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 treina treina dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina
  • 132.
    dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina treina
  • 133.
    87% de acerto dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina treina
  • 134.
    87% de acerto dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina o seu telefone toca treina
  • 135.
    87% de acerto dia valor loja label treina 30 30 15 0 30 35 17 0 30 100 8 0 treina 1 37 9 0 30 2500 7 1 treina treina treina o seu telefone toca treina
  • 136.
    p: o emailé spam? http://neuroph.sourceforge.net/
  • 137.
    p: o emailé spam? p: essa movimentação é uma fraude? http://neuroph.sourceforge.net/
  • 138.
    p: o emailé spam? p: essa movimentação é uma fraude? p: qualquer pergunta sim/não como antes? http://neuroph.sourceforge.net/
  • 139.
  • 140.
    dia valor loja 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO
  • 141.
    dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO
  • 142.
    o que éisso? dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE 30 5 BUTECO
  • 143.
    o que éisso? dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR 30 149 CAELUM 1 499 FACULDADE alimentação 30 5 BUTECO
  • 144.
    o que éisso? dia valor loja o que é isso? 30 30 MAX PAD 30 35 MUNI TR profissional 30 149 CAELUM 1 499 FACULDADE alimentação 30 5 BUTECO
  • 145.
    o que éisso? dia valor loja o que é isso? 30 30 MAX PAD profissional 30 35 MUNI TR profissional 30 149 CAELUM 1 499 FACULDADE alimentação 30 5 BUTECO
  • 146.
  • 147.
    p: a movimentação15 é entretenimento ou não? (0 ou 1)
  • 148.
    p: a movimentação15 é entretenimento ou não? (0 ou 1) p: a movimentação 15 é alimentação ou não? (0 ou 1)
  • 149.
    p: a movimentação15 é entretenimento ou não? (0 ou 1) p: a movimentação 15 é alimentação ou não? (0 ou 1) p: a movimentação 15 é profissional ou não? (0 ou 1)
  • 150.
    dia valor loja categoria 30 30 MAX PAD alimentação 30 35 MUNI TR transporte 30 149 CAELUM profissional 1 499 FACULDADE profissional 30 5 BUTECO alimentação
  • 151.
    dia valor loja categoria 30 30 MAX PAD alimentação 30 35 MUNI TR transporte onde estão os 30 149 CAELUM 0 e 1? profissional 1 499 FACULDADE profissional 30 5 BUTECO alimentação
  • 152.
    dia valor loja categoria 30 30 MAX PAD 0 30 35 MUNI TR 1 30 149 CAELUM 2 1 499 FACULDADE 2 30 5 BUTECO 0
  • 153.
    dia valor loja categoria 30 30 MAX PAD 0 30 35 MUNI TR 1 é 0, 1 ou 2? 30 149 CAELUM 2 1 499 FACULDADE 2 30 5 BUTECO 0
  • 154.
    dia valor loja categoria 30 30 MAX PAD é 30 35 MUNI TR resto 30 149 CAELUM resto 1 499 FACULDADE é 30 5 BUTECO resto
  • 155.
    dia valor loja categoria 30 30 MAX PAD é 30 35 MUNI TR resto é 0 ou o resto? 30 149 CAELUM 77% resto 1 499 FACULDADE é 30 5 BUTECO resto
  • 156.
    dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR é 30 149 CAELUM resto 1 499 FACULDADE resto 30 5 BUTECO é
  • 157.
    dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR é é 1 ou o resto? 30 149 CAELUM 53% resto 1 499 FACULDADE resto 30 5 BUTECO é
  • 158.
    dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR resto 30 149 CAELUM é 1 499 FACULDADE é 30 5 BUTECO resto
  • 159.
    dia valor loja categoria 30 30 MAX PAD resto 30 35 MUNI TR resto é 2 ou o resto? 30 149 CAELUM 64% é 1 499 FACULDADE é 30 5 BUTECO resto
  • 160.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 161.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 162.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 163.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0
  • 164.
    dia valor loja label 30 30 15 0 30 35 17 0 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 165.
    dia valor loja label 30 30 15 0 30 35 17 0 77% 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 166.
    dia valor loja label 30 30 15 0 30 35 17 0 77% 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 53% 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 167.
    dia valor loja label 30 30 15 0 30 35 17 0 77% 30 100 8 0 1 37 9 1 30 2500 7 0 entretenimento dia valor loja label 30 30 15 1 53% 30 35 17 0 30 100 8 0 1 37 9 0 30 2500 7 1 alimentação dia valor loja label 30 30 15 0 64% 30 35 17 1 30 100 8 1 1 37 9 0 30 2500 7 0 profissional
  • 168.
    77% entretenimento 53% treina alimentação 64% profissional
  • 169.
    entretenimento treina alimentação profissional
  • 170.
    entretenimento entretenimento treina alimentação profissional
  • 171.
    entretenimento entretenimento treina alimentação você ficou esperando o outro robô aparecer né? profissional
  • 172.
  • 173.
    p: dentre ascategorias A,B,C a qual categoria ele pertence?
  • 174.
    p: dentre ascategorias A,B,C a qual categoria ele pertence? p: o aluno está motivado, desanimado, desiludido, decepcionado, contente ou malandrão?
  • 175.
    o aluno nãoterminou :(
  • 176.
    será que eupoderia ter ajudado ele?
  • 177.
    qto tempo emcada exercício?
  • 178.
    qto tempo emcada exercício? alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15]
  • 179.
    se ele terminao curso em 3 meses ou não
  • 180.
    se ele terminao curso em 3 meses ou não alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15]
  • 181.
    se ele terminao curso em 3 meses ou não alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15] labels = [1, 1, 0, 0]
  • 182.
  • 183.
  • 184.
  • 185.
  • 186.
  • 187.
    e o guilherme? guilherme= [6, 140, 25, 10]
  • 188.
    e o guilherme? guilherme= [6, 140, 25, 10] model.predict(Node.features(guilherme))
  • 189.
  • 190.
  • 191.
  • 192.
  • 193.
    dados fake alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15]
  • 194.
    dados fake alunos = [] alunos << [12, 150, 3, 15] alunos << [4, 170, 32, 25] alunos << [1, 10, 3, 25] alunos << [12, 20, 31, 15] labels = [1, 1, 0, 0]
  • 195.
  • 196.
  • 197.
    dados reais C utilizado ACERTOS NO TREINO PREVISOES COM AC 0.08! 93.18%! 85.71%
  • 198.
    dados reais C utilizado ACERTOS NO TREINO PREVISOES COM AC 0.08! 93.18%! 85.71% C utilizado! ! ACERTOS NO TREINO!PREVISOES 0.001! ! ! 70.45454545454545!61.90476190476190 0.04! ! ! 88.63636363636364!71.42857142857143 0.08! ! ! 93.18181818181819!85.71428571428571 0.2! ! ! 100.0! ! ! 100.0
  • 199.
    dados reais C utilizado ACERTOS NO TREINO PREVISOES COM AC 0.08! 93.18%! 85.71% C utilizado! ! ACERTOS NO TREINO!PREVISOES 0.001! ! ! 70.45454545454545!61.90476190476190 0.04! ! ! 88.63636363636364!71.42857142857143 0.08! ! ! 93.18181818181819!85.71428571428571 0.2! ! ! 100.0! ! ! 100.0
  • 200.
  • 201.
    p: dentre ascategorias A,B,C a qual categoria ele pertence?
  • 202.
    p: dentre ascategorias A,B,C a qual categoria ele pertence? p: o aluno vai desistir do curso? p: essa pessoa tem perfil de terrorista?
  • 203.
  • 204.
  • 205.
  • 206.
    user id 15?? user id 17
  • 207.
    user id 15?? user id 17 user id 15 ?==? user id 17
  • 208.
    user id 15?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397
  • 209.
    user id 15?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397 dificuldade != facilidade
  • 210.
    user id 15?? user id 17 user id 15 ?==? user id 17 333784321236738126783 ?==? 1238793923832178612397 dificuldade != facilidade
  • 211.
  • 212.
  • 213.
    características em comum númerode respostas erradas altura???
  • 214.
    características em comum númerode respostas erradas altura??? tempo gasto
  • 215.
    características em comum númerode respostas erradas altura??? tempo gasto número de exercícios feitos
  • 216.
    características em comum númerode respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados
  • 217.
    características em comum númerode respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos
  • 218.
    características em comum númerode respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes
  • 219.
    características em comum númerode respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes cursos
  • 220.
    características em comum númerode respostas erradas altura??? tempo gasto número de exercícios feitos feedbacks dados notas de feedback recebidos likes cursos quantidade de caracteres
  • 221.
  • 222.
  • 223.
  • 224.
  • 225.
  • 226.
  • 227.
  • 228.
  • 229.
  • 230.
  • 231.
  • 232.
  • 233.
    e melhora... e melhora... emelhora... e melhora...
  • 234.
    e melhora... e melhora... emelhora... e melhora... e melhora...
  • 235.
    e melhora... e melhora... emelhora... e melhora... e melhora... e melhora...
  • 236.
    e melhora... e melhora... emelhora... e melhora... e melhora... e melhora... e melhora...
  • 237.
  • 238.
    grupos esperados: muitas perguntas, poucos erros, muitos erros poucas perguntas poucos erros, poucas perguntas, ajuda bastante
  • 239.
    grupos esperados: X muitas perguntas, poucos erros, muitos erros poucas perguntas poucos erros, poucas perguntas, ajuda bastante
  • 240.
    grupos esperados: X X muitas perguntas, poucos erros, muitos erros poucas perguntas poucos erros, poucas perguntas, ajuda bastante
  • 241.
    grupos esperados: X X muitas perguntas, poucos erros, muitos erros poucas perguntas X poucos erros, poucas perguntas, ajuda bastante
  • 242.
  • 243.
  • 244.
    grupos encontrados: muitas perguntas, muitos erros, poucos erros poucas perguntas
  • 245.
    grupos encontrados: muitas perguntas, muitos erros, poucos erros poucas perguntas muitos erros, poucas perguntas, ajuda bastante
  • 246.
    grupos encontrados: muitas perguntas, muitos erros, poucos erros poucas perguntas muitos erros, poucas perguntas, ajuda bastante entre outros
  • 247.
    p: como meus_____ se agrupam?
  • 248.
    p: como meus_____ se agrupam? p: como os alunos se comportam?
  • 249.
    p: como meus_____ se agrupam? p: como os alunos se comportam? p: como os instrutores se comportam?
  • 250.
    p: como meus_____ se agrupam? p: como os alunos se comportam? p: como os instrutores se comportam? p: como os exercícios se comportam?
  • 251.
    p: como meusclientes se agrupam?
  • 252.
    p: como meusclientes se agrupam? p: como meus produtos se agrupam?
  • 253.
    p: como meusclientes se agrupam? p: como meus produtos se agrupam? p: como minhas features se agrupam?
  • 254.
    p: como meusclientes se agrupam? p: como meus produtos se agrupam? p: como minhas features se agrupam? p: como os clientes usam o sistema?
  • 255.
  • 256.
  • 257.
  • 258.
  • 259.
    machine learning regressão linear classificadores redes neurais
  • 260.
    machine learning regressão linear classificadores redes neurais logistic
  • 261.
    machine learning regressão linear classificadores redes neurais logistic k-cluster
  • 262.
    a média debugs de uma equipe é X
  • 263.
    a média debugs de uma equipe é X “nessa equipe está Y” metricminer.org.br
  • 264.
    se usar ocomputador
  • 265.
    se usar ocomputador
  • 266.
    se usar ocomputador não dirija
  • 267.
  • 268.
  • 269.
  • 270.
  • 271.
  • 272.
  • 273.
  • 274.
  • 275.
  • 276.
  • 277.
  • 278.
  • 279.
  • 280.
  • 281.
  • 282.
  • 283.
    detectando... margem de erro
  • 285.
    o que vocêquer saber sobre um cliente?
  • 286.
    o que vocêquer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo?
  • 287.
    o que vocêquer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam?
  • 288.
    o que vocêquer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam? como seus itens se agrupam?
  • 289.
    o que vocêquer saber sobre um cliente? o que o cliente quer saber sobre ele mesmo? como os clientes se agrupam? como seus itens se agrupam? quando o cliente fará algo?
  • 291.
  • 292.
    nós respondemos 2 levante as suas
  • 293.

Notas do Editor