Nesta apresentação mostro um estudo realizado pela universidade de Munique que visa prever a probabilidade de um personagem morrer na próxima temporada de acordo com 24 características pré-selecionadas
5. Estudo de caso 1:
Professores e alunos da Universidade Técnica
de Munique, na Alemanha, desenvolveram um
algoritmo capaz de prever quem iria morrer na
6ª temporada da série popular da HBO.
6. Onde essa história começa?
Eles também conseguiram descobrir qual casa
é a mais perigosa e a opinião do público sobre
os personagens com base em dados do
Twitter
8. Um programa que realiza previsões depois
de juntar 24 fatores diferentes sobre cada
personagem, como:
sua idade, seu sexo, suas relações e se
seus pais estão vivos.
Por fim, a probabilidade de morrer, de
acordo com o algoritmo desenvolvido.
9. ” Este projeto tem sido muito divertido para nós”
”Em seu trabalho diário, o nosso grupo de pesquisa
concentra-se em responder a perguntas biológicas
complexas usando algoritmos de aprendizagem de
máquina e mineração de dados”
(Dr. Guy Yachdav – lider do projeto)
12. É um sub-campo da inteligência artificial
dedicado ao desenvolvimento de algoritmos
e técnicas que permitam ao computador
aprender, isto é, que permitam ao
computador aperfeiçoar seu desempenho
em alguma tarefa.
13. Não é mágica!
Em vez disso, ele aprende a partir de um
número suficientemente grande de exemplos
do passado para compilar automaticamente
estatísticas sobre eles e para prever se um
evento é provável que aconteça no futuro.
14. A Song of Ice and Fire série é conhecida por
ter matado muitos personagens...
Será que a morte veio ao acaso ou vem para
apenas aqueles selecionados que exibem
características semelhantes?
15. A Song of Ice and Fire série é conhecida por
ter matado muitos personagens...
Será que a morte veio ao acaso ou vem para
apenas aqueles selecionados que exibem
características semelhantes?
18. Usando o wiki de Gelo e Fogo resumiram as
informações de todos os 5 livros sobre cada
personagem.
Também extraído outras informações (isto é,
características) que descrevem um personagem, o
que resultou em um total de mais de 30
características diferentes!
20. Aprendizagem máquina pode estatisticamente
comparar as características dos personagens
mortos e vivos e selecione os recursos que são mais
relevantes para a distinção entre eles. Nós
fornecemos todos os recursos juntamente com a
lista de todos os nomes de personagens como
entrada para o algoritmo de aprendizado de
máquina.
21.
22. As 24 características seguintes foram selecionados
como mais contribuiu (ordenados do mais para o
menos contribuindo):
26. Support Vector Machine
- conjunto de métodos do aprendizado
supervisionado que analisam os dados e
reconhecem padrões, usado para classificação
e análise de regressão
27. Support Vector Machine
- O SVM padrão toma como entrada um
conjunto de dados e prediz, para cada entrada
dada, qual de duas possíveis classes a entrada
faz parte, o que faz do SVM um classificador
linear binário não probabilístico
- Kernel polinomial
- Otimização sequencial mínima
28. • Os dados foram divididos em 10
subconjuntos de tamanho igual;
• Foi treinado com 9 subconjuntos e testado
com o restante;
• Processo de validação cruzada(cross-
validation)
29. A precisão/exatidão e cobertura do método de previsão
usando indicadores:
- TP (verdadeiros positivos, ou seja, previu corretamente
personagens mortos)
- PF (falsos positivos, ou seja, personagens vivas previsto para
ser mortos)
- FN (falsos negativos, ou seja, personagens mortos previsto
para ser vivo)
- TN (verdadeiros negativos, ou seja, previu corretamente
personagens vivos).
30. Indicadores
Precision = TP / (TP + FP)
Recall = TP / (TP+FN)
Combinaram 2 medidas em um valor único:
F-meansure = 2*((Precision*Recall )/(Precision + Recall))