O documento discute o projeto Numerólogos, que usa análise de dados e geração automática de texto para relatar estatísticas esportivas. O projeto inicial criou um blog em 2016 e expandiu seu escopo em 2017-18 para cobrir mais métricas de futebol. Sistemas de inteligência artificial consolidam dados e geram artigos sobre os principais destaques numéricos de cada rodada. O objetivo é fornecer insights rapidamente através de relatórios automáticos e imparciais.
2. Globalcode – Open4education
Agenda
• Quem somos
• Motivação
• História
• Blog Numerólogos (2016)
• Dados disponíveis
• Desafios
• Por dentro das Tecnologias
• Novo Blog Numerólogos (2017-18)
• Conclusão
26. Globalcode – Open4education
Motivação NLG
• Análise rápida de uma grande massa de dados
• Análise imparcial dos dados
• Facilitar o consumo da informação
30. Globalcode – Open4education
Características
• Agnóstico em relação ao domínio
• Ciente do contexto do que está sendo escrito
• Organiza os dados automaticamente
• Descobre um caminho para navegar pelos dados
• Uso de variações com a mesma semântica
• From zero to hero
35. Globalcode – Open4education
Algoritmo de Agrupamento
1.Início: um grupo aleatório
2.Vizinhança
a.Nova partição (grupo)
b.Remoção de uma partição
c.Swap de relacionamentos
3.Restart quando não há melhorias
4.Output: agrupamento de melhor
qualidade
37. Globalcode – Open4education
Templates
• Turbinados: entidades + contexto
• Entidades se auto-descrevem
• Frases, conexões e resumos
• Balde de templates
• Desenvolvedor define:
• Aplicabilidade
• Corpo do template
• O sistema faz o resto
39. Globalcode – Open4education
Escolhendo templates
• Quais templates devemos pegar do balde?
• Templates variam:
• mais genéricos
• mais específicos
• Repetição de templates torna o texto
robótico
40. Globalcode – Open4education
Algoritmo de Escolha de Templates
1.Inicialização: greedy
2.Baseado em BnB (Branch and Bound)
• maximizar o uso de templates valiosos
• minimizar a repetição de templates
3.Busca em profundidade (depth-first)
4.Relaxamento: ignora o reuso
43. Globalcode – Open4education
Football Fever - Resumo
• Eventos de gol não
são independentes
• Há um reforço
• Modelo: Distribuição
Binomial Negativa
47. Globalcode – Open4education
Números da rodada #1
O Atlético-MG foi um dos destaques aparecendo em três
estatísticas. No 1 a 0 sobre o Corinthians o time mineiro
passou errado 41 vezes. Ainda no duelo, faltou compaixão
pelo time adversário por parte do Galo das Américas, que
causou 25 faltas. No entanto, o clube roubou 28 bolas,
com destaque para o meio-campo Gustavo Blanco, que
somou 8.
49. Globalcode – Open4education
Resumo dos Projetos
• Variedade: mais de 60 estatísticas disponíveis
• Jogadores
• Times
• Campeonato
• Agilidade na produção de matérias
• Geração automática do texto
• Identificação dos fatos mais relevantes
• Geração de infográfico
53. Globalcode – Open4education
Possibilidades Futuras
• Previsão do tempo personalizada
• Situação do trânsito na cidade
• Principais destaques diários da bolsa
• Resultados de pesquisas (e.g. eleições)
• Outros esportes
• E-Sports