Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
1
Quem é Marcel ?
Marcel Pinheiro Caraciolo - @marcelcaraciolo
Mestrando em Ciência da Computação no CIN/UFPE na área de min...
Como comecei esta análise ?
20 hrs atrás no Hotel....
3
Scraping do PythonBrasil
Mini-Crawler para extrair as palestras aprovadas
urllib2,BeautifulSoap, regex...
4
Dilema
Esses dados são Públicos ??
Não ? Podemos negociar ein ...
5
Alguns dados interessantes
6
48 Palestras aceitas
2160 minutos de Palestras
7
Ou seja
=˜388.800 tweets postados
8
Ou assistir
Todas temporadas Big Bang Theory
Toda a Saga Star Wars 2x
9
Na nossa língua agora...
Zerar Super Mario 216 x
http://video.google.com/videoplay?docid=-8297067084319900351&q=mario#
10
Na nossa língua agora...
Abrir o Eclipse 2 vezes!
11
Total de Pontos recebidos:
4812
12
Convertendo em votos
Não dava para eleger Tiririca, mas
Mas veja conseguimos um número perfeito!
4812 MB = Capacidade de u...
Palestra Hackeada
Dinf & C3SL infra estrutura - 999 vontos
Apelão mesmo!
14
Distribuição das palestras
Ainda precisamos distribuir
melhor o nível das
palestras!
Avançado
2%
Intermediario
56%
Basico
...
Distribuição das palestras
16
Temas mais frequentes
Temas relacionados a desenvolvimento, dados, sistemas, linguagem,
ferramentas, django
A partir dos r...
Temas mais frequentes
Mas como ver a distribuição dos temas
18
Temas mais frequentes
Mas ainda fica difícil de distinguir!
19
Distribuição das palestras
Utilizado o algoritmo de clustering K-means
Ferramenta de visualização em Python UbiGraph
DEMO
...
Distribuição das palestras
Ferramenta de visualização UbiGraph
Inteligencia Artificial
Hardware
Web (Django e AppEngine)
Em...
RESUMO
Excelente nível de palestras!
Submetam seus trabalhos, vocês podem
estar aqui também!
Engaje, colabore e divulgue!
...
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
23
Marcel Caraciolo - @marcelcaraciolo
Mineração de Palestras
23
Próximos SlideShares
Carregando em…5
×

Análise das Palestras do PythonBrasil [6]

2.320 visualizações

Publicada em

My lecture at PythonBrasil about Data mining applied on the lectures of Python Brasil. Lighting talk - PythonBrasil - Curitiba -22/10/2010

Publicada em: Tecnologia
0 comentários
2 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
2.320
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1.128
Ações
Compartilhamentos
0
Downloads
6
Comentários
0
Gostaram
2
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Análise das Palestras do PythonBrasil [6]

  1. 1. Marcel Caraciolo - @marcelcaraciolo Mineração de Palestras 1
  2. 2. Quem é Marcel ? Marcel Pinheiro Caraciolo - @marcelcaraciolo Mestrando em Ciência da Computação no CIN/UFPE na área de mineração de dados Diretor de Pesquisa e Desenvolvimento na Orygens Membro e Moderador da Celúla de Usuários Python de Pernambuco (PUG-PE) Minhas áreas de interesse: Computação móvel e Computação inteligente Meus blogs: http://www.mobideia.com (sobre Mobilidade desde 2006) http://aimotion.blogspot.com (sobre I.A. desde 2009) Jovem Aprendiz ainda nas artes pythonicas.... (desde 2007) Sergipano, porém Recifense. 2
  3. 3. Como comecei esta análise ? 20 hrs atrás no Hotel.... 3
  4. 4. Scraping do PythonBrasil Mini-Crawler para extrair as palestras aprovadas urllib2,BeautifulSoap, regex... 4
  5. 5. Dilema Esses dados são Públicos ?? Não ? Podemos negociar ein ... 5
  6. 6. Alguns dados interessantes 6
  7. 7. 48 Palestras aceitas 2160 minutos de Palestras 7
  8. 8. Ou seja =˜388.800 tweets postados 8
  9. 9. Ou assistir Todas temporadas Big Bang Theory Toda a Saga Star Wars 2x 9
  10. 10. Na nossa língua agora... Zerar Super Mario 216 x http://video.google.com/videoplay?docid=-8297067084319900351&q=mario# 10
  11. 11. Na nossa língua agora... Abrir o Eclipse 2 vezes! 11
  12. 12. Total de Pontos recebidos: 4812 12
  13. 13. Convertendo em votos Não dava para eleger Tiririca, mas Mas veja conseguimos um número perfeito! 4812 MB = Capacidade de um DVD! 13
  14. 14. Palestra Hackeada Dinf & C3SL infra estrutura - 999 vontos Apelão mesmo! 14
  15. 15. Distribuição das palestras Ainda precisamos distribuir melhor o nível das palestras! Avançado 2% Intermediario 56% Basico 42% Avançado Intermediario Basico 15
  16. 16. Distribuição das palestras 16
  17. 17. Temas mais frequentes Temas relacionados a desenvolvimento, dados, sistemas, linguagem, ferramentas, django A partir dos resumos 17
  18. 18. Temas mais frequentes Mas como ver a distribuição dos temas 18
  19. 19. Temas mais frequentes Mas ainda fica difícil de distinguir! 19
  20. 20. Distribuição das palestras Utilizado o algoritmo de clustering K-means Ferramenta de visualização em Python UbiGraph DEMO 20
  21. 21. Distribuição das palestras Ferramenta de visualização UbiGraph Inteligencia Artificial Hardware Web (Django e AppEngine) Empreendorismo Padrões e Práticas Ferramentas Testes Mineração de Dados http://ubietylab.net/ubigraph/ 21
  22. 22. RESUMO Excelente nível de palestras! Submetam seus trabalhos, vocês podem estar aqui também! Engaje, colabore e divulgue! 22
  23. 23. Marcel Caraciolo - @marcelcaraciolo Mineração de Palestras 23
  24. 24. Marcel Caraciolo - @marcelcaraciolo Mineração de Palestras 23

×