2. Apenas um rapaz latino americano...
• Engenheiro de Computação
Graduação-MSc-(defesa PhD 10/12/12) IC-Unicamp
• Desenvolvedor1996, hoje na Globo.com )
(no mercado desde
e Projetista de Software
• Entusiasta de FLOSS 1999)
(atuante na comunidade desde
2
11. Quantos conceitos ?
Em que ordem eles apareceram ?
Como categorizá-los ?
De onde vieram ?
6
12. Quantos conceitos ?
Em que ordem eles apareceram ?
Como categorizá-los ?
De onde vieram ?
Quais as relações entre os conceitos ?
6
13. Quantos conceitos ?
Em que ordem eles apareceram ?
Como categorizá-los ?
De onde vieram ?
Quais as relações entre os conceitos ?
Quais são relevantes para mim agora ?
6
14. Quantos conceitos ?
Em que ordem eles apareceram ?
Como categorizá-los ?
De onde vieram ?
Quais as relações entre os conceitos ?
Quais são relevantes para mim agora ?
...
6
15. Quantos conceitos ?
Em que ordem eles apareceram ?
Como categorizá-los ?
De onde vieram ?
Quais as relações entre os conceitos ?
Quais são relevantes para mim agora ?
...
[Miller 1956] regra 7±2: capacidade cognitiva é limitada
6
29. O que há de errado ?
1. Única categoria para conteúdo Multi-facetado
11
30. O que há de errado ?
1. Única categoria para conteúdo Multi-facetado
2. Categorias definidas manualmente
11
31. O que há de errado ?
1. Única categoria para conteúdo Multi-facetado
2. Categorias definidas manualmente
3. Critério não é explícito
11
32. O que há de errado ?
1. Única categoria para conteúdo Multi-facetado
2. Categorias definidas manualmente
3. Critério não é explícito
4. Relação estática de pertinência
11
33. O que há de errado ?
1. Única categoria para conteúdo Multi-facetado
2. Categorias definidas manualmente
3. Critério não é explícito
4. Relação estática de pertinência
5. Organização não é reutilizável
11
45. Reorganizar conteúdo dinamicamente
Autor Data de Publicação
Data de Publicação Autor
Alice
2011 Artigo 1
2008 Artigo 2
Beto
2011 Artigo 3
15
46. Reorganizar conteúdo dinamicamente
Autor Data de Publicação
Data de Publicação Autor
Alice 2011
2011 Artigo 1 Alice
2008 Artigo 2 Beto
Beto 2008
2011 Artigo 3 Alice
15
47. Reorganizar conteúdo dinamicamente
Autor Data de Publicação
Data de Publicação Autor
Alice 2011
2011 Alice Artigo 1
2008 Artigo 2 Beto
Beto 2008
2011 Artigo 3 Alice
15
48. Reorganizar conteúdo dinamicamente
Autor Data de Publicação
Data de Publicação Autor
Alice 2011
2011 Alice Artigo 1
2008 Beto
Beto 2008
2011 Artigo 3 Alice Artigo 2
15
49. Reorganizar conteúdo dinamicamente
Autor Data de Publicação
Data de Publicação Autor
Alice 2011
2011 Alice Artigo 1
2008 Beto Artigo 3
Beto 2008
2011 Alice Artigo 2
15
50. Reorganizar conteúdo dinamicamente
a TAREFA é importante!
Autor Data de Publicação
Data de Publicação Autor
Alice 2011
2011 Alice Artigo 1
2008 Beto Artigo 3
Beto 2008
2011 Alice Artigo 2
15
61. Organografos
... são artefatos que tornam explícito como organizar
informação digital no contexto de uma tarefa específica.
19
62. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
Autor do
Organofrafo
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
63. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
• patterns
• dictionaries
• rules
• probabilities Autor do
Organofrafo
• templates/wrappers
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
64. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
• matching
• dice
• jaccard Autor do
• overlap Organofrafo
• cosine
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
65. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
• FOAF
• Dbpedia
• Schema.org Autor do
• Freebase Organofrafo
• MusicBrainz
• Geonames
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
66. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
• Naive Bayes
• SVM
• Nearest Neighbors
Autor do
Organofrafo
• LDA
• LSI
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
67. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
• Filesystem
• Gmail
• Evernote Autor do
Organofrafo
• Delicious
• Dropbox, Box
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
68. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
• Fuse, Dokan
• Infoviz do
Autor
Organofrafo
• D3
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
69. Papéis
Autoria de Organografo
NLP Domínio ML Data UX
Container
Autor do
Organofrafo
Organografo
Extração de Similaridade Classificadores Algoritmos de
Informação Ontologias Iteradores Visualização
Algoritmos Tarefa !
20
76. Extração
NLTK
Pre-processamento
BeautifulSoup
pyPdf
Hierarquia
de Origem
77. pymongo
Índice de
Facetas
Extração
NLTK
Pre-processamento
BeautifulSoup
pyPdf
Hierarquia
de Origem
78. Workflow de Transformação
pymongo
Índice de
Facetas
Extração
NLTK
Pre-processamento
BeautifulSoup
pyPdf
Hierarquia
de Origem
79. Workflow de Transformação
pymongo
Índice de
Facetas
numpy scikit-learn
NLTK Extração networkx gensim
Pre-processamento
BeautifulSoup
pyPdf
Hierarquia
de Origem
80. Workflow de Transformação
pymongo
Índice de
Facetas
numpy scikit-learn
NLTK Extração networkx gensim
Pre-processamento
Hierarquia
Resultante
BeautifulSoup Visualização
pyPdf
Hierarquia
de Origem
81. Workflow de Transformação
pymongo
Índice de
Facetas
numpy scikit-learn
NLTK Extração networkx gensim
Pre-processamento
Hierarquia
Resultante
BeautifulSoup Visualização D3.js
pyPdf InfoViz.js
Hierarquia
ObsPy
de Origem matplotlib
82. Workflow de Transformação
pymongo
Índice de
Facetas
numpy scikit-learn
NLTK Extração networkx gensim
Navegação da
Pre-processamento
Hierarquia Hierarquia
Resultante
BeautifulSoup Iterador Visualização D3.js
pyPdf InfoViz.js
Hierarquia
ObsPy
de Origem matplotlib
83. Workflow de Transformação
pymongo
Índice de
Facetas
numpy scikit-learn
NLTK Extração networkx gensim
Navegação da
Pre-processamento
Hierarquia Hierarquia
Resultante
BeautifulSoup Iterador Visualização D3.js
pyPdf InfoViz.js
os.walk
Hierarquia evernote ObsPy
de Origem pydelicious matplotlib
85. Resumo
• Organografos: metodologia, arquitetura,utilização
• Capturar a tarefa por trás de uma organização
• Avaliar, reorganizar e compartilhar.
27
86. Agradecimentos
• Laboratório de Sistemas de Informação (IC-Unicamp)
http://www.lis.ic.unicamp.br
• Brazilian Institute for Web Science Research
http://webscience.org.br
• Globo.com
28
87. Obrigado a todos
pela atenção.
Rodrigo Dias Arruda Senra
http://rodrigo.senra.nom.br
rsenra@acm.org
As opiniões e conclusões expressas nesta apresentação são de exclusiva responsabilidade de Rodrigo Senra.
Não é necessário requisitar permissão do autor para o uso de partes ou do todo desta apresentação, desde que
não sejam feitas alterações no conteúdo reutilizado e que esta nota esteja presente na íntegra no material
resultante. Em caso de alterações, favor consultar o autor.
Imagens e referências para outros trabalhos nesta apresentação permanecem propriedade daqueles que detêm
seus direitos de copyright.
88. Execução de Organografo
Workflow de Transformação
Índice de
Facetas
FCat()
Extração FHil()
Navegação da
Pre-processamento
Hierarquia Hierarquia
Resultante
Iterador
Hierarquia
de Origem Usuário do Organografo Visualização