Flink 
Semantic Web Technology for the Extraction 
and Analysis of Social Networks 
Peter Mika, 2005 
Junior Grossi && Paloma Diesel 
Dezembro/2013 | PPGCI UFMG
Peter Mika? 
● Yahoo! Research 
(Barcelona, Espanha) 
● Semantic Web, Search, 
Web Mining 
● Flink (2005) - Web - Java 
● Livro "Social Networks and the 
Semantic Web" (2007)
Flink (Origem) 
● Sucesso da Web 
○ Divulgação de informações pessoais 
○ Redes Sociais (Friendster - 5M users [2005]) 
● Redes Sociais 
○ Informações comuns 
entre os sites 
○ Os mesmos dados 
mantidos em sites 
diferentes
Flink (Origem) 
● FOAF Project (www.foaf-project.org) 
○ Iniciativa parte do usuário 
○ Semântica dos dados pessoais 
■ Links nas páginas (meta tag) 
■ rdfs:seeAlso 
Pessoa 
Pessoa 
Pessoa
Flink (Origem) 
● Utilizar FOAF 
○ Formar "Social Intellingence" 
○ Coletar informações pessoais de pesquisadores 
■ Web pages, e-mails, publicações 
○ "FOAF ontology" 
● 608 pesquisadores de Web Semântica 
○ Links de um pesquisador 
■ Informações pessoais 
■ "Rede Social de Pesquisador"
Flink 
● Dados Coletados (cada pesquisador) 
○ Informações pessoais 
○ Localização geográfica 
○ Interesses 
○ Participação em eventos de Web Semântica 
○ Publicações escritas sobre Web Semântica 
● Resultados 
○ 5147 publicações 
○ 8185 mensagens para grupos de discussão
Ontologia (Tópicos de Pesquisa)
Fontes de Dados
Recursos 
● Web mining (Google) 
○ Conferir área de atuação de pesquisador 
■ Crawler 
■ Google Mindshare (#) 
● NP Interesses / NP Pesquisador (>=0) 
● FOAF 
○ Crawler RDF para coletar perfis (scutter) 
○ Análise das triplas com predicados RDF, RDFs
Recursos 
● E-mails 
○ Download POP3 ou IMAP 
○ Header capturado em RDF 
● Publicação 
○ Google Scholar
Armazenamento 
● Sesame Server (http://openrdf.org) 
○ Deploy de RDF 
■ SQL DB, filesystem, in-memory, etc 
○ Suporta SPARQL 
○ Suporta milhões de triplas
Análises 
● Interpretação das Redes 
● Erros / Ambiguidade 
● Ruídos (pequenas falhas)
Trabalhos Relacionados 
● Ontology-based knowledge management 
○ On-To-Knowledge && SEKT Project 
○ Coleta de dados manualmente 
■ Entrevistas e questionários 
● Emails como foco principal 
● FOAF 
○ Paolillo && Wright
Conclusão e Trabalho Futuro 
● Desafios 
1. Extração, representação e agregação de 
informações sociais 
2. Ontologia Social 
■ Classificar relacionamentos 
3. Criação de padrões sociais 
■ Identificar relacionamentos 
■ Utilizando dados eletrônicos 
● + Performance 
● + Escalabilidade Horizontal
Obrigado! 
Perguntas?

Flink (Peter Mika) - Semantic Web

  • 1.
    Flink Semantic WebTechnology for the Extraction and Analysis of Social Networks Peter Mika, 2005 Junior Grossi && Paloma Diesel Dezembro/2013 | PPGCI UFMG
  • 2.
    Peter Mika? ●Yahoo! Research (Barcelona, Espanha) ● Semantic Web, Search, Web Mining ● Flink (2005) - Web - Java ● Livro "Social Networks and the Semantic Web" (2007)
  • 3.
    Flink (Origem) ●Sucesso da Web ○ Divulgação de informações pessoais ○ Redes Sociais (Friendster - 5M users [2005]) ● Redes Sociais ○ Informações comuns entre os sites ○ Os mesmos dados mantidos em sites diferentes
  • 4.
    Flink (Origem) ●FOAF Project (www.foaf-project.org) ○ Iniciativa parte do usuário ○ Semântica dos dados pessoais ■ Links nas páginas (meta tag) ■ rdfs:seeAlso Pessoa Pessoa Pessoa
  • 5.
    Flink (Origem) ●Utilizar FOAF ○ Formar "Social Intellingence" ○ Coletar informações pessoais de pesquisadores ■ Web pages, e-mails, publicações ○ "FOAF ontology" ● 608 pesquisadores de Web Semântica ○ Links de um pesquisador ■ Informações pessoais ■ "Rede Social de Pesquisador"
  • 7.
    Flink ● DadosColetados (cada pesquisador) ○ Informações pessoais ○ Localização geográfica ○ Interesses ○ Participação em eventos de Web Semântica ○ Publicações escritas sobre Web Semântica ● Resultados ○ 5147 publicações ○ 8185 mensagens para grupos de discussão
  • 8.
  • 9.
  • 10.
    Recursos ● Webmining (Google) ○ Conferir área de atuação de pesquisador ■ Crawler ■ Google Mindshare (#) ● NP Interesses / NP Pesquisador (>=0) ● FOAF ○ Crawler RDF para coletar perfis (scutter) ○ Análise das triplas com predicados RDF, RDFs
  • 11.
    Recursos ● E-mails ○ Download POP3 ou IMAP ○ Header capturado em RDF ● Publicação ○ Google Scholar
  • 12.
    Armazenamento ● SesameServer (http://openrdf.org) ○ Deploy de RDF ■ SQL DB, filesystem, in-memory, etc ○ Suporta SPARQL ○ Suporta milhões de triplas
  • 13.
    Análises ● Interpretaçãodas Redes ● Erros / Ambiguidade ● Ruídos (pequenas falhas)
  • 14.
    Trabalhos Relacionados ●Ontology-based knowledge management ○ On-To-Knowledge && SEKT Project ○ Coleta de dados manualmente ■ Entrevistas e questionários ● Emails como foco principal ● FOAF ○ Paolillo && Wright
  • 15.
    Conclusão e TrabalhoFuturo ● Desafios 1. Extração, representação e agregação de informações sociais 2. Ontologia Social ■ Classificar relacionamentos 3. Criação de padrões sociais ■ Identificar relacionamentos ■ Utilizando dados eletrônicos ● + Performance ● + Escalabilidade Horizontal
  • 16.