UNIVERSIDADE DE LISBOA<br />FACULDADE DE CIÊNCIAS<br />DEPARTAMENTO DE INFORMÁTICA<br />UMA METODOLOGIA PARA CONSTRUÇÃO DE...
GEO-ONTOLOGIA<br /><ul><li>Geo-ontologia: um conjunto de conceitosgeográficos e relacionamentosgeográficosdefinidosformalm...
Integrar base de dados e textos (85%)</li></ul>2<br />
3<br />PROBLEMA CONCRETO<br />INE<br />Nomenclatura de Unidade Territorial (NUT) 1,2,3<br />CTT<br />Distrito, Concelho, F...
SUMÁRIO<br />4<br /><ul><li>Desafios
Solução Proposta
Estado da Arte
GeographicKnowledge Base (GKB)
Geograficidade
Sistema de Extração e Integração de Conhecimento Geográfico (SEI-Geo)
Metodologia Proposta
Contribuições</li></li></ul><li>DESAFIOS<br />Informação em bases de dados geográficas com baixa qualidade, escondida e su...
SOLUÇÃO PROPOSTA<br />6<br />
ESTADO DA ARTE<br />Representação de conhecimento<br />7<br />
	Sistemas de extração e integração de informação geográfica<br />8<br />ESTADO DA ARTE<br />
Metodologias para construção de ontologias<br />9<br />ESTADO DA ARTE<br />
SISTEMA DE GESTÃO DE CONHECIMENTO GEOGRÁFICO<br />Ambiente de extração e integração de conhecimento geográfico<br />Fontes...
Relacionamento<br />MODELO CONCEITUAL DA GKB<br />Tipo de relacionamento<br />Entidade Geográfica<br />Nome de Entidade<br...
Próximos SlideShares
Carregando em…5
×

Phd Marcirio Chaves

540 visualizações

Publicada em

Apresentação de tese de doutoramento.

Publicada em: Educação, Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
540
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
4
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • Ontologias raramente usadas fora do ambiente de pesquisa.Raro reuso de conhecimentoLN ambígua
  • Menos de 15% dos termos formados por 2 palavras.
  • Menos de 15% dos termos formados por 2 palavras.Exemplo ambiguidade: Castelo Branco
  • Bacelo é uma freguesia pertencente ao concelho de Évora localizado a 130 km de Lisboa.Padrões do tipo Hearst traduzidospara o português e estendidose.g.: ‘é o distrito’, ‘é um concelho’ e ‘é uma das cidades’ ‘[Nome de local] é um (d[eao]s?)? [Conceito]’ e ‘[Conceito] tal(is) como [Nome de local]’ Métricos: descrevemproximidade (e.g. ‘km’, ‘minutos’ e ‘cerca de’) Direcionais: ‘aolado’, ‘atrás’ e ‘emfrente’ Fuzzy: proximidadeatravés da utilização de termosqualitativos e imprecisos (e.g. ‘próximo’, ‘perto’ e ‘acima’) Orientação: expressosatravés de cardinais (e.g. ‘norte’, ‘sul’, ‘leste’ e ‘oeste’) Adjetivos: capital(ais), litoral(ais), longe, natural(ais) e procedente(s). Advérbios: ‘cá’, ‘aqui’ e ‘lá’. Verbos: chegar, era, falecer, morar, etc... Nomes de Entidades: ocorrências das geo-ontologias (WGO + Geo-Net-PT).Os valores da Geo-Net-PT incluemos top 10 conceitos da geo-ontologia, até o nível de freguesia. PAI,NT1,NT2,NT3,REG,PRO,DST,ILH,CON,FRG
  • Phd Marcirio Chaves

    1. 1. UNIVERSIDADE DE LISBOA<br />FACULDADE DE CIÊNCIAS<br />DEPARTAMENTO DE INFORMÁTICA<br />UMA METODOLOGIA PARA CONSTRUÇÃO DE GEO-ONTOLOGIAS<br />Marcirio Silveira Chaves<br />Orientadores: Mário J. Silva e Diana Santos<br />Doutoramento em Informática<br />Especialidade Engenharia Informática<br />Lisboa, 16 de outubro de 2009.<br />
    2. 2. GEO-ONTOLOGIA<br /><ul><li>Geo-ontologia: um conjunto de conceitosgeográficos e relacionamentosgeográficosdefinidosformalmente e semambiguidade.</li></ul>Serve para:<br /><ul><li>Normalização de terminologia
    3. 3. Integrar base de dados e textos (85%)</li></ul>2<br />
    4. 4. 3<br />PROBLEMA CONCRETO<br />INE<br />Nomenclatura de Unidade Territorial (NUT) 1,2,3<br />CTT<br />Distrito, Concelho, Freguesia<br />Geo-<br />Ontologia<br />Wikipedia e textos <br />Província, região, aldeia<br />ISO 19109<br />Feature, feature type<br />
    5. 5. SUMÁRIO<br />4<br /><ul><li>Desafios
    6. 6. Solução Proposta
    7. 7. Estado da Arte
    8. 8. GeographicKnowledge Base (GKB)
    9. 9. Geograficidade
    10. 10. Sistema de Extração e Integração de Conhecimento Geográfico (SEI-Geo)
    11. 11. Metodologia Proposta
    12. 12. Contribuições</li></li></ul><li>DESAFIOS<br />Informação em bases de dados geográficas com baixa qualidade, escondida e sub-utilizada<br />Ontologias carecem de ocorrências e, na prática, não estão disponíveis<br />Tratamento de informação geográfica em texto<br />Ausência de detalhes nas metodologias para construção de ontologias <br />5<br />
    13. 13. SOLUÇÃO PROPOSTA<br />6<br />
    14. 14. ESTADO DA ARTE<br />Representação de conhecimento<br />7<br />
    15. 15. Sistemas de extração e integração de informação geográfica<br />8<br />ESTADO DA ARTE<br />
    16. 16. Metodologias para construção de ontologias<br />9<br />ESTADO DA ARTE<br />
    17. 17. SISTEMA DE GESTÃO DE CONHECIMENTO GEOGRÁFICO<br />Ambiente de extração e integração de conhecimento geográfico<br />Fontes de informação estruturadas (autoridades)<br />Extração<br />Limpeza<br />Carregamento<br />Portugal<br />GKB<br />Rio Tejo<br />Lisboa<br />Sintra<br />Queluz<br />Graça<br />Belém<br />SEI-Geo -<br />Integrador<br />Rua 25 de Abril<br />Geo-ontologia<br />Informação textual não estruturada<br />Portugal<br />SEI-Geo - Extrator<br />Rio Tejo<br />Lisboa<br />Sintra<br />Belém<br />Arbustos<br />10<br />
    18. 18. Relacionamento<br />MODELO CONCEITUAL DA GKB<br />Tipo de relacionamento<br />Entidade Geográfica<br />Nome de Entidade<br />Tipo de Entidade<br />11<br />
    19. 19. GEO-ONTOLOGIAS PRODUZIDAS<br />WGO –WorldGeographicOntology<br />Mais de 13 mil entidades geográficas (EG) (mais de 10 mil distintas)<br />Ca. 25.000 relacionamentos<br />Geo-Net-PT01 <br />Mais de 400 mil EG (34 mil termos distintos)<br />Mais de 75% dos termosformadospor 1 ou 3 palavras<br />45% dos termos formados por uma palavraestão presentes no nome de outras EG formadas por mais de uma palavra<br />12<br />
    20. 20. GEOGRAFICIDADE DA WEB PORTUGUESA<br /> 78,8% dos termosformadospor 1 palavra da Geo-Net-PT estão no WPT 03 <br /> nomes de locais em nomes de pessoas e organizações<br />amostra aleatória de 32.000 documentos do WPT 03<br />31% das entidades mencionadas distintas da categoria pessoa e <br />mais de 23% das entidades mencionadas distintas da categoria organização<br />contêm umnome geográfico incluído na Geo-Net-PT<br />13<br />
    21. 21. SEI-Geo<br />14<br />Mundo<br />Mundo<br />País<br />País<br />Cidade<br />Cidade<br />Cidade<br />Rua<br />Rua<br />Aldeia<br />Mundo<br />País<br />Cidade<br />Portugal<br />Aldeia<br />Rua<br />Sintra<br />Penedo<br />São João<br />... na aldeia de Penedo localizada em Sintra. <br />Arbustos<br />Extrator de arbustos<br />EM e relacionamentos reconhecidos<br />Sentenças<br />Frases c/ potencial <br />conteúdo geográfico<br />Classificador<br />Identificador<br />Padrões<br />frases com EM e relacionamentos reconhecidos<br />Conceitos e <br />Ocorrências <br />de Geo-ontologias <br />Frases <br />anotadas<br />&lt;Local tipo=“adm” subtipo=“aldeia”&gt;<br /> Aldeia de Penedo&lt;/Local&gt; em <br />&lt;Local tipo=“adm” subtipo=“cidade”&gt;<br /> Sintra&lt;/Local&gt;.<br />Anotador<br />Integrador <br />de Conhecimento<br />Geográfico<br />Portugal<br />Sintra<br />Sintra<br />Penedo<br />São João<br />Geo-<br />Ontologias<br />Geo-Ontologias<br />expandidas<br />Portugal<br />GKB<br />Geo-Ontologias<br />expandidas<br />Sintra<br />São João<br />
    22. 22. METODOLOGIA PROPOSTA NESSA TESE<br /> Concepção de um modelo conceitual<br />Sub-domínios, relacionamentos (intra-inter), variantes, diferenças de opinião, atributos das EG, etc.<br />Seleção e limpeza de fontes de informação<br />Autoridade, custo de aquisição, tipo de licenciamentoeformato<br />Integração de conhecimento<br />Exportação de conhecimento e as aplicações<br />15<br />
    23. 23. VALIDAÇÃO INDIRETA DA METODOLOGIA<br />Sistemas de REM (SEI-Geo e CaGE)<br />Módulos do Sistema de Recuperação de Informação Geográfica da UL<br />Interfaces <br />Sistemas que utilizaram as geo-ontologias produzidas participaram em avaliações internacionais (GeoCLEF e HAREM) com resultados significativos.<br />16<br />
    24. 24. CONTRIBUIÇÕES<br />Metodologia para construção de geo-ontologias proposta e validada<br />17<br /><ul><li>Sistema de gestão de conhecimento geográfico –GKB
    25. 25. Análise da geograficidade
    26. 26. Sistema de Extração e Integração de Conhecimento Geográfico –SEI-Geo
    27. 27. Geo-ontologias públicas e gratuitas– WGO e </li></li></ul><li>PRINCIPAIS PUBLICAÇÕES<br />Chaves, MarcirioSilveira. Geo-ontologias e padrões para reconhecimento de locais e suas relações em textos: a participação do SEI-Geo no Segundo HAREM. In: Cristina Motae Diana Santos (eds.). Desafiosnaavaliaçãoconjunta do reconhecimento de entidadesmencionadas: O Segundo HAREM, Linguateca, p. 231–245, 2009. ISBN: 978-989-20-1656-6<br />Chaves, MarcirioSilveira; Rodrigues, Catarinae Silva, Mário J.. Data Model for Geographic Ontologies Generation. XATA2007 - XML: AplicaçõeseTecnologiasAssociadas. 15-16 de Fevereiro, Lisboa, Portugal, 2007.<br />Santos, Diana e Chaves, MarcirioSilveira. The place of place in geographical IR. In 3rd Workshop on Geographic Information Retrieval, SIGIR&apos;2006. p. 5-8, August 10th, Seattle, 2006.<br />Chaves, MarcirioSilveirae Santos, Diana. What kinds of geographical information are there in the Portuguese Web?. In Renata Vieira, Paulo Quaresma, Maria daGraçaVolpesNunes, NunoMamede, Claudia Oliveira & Maria Carmelita Dias (eds.), EncontroparaoProcessamentoComputacionaldaLíngua Portuguesa EscritaeFalada (PROPOR&apos;2006), LNAI 3960 - Springer, (Itatiaia, RJ, 13 a 17 de maio), pp. 264-267. ISBN 3-540-34045-9<br />Silva, Mário J.; Martins, Bruno; Chaves, MarcirioSilveira; Cardoso, Nuno; Afonso, Ana Paula. Adding Geographic Scopes to Web Resources. CEUS - Computers, Environment and Urban Systems, Elsevier Science. volume 30, issue 4, July, pages 378-399, 2006.<br />Chaves, MarcirioSilveira; Silva, Mário J. and Martins, Bruno. A Geographic Knowledge Base for Semantic Web Applications. 20th Brazilian Symposium on Databases - SBBD, Uberlândia, Minas Gerais, Brazil, p. 40-54, 3-7 October, 2005.<br />18<br />

    ×