SlideShare uma empresa Scribd logo
1 de 28
Sumário 
Introdução 
Fundamentação Teórica 
Proposta de trabalho 
Estudo de Caso 
Resultados Esperados 
Planejamento
O que são Ontologias? 
Servem como 
esquemas de 
metadados 
[MAEDCHE, 2001]; 
Fornecendo um 
vocabulário 
controlado de 
conceitos 
[MAEDCHE, 2001]; 
Compostas por 
[DRUMOND, 2009]: 
• conceitos, 
relacionamentos 
taxonômicos e não 
taxonômicos, instâncias 
dos conceitos e 
asserções/regras; 
Podem definir um 
conjunto de 
primitivas de 
representação para 
modelar um domínio 
de conhecimento 
[GRUBER, 2008]. 
É uma visão abstrata 
do mundo que se 
deseja representar. 
[GRUBER, 1995]
Problemas Encontrados 
Inexistência de um arcabouço computacional para a construção de ontologias na língua portuguesa. 
Poucas ontologias construídas na língua portuguesa. 
Poucos trabalhos científicos sobre construção de ontologias na língua portuguesa 
Reduzido o número de Grupos de Pesquisa no Brasil sobre construção de Ontologias. 
A aprendizagem das ontologias depende da linguística utilizada.
Hipótese 
Como criar ontologias de forma 
semi-automatizada a partir de 
documentos textuais que 
descrevem o modelo de 
domínio da Segurança Pública?
Objetivos 
1 - Projetar 
um arcabouço 
computacional 
2 - Criar um 
arcabouço 
computacional 
4 - Validar a 
construção de 
ontologias na 
área 
estudada. 
3 - Realizar o 
Estudo de 
Caso na área 
de Segurança 
Pública
Processo de Extração de Ontologias 
Pré- 
Processamento 
Extração Termos 
Identificação de 
Conceitos 
Extração de 
Relações 
Gerador de 
Ontologias Ontologias 
[CIMIANO, 2006] adaptado
Componentes
Pré-Processamento 
Analisador 
Seleção Importador 
Conversor 
PDF/Doc/XLS 
e etc 
UTF-8 
Streaming/ 
Tokenização 
Saída StopList
Extração de Termos 
Pesagem dos Termos 
métodos 
estatísticos 
TF-DCF 
[LOPES, 2012] 
Filtragem de Lixo 
Entrada 
StopList 
Refinagem 
Gerador de 
Termos 
Candidatos 
UTF-8
Identificador de Conceitos 
Etiquetagem 
Morfossintática 
[DOMINGUES, 2007] 
hipótese de Markov 
[DOMINGUES, 2011] 
Gerador da Lista de 
Conceitos 
UTF-8
Extração de Relações 
Taxonômicas 
Relações 
hierárquicas 
Não-taxonômicas 
Abordagem de 
SERRA 
Gerador da Lista de 
Relações 
UTF-8
Estruturação das Ontologias 
Gerador da 
estrutura 
Memória RAM 
Exportador 
OWL RDF
Visualização 
Integrador 
Protegé 
Validação 
Manual 
Exportador 
PDF
Estudo de Caso 
Segurança Pública – Convênio entre SSP/GO e UFG 
Documentos digitais disponíveis (Livros, Trabalhos 
Acadêmicos, Periódicos). 
Etapa manual de treinamento e validação
Resultados Esperados 
Sabença: Um arcabouço computacional 
Semi-automatizado 
Desenvolvido 
na linguagem 
Java 
Extensível 
para novos 
métodos e 
padrões 
Modelo 
documentado 
Ontologias na 
área de 
Segurança 
Pública.
Cronograma
Conclusão 
A automatização completa da aprendizagem de ontologias é algo estudado 
por décadas e de difícil realização. 
O maior desafio é a criação das regras (axiomas) que acredito ser o gargalo 
da automatização. As regras são dificílimas para o ser humano construir e não 
chegamos a técnicas satisfatórias que recriem esse intelecto humano. 
O arcabouço proposto se enquadra como semi-automatizado por não 
implementar os axiomas e a sua validação será manual com ajuda de 
especialista de domínio.
Referências 
BUITELAAR, P.; BUITELAAR, P.; CIMIANO, P. Ontology Learning and 
Population: Bridging the Gap between Text and Knowledge - Volume 
167 Frontiers in Artificial Intelligence and Applications. IOS Press, 
Amsterdam, The Netherlands, The Netherlands, 2008. 
BUITELAAR, P.; OLEJNIK, D.; SINTEK, M. A protege plug-in for ontology 
extraction from text based on linguistic analysis. In: Proceedings of the 
1st European Semantic Web Symposium (ESWS), Heraklion, Greece, 2004.
Referências 
CAO, Y.; WANG, X.; ZHANG, F.; YANG, W. Ontology-based domain 
knowledge acquisition technology. In: Computational Intelligence and 
Design (ISCID), 2012 Fifth International Symposium on, volume 2, p. 487– 
490, Oct 2012. 
CARVALHEIRA, L. C. D. C. Método semi-automático de construção de 
ontologias parciais de domínio com base em textos. Master’s thesis, 
Escola Politécnica da Universidade de São Paulo, Departamento de 
Engenharia da Computação e Sistemas Digitais, ago 2007.
Referências 
CIARAMITA, M.; GANGEMI, A.; RATSCH, E.; ŠARIC, J.; ROJAS, I. 
Unsupervised learning of semantic relations between concepts of a 
molecular biology ontology. In: Proceedings of the 19th International Joint 
Conference on Artificial Intelligence, IJCAI’05, p. 659–664, San Francisco, 
CA, USA, 2005. Morgan Kaufmann Publishers Inc. 
CIMIANO, P.; VÖLKER, J. Text2onto: A framework for ontology learning 
and data-driven change discovery. In: Proceedings of the 10th 
International Conference on Natural Language Processing and Information 
Systems, NLDB’05, p. 227–238, Berlin, Heidelberg, 2005. Springer-Verlag.
Referências 
CONRADO, M. D. S.; FELIPPO, A. D.; PARDO, T. A. S.; REZENDE, S. O. A 
survey of automatic term extraction for brazilian portuguese. Journal of 
the Brazilian Computer Society, 20(1):12, 2014. 
DOMINGUES, M. L.; FAVERO, E. L.; MEDEIROS, I. P. Etiquetagem de 
palavras para o português do brasil. In: Proceedings of TIL - V Workshop 
em tecnologia da informação e da linguagem humana, p. 4, Rio de Janeiro, 
Brazil, 06 2007. Anais do XXVII Congresso da SBC. 
DRUMOND, L. R. Aquisição automatizada de hierarquias de conceitos de 
ontologias utilizando aprendizagem estatística relacional. Master’s 
thesis, UFMA, Engenharia de Eletricidade, 2009.
Referências 
GRUBER, T. Ontology (Computer Science) - definition in Encyclopedia of 
Database Systems. In: Liu, L.; Özsu, T. M., editors, Encyclopedia of 
Database System, 2008. 
FERREIRA, V. H. Uma proposta para descoberta automática de relações 
não-taxonômicas a partir de corpus em língua portuguesa. Master’s 
thesis, Universidade Católica do Rio Grande do Sul, Faculdade de 
Informática, dez 2012. 
GAMMA, E.; JOHNSON, R.; HELM, R.; VLISSIDES, J. Padrões de Projetos: 
Soluções Reutilizáveis. BOOKMAN COMPANHIA ED, 2006.
Referências 
LEE, C.-S.; KAO, Y.-F.; KUO, Y.-H.; WANG, M.-H. Automated ontology 
construction for unstructured text documents. Data Knowl. Eng., 
60(3):547–566, Mar. 2007. 
LOPES, L. Extração automática de conceitos a partir de textos em língua 
portuguesa. Master’s thesis, Universidade Católica do Rio Grande do Sul - 
PUCRS, Faculdade de Informática, jan 2012. 
LOPES, L.; FERNANDES, P.; VIEIRA, R. Domain term relevance through tf-dcf. 
In: Proceedings of the 2012 International Conference on Artificial 
Intelligence (ICAI 2012), ICAI 2012, p. 1001–1007, Las Vegas, USA, 2012. 
CSREA Press.
Referências 
MAEDCHE, A.; STAAB, S. Ontology Learning for the Semantic Web. IEEE 
Intelligent Systems, 16(2):72–79, Mar. 2001. 
MENDONÇA, F.; ALMEIDA, M. B.; SOUZA, R. R.; SILVA, D. L. Extração 
automática de termos candidatos às ontologias: um estudo de caso no 
domínio da hemoterapia. In: Malucelli, A.; Bax, M. P., editors, ONTOBRAS-MOST, 
volume 938 de CEUR Workshop Proceedings, p. 170–175. CEUR-WS. 
org, 2012. 
MORAES, S. M. W. Construção de estruturas ontológicas a partir de 
textos: Um estudo baseado no método Formal Concept Analysis e em 
papéis semânticos. Master’s thesis, PUC-RS, Faculdade de Informática, 
mar 2012.
Referências 
SAINCHEZ, D.; MORENO, A. Learning non-taxonomic relationships from 
web documents for domain ontology construction. Data and Knowledge 
Engineering, 64(3):600 – 623, 2008. 
SERRA, I.; GIRARDI, R.; NOVAIS, P. Parnt: A statistic based approach to 
extract non-taxonomic relationships of ontologies from text. In: 
Information Technology: New Generations (ITNG), 2013 Tenth International 
Conference on, p.561–566, April 2013. 
SILVA, J.; BRANCO, A.; CASTRO, S.; REIS, R. Out-of-the-box robust 
parsing of portuguese. In: Pardo, T.; Branco, A.; Klautau, A.; Vieira, R.; de 
Lima, V., editors, Computational Processing of the Portuguese Language, 
volume 6001 de Lecture Notes in Computer Science, p. 75–85. Springer 
Berlin Heidelberg, 2010.
Referências 
STANFORD.EDU. The Protégé project. http://protege.stanford.edu, último 
acesso em julho de 2013. 
TELINE, M. F. Avaliação de métodos de extração automática de 
terminologias para textos em portugues. Master’s thesis, Universidade de 
São Paulo, ICMCUSP São Carlos, fev 2004. 
WONG, W.; LIU, W.; BENNAMOUN, M. Ontology learning from text: A look 
back and into the future. ACM Comput. Surv., 44(4):20:1–20:36, Sept. 
2012. 
ZAHRA, F. M.; MALUCELLI, A.; FREDDO, A. R.; TACLA, C. A. Ferramentas 
para aprendizagem de ontologias a partir de textos. In: Perspectivas em 
Ciência da Informação, volume 19, p. 3–21, 2014.

Mais conteúdo relacionado

Destaque

Apresentação do Projeto TIC no IF Goiano versão 2013
Apresentação do Projeto TIC no IF Goiano versão 2013Apresentação do Projeto TIC no IF Goiano versão 2013
Apresentação do Projeto TIC no IF Goiano versão 2013Norton Guimarães
 
O professor é um eterno aprendiz
O professor é um eterno aprendizO professor é um eterno aprendiz
O professor é um eterno aprendizNorton Guimarães
 
COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB
COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB
COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB Norton Guimarães
 
A evolução histórica da EaD no Brasil
A evolução histórica da EaD no BrasilA evolução histórica da EaD no Brasil
A evolução histórica da EaD no BrasilNorton Guimarães
 
Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.
Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.
Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.Norton Guimarães
 
Apresentação da 10ª Edição do S2B
Apresentação da 10ª Edição do S2BApresentação da 10ª Edição do S2B
Apresentação da 10ª Edição do S2BNorton Guimarães
 
EAD - fundamentos e políticas
EAD - fundamentos e políticasEAD - fundamentos e políticas
EAD - fundamentos e políticasNorton Guimarães
 
Principais Técnicas de Elicitação de Requisitos
Principais Técnicas de Elicitação de RequisitosPrincipais Técnicas de Elicitação de Requisitos
Principais Técnicas de Elicitação de RequisitosNorton Guimarães
 
Produção de conteúdo colaborativo em sala de aula
Produção de conteúdo colaborativo em sala de aulaProdução de conteúdo colaborativo em sala de aula
Produção de conteúdo colaborativo em sala de aulaNorton Guimarães
 
Regras de Associação - Mineração de Dados
Regras de Associação - Mineração de DadosRegras de Associação - Mineração de Dados
Regras de Associação - Mineração de DadosNorton Guimarães
 
Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...
Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...
Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...Norton Guimarães
 
As políticas públicas em EaD no Brasil
As políticas públicas em EaD no BrasilAs políticas públicas em EaD no Brasil
As políticas públicas em EaD no BrasilNorton Guimarães
 
Perspectivas das interfaces humano computador
Perspectivas das interfaces humano computadorPerspectivas das interfaces humano computador
Perspectivas das interfaces humano computadorNorton Guimarães
 
Visão Geral, Ferramentas e Aplicações dos Algoritmos Genéticos
Visão Geral, Ferramentas e Aplicações dos Algoritmos GenéticosVisão Geral, Ferramentas e Aplicações dos Algoritmos Genéticos
Visão Geral, Ferramentas e Aplicações dos Algoritmos GenéticosNorton Guimarães
 
Manipulação de datas em java
Manipulação de datas em javaManipulação de datas em java
Manipulação de datas em javaNorton Guimarães
 
Criando Framework - Conceitos, Estratégias e Dicas
Criando Framework - Conceitos, Estratégias e DicasCriando Framework - Conceitos, Estratégias e Dicas
Criando Framework - Conceitos, Estratégias e DicasNorton Guimarães
 
O cenário atual da ead no Brasil
O cenário atual da ead no BrasilO cenário atual da ead no Brasil
O cenário atual da ead no BrasilNorton Guimarães
 
Introdução aos Sistemas Inteligentes de Apoio à Decisão
Introdução aos Sistemas Inteligentes de Apoio à DecisãoIntrodução aos Sistemas Inteligentes de Apoio à Decisão
Introdução aos Sistemas Inteligentes de Apoio à DecisãoNorton Guimarães
 

Destaque (20)

Apresentação do Projeto TIC no IF Goiano versão 2013
Apresentação do Projeto TIC no IF Goiano versão 2013Apresentação do Projeto TIC no IF Goiano versão 2013
Apresentação do Projeto TIC no IF Goiano versão 2013
 
O professor é um eterno aprendiz
O professor é um eterno aprendizO professor é um eterno aprendiz
O professor é um eterno aprendiz
 
COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB
COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB
COMÉRCIO ELETRÔNICO DE PRODUTOS VIA WEB
 
A evolução histórica da EaD no Brasil
A evolução histórica da EaD no BrasilA evolução histórica da EaD no Brasil
A evolução histórica da EaD no Brasil
 
Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.
Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.
Projeto TIC no IF Goiano v. 4 - Evolução, Etapas e Resultados alcançados.
 
Apresentação da 10ª Edição do S2B
Apresentação da 10ª Edição do S2BApresentação da 10ª Edição do S2B
Apresentação da 10ª Edição do S2B
 
EAD - fundamentos e políticas
EAD - fundamentos e políticasEAD - fundamentos e políticas
EAD - fundamentos e políticas
 
Principais Técnicas de Elicitação de Requisitos
Principais Técnicas de Elicitação de RequisitosPrincipais Técnicas de Elicitação de Requisitos
Principais Técnicas de Elicitação de Requisitos
 
Apresentação S2B 2013
Apresentação S2B 2013Apresentação S2B 2013
Apresentação S2B 2013
 
Produção de conteúdo colaborativo em sala de aula
Produção de conteúdo colaborativo em sala de aulaProdução de conteúdo colaborativo em sala de aula
Produção de conteúdo colaborativo em sala de aula
 
Regras de Associação - Mineração de Dados
Regras de Associação - Mineração de DadosRegras de Associação - Mineração de Dados
Regras de Associação - Mineração de Dados
 
Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...
Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...
Sabença - Um arcabouço computacional para aprendizagem semi-automatizada de o...
 
As políticas públicas em EaD no Brasil
As políticas públicas em EaD no BrasilAs políticas públicas em EaD no Brasil
As políticas públicas em EaD no Brasil
 
Perspectivas das interfaces humano computador
Perspectivas das interfaces humano computadorPerspectivas das interfaces humano computador
Perspectivas das interfaces humano computador
 
Visão Geral, Ferramentas e Aplicações dos Algoritmos Genéticos
Visão Geral, Ferramentas e Aplicações dos Algoritmos GenéticosVisão Geral, Ferramentas e Aplicações dos Algoritmos Genéticos
Visão Geral, Ferramentas e Aplicações dos Algoritmos Genéticos
 
Manipulação de datas em java
Manipulação de datas em javaManipulação de datas em java
Manipulação de datas em java
 
Árvores SBB
Árvores SBBÁrvores SBB
Árvores SBB
 
Criando Framework - Conceitos, Estratégias e Dicas
Criando Framework - Conceitos, Estratégias e DicasCriando Framework - Conceitos, Estratégias e Dicas
Criando Framework - Conceitos, Estratégias e Dicas
 
O cenário atual da ead no Brasil
O cenário atual da ead no BrasilO cenário atual da ead no Brasil
O cenário atual da ead no Brasil
 
Introdução aos Sistemas Inteligentes de Apoio à Decisão
Introdução aos Sistemas Inteligentes de Apoio à DecisãoIntrodução aos Sistemas Inteligentes de Apoio à Decisão
Introdução aos Sistemas Inteligentes de Apoio à Decisão
 

Semelhante a Proposta de um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de documentos textuais

Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...
Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...
Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...Documentar Tecnologia e Informação
 
Fichamento valeria
Fichamento valeriaFichamento valeria
Fichamento valeriaValeria Rosa
 
Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...
Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...
Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...José Pedro Sousa Dias
 
Aula 1 apresentação da disciplina 2012-1
Aula 1   apresentação da disciplina 2012-1Aula 1   apresentação da disciplina 2012-1
Aula 1 apresentação da disciplina 2012-1Elaine Cecília Gatto
 
aula1-apresentaodadisciplina-120223135756-phpapp01.pdf
aula1-apresentaodadisciplina-120223135756-phpapp01.pdfaula1-apresentaodadisciplina-120223135756-phpapp01.pdf
aula1-apresentaodadisciplina-120223135756-phpapp01.pdfHouda778314
 
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EADApresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EADienh
 
Web Semântica e da modelagem ontológica
Web Semântica e da modelagem ontológica Web Semântica e da modelagem ontológica
Web Semântica e da modelagem ontológica Amaury Prates
 
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Joel S. Coleti
 
Enancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOS
Enancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOSEnancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOS
Enancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOSluizclaudiomaia
 
Representando a computação autonômica por meio da engenharia ontológica
Representando a computação autonômica por meio da engenharia ontológica Representando a computação autonômica por meio da engenharia ontológica
Representando a computação autonômica por meio da engenharia ontológica Leonardo Sepulcri
 
Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009
Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009
Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009Gisele Dziekaniak
 
SKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentaisSKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentaisFabrício Silva Assumpção
 
Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Junior Grossi
 
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarRecursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarBianca Santana
 
Anexo v conteudos programaticos-sugestoes_bibliograficas-20180130-171424
Anexo v   conteudos programaticos-sugestoes_bibliograficas-20180130-171424Anexo v   conteudos programaticos-sugestoes_bibliograficas-20180130-171424
Anexo v conteudos programaticos-sugestoes_bibliograficas-20180130-171424snovi82
 
SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...
SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...
SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...José Mauro da Silva, MSc
 
As contribuições da Web Semântica para a Catalogação
As contribuições da Web Semântica para a CatalogaçãoAs contribuições da Web Semântica para a Catalogação
As contribuições da Web Semântica para a CatalogaçãoUNESP
 
Apresentação - Ontologia do Processo Legislativo de SP - 2o. ENDA
Apresentação - Ontologia do Processo Legislativo de SP - 2o. ENDAApresentação - Ontologia do Processo Legislativo de SP - 2o. ENDA
Apresentação - Ontologia do Processo Legislativo de SP - 2o. ENDAFrederico Bortolato
 

Semelhante a Proposta de um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de documentos textuais (20)

Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...
Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...
Indexação Automática e Semântica: estudo da análise do conteúdo de teses e di...
 
Fichamento valeria
Fichamento valeriaFichamento valeria
Fichamento valeria
 
Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...
Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...
Hipertexto, anotaçoes semânticas e rede(s) na História da Ciência, Tecnologia...
 
Aula 1 apresentação da disciplina 2012-1
Aula 1   apresentação da disciplina 2012-1Aula 1   apresentação da disciplina 2012-1
Aula 1 apresentação da disciplina 2012-1
 
aula1-apresentaodadisciplina-120223135756-phpapp01.pdf
aula1-apresentaodadisciplina-120223135756-phpapp01.pdfaula1-apresentaodadisciplina-120223135756-phpapp01.pdf
aula1-apresentaodadisciplina-120223135756-phpapp01.pdf
 
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EADApresentação dissertação - modelagem semântica de ontologia do domínio EAD
Apresentação dissertação - modelagem semântica de ontologia do domínio EAD
 
Web Semântica e da modelagem ontológica
Web Semântica e da modelagem ontológica Web Semântica e da modelagem ontológica
Web Semântica e da modelagem ontológica
 
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
 
Enancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOS
Enancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOSEnancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOS
Enancib 2008 - MEDIDAS DE SIMILARIDADE EM DOCUMENTOS ELETRONICOS
 
Aula 1 apresentação da disciplina
Aula 1   apresentação da disciplinaAula 1   apresentação da disciplina
Aula 1 apresentação da disciplina
 
Apresentacao
ApresentacaoApresentacao
Apresentacao
 
Representando a computação autonômica por meio da engenharia ontológica
Representando a computação autonômica por meio da engenharia ontológica Representando a computação autonômica por meio da engenharia ontológica
Representando a computação autonômica por meio da engenharia ontológica
 
Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009
Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009
Introdução às ontologias por Gisele Dziekaniak EDUTEC FURG 2009
 
SKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentaisSKOS: Interoperabilidade de linguagens documentais
SKOS: Interoperabilidade de linguagens documentais
 
Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)
 
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarRecursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
 
Anexo v conteudos programaticos-sugestoes_bibliograficas-20180130-171424
Anexo v   conteudos programaticos-sugestoes_bibliograficas-20180130-171424Anexo v   conteudos programaticos-sugestoes_bibliograficas-20180130-171424
Anexo v conteudos programaticos-sugestoes_bibliograficas-20180130-171424
 
SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...
SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...
SINAPSE - A Methodology for Extraction of Knowledge Objects Based on Textual ...
 
As contribuições da Web Semântica para a Catalogação
As contribuições da Web Semântica para a CatalogaçãoAs contribuições da Web Semântica para a Catalogação
As contribuições da Web Semântica para a Catalogação
 
Apresentação - Ontologia do Processo Legislativo de SP - 2o. ENDA
Apresentação - Ontologia do Processo Legislativo de SP - 2o. ENDAApresentação - Ontologia do Processo Legislativo de SP - 2o. ENDA
Apresentação - Ontologia do Processo Legislativo de SP - 2o. ENDA
 

Mais de Norton Guimarães

DIVERSIDADE DA ESCOLA - Meninos vestem azul
DIVERSIDADE DA ESCOLA - Meninos vestem azulDIVERSIDADE DA ESCOLA - Meninos vestem azul
DIVERSIDADE DA ESCOLA - Meninos vestem azulNorton Guimarães
 
Mini Curso - Cultura Maker e Design Thinking.pptx
Mini Curso - Cultura Maker e Design Thinking.pptxMini Curso - Cultura Maker e Design Thinking.pptx
Mini Curso - Cultura Maker e Design Thinking.pptxNorton Guimarães
 
Poster - Diversidade na Escola Ulbra - Karine e Norton.pdf
Poster - Diversidade na Escola Ulbra - Karine e Norton.pdfPoster - Diversidade na Escola Ulbra - Karine e Norton.pdf
Poster - Diversidade na Escola Ulbra - Karine e Norton.pdfNorton Guimarães
 
Novas Tendências na Educação pós pandemia
Novas Tendências na Educação pós pandemiaNovas Tendências na Educação pós pandemia
Novas Tendências na Educação pós pandemiaNorton Guimarães
 
Programação Web com PHP 7.x
Programação Web com PHP 7.xProgramação Web com PHP 7.x
Programação Web com PHP 7.xNorton Guimarães
 
Ensino híbrido planejamento e criação de aulas
Ensino híbrido   planejamento e criação de aulasEnsino híbrido   planejamento e criação de aulas
Ensino híbrido planejamento e criação de aulasNorton Guimarães
 
Ferramentas para testes de software
Ferramentas para testes de softwareFerramentas para testes de software
Ferramentas para testes de softwareNorton Guimarães
 
A evolução histórica da EaD
A evolução histórica da EaDA evolução histórica da EaD
A evolução histórica da EaDNorton Guimarães
 
A EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL G
A EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL GA EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL G
A EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL GNorton Guimarães
 
Tutor EaD - importância e funções
Tutor EaD - importância e funçõesTutor EaD - importância e funções
Tutor EaD - importância e funçõesNorton Guimarães
 
Avaliação da aprendizagem na EAD
Avaliação da aprendizagem na EADAvaliação da aprendizagem na EAD
Avaliação da aprendizagem na EADNorton Guimarães
 
Apoio do computador e da web à atividade educativa
Apoio do computador e da web à atividade educativaApoio do computador e da web à atividade educativa
Apoio do computador e da web à atividade educativaNorton Guimarães
 
O uso de recursos multimídia em sala de aula
O uso de recursos multimídia em sala de aulaO uso de recursos multimídia em sala de aula
O uso de recursos multimídia em sala de aulaNorton Guimarães
 
Planejamento e organização de sistemas de ead
Planejamento e organização de sistemas de eadPlanejamento e organização de sistemas de ead
Planejamento e organização de sistemas de eadNorton Guimarães
 
Ferramentas para TIC na educação
Ferramentas para TIC na educaçãoFerramentas para TIC na educação
Ferramentas para TIC na educaçãoNorton Guimarães
 
Tecnologia na educação 2.0
Tecnologia na educação 2.0Tecnologia na educação 2.0
Tecnologia na educação 2.0Norton Guimarães
 
Introdução websemantica (minicurso)
Introdução websemantica (minicurso)Introdução websemantica (minicurso)
Introdução websemantica (minicurso)Norton Guimarães
 

Mais de Norton Guimarães (18)

DIVERSIDADE DA ESCOLA - Meninos vestem azul
DIVERSIDADE DA ESCOLA - Meninos vestem azulDIVERSIDADE DA ESCOLA - Meninos vestem azul
DIVERSIDADE DA ESCOLA - Meninos vestem azul
 
Mini Curso - Cultura Maker e Design Thinking.pptx
Mini Curso - Cultura Maker e Design Thinking.pptxMini Curso - Cultura Maker e Design Thinking.pptx
Mini Curso - Cultura Maker e Design Thinking.pptx
 
Poster - Diversidade na Escola Ulbra - Karine e Norton.pdf
Poster - Diversidade na Escola Ulbra - Karine e Norton.pdfPoster - Diversidade na Escola Ulbra - Karine e Norton.pdf
Poster - Diversidade na Escola Ulbra - Karine e Norton.pdf
 
Novas Tendências na Educação pós pandemia
Novas Tendências na Educação pós pandemiaNovas Tendências na Educação pós pandemia
Novas Tendências na Educação pós pandemia
 
Qualidade de Software
Qualidade de SoftwareQualidade de Software
Qualidade de Software
 
Programação Web com PHP 7.x
Programação Web com PHP 7.xProgramação Web com PHP 7.x
Programação Web com PHP 7.x
 
Ensino híbrido planejamento e criação de aulas
Ensino híbrido   planejamento e criação de aulasEnsino híbrido   planejamento e criação de aulas
Ensino híbrido planejamento e criação de aulas
 
Ferramentas para testes de software
Ferramentas para testes de softwareFerramentas para testes de software
Ferramentas para testes de software
 
A evolução histórica da EaD
A evolução histórica da EaDA evolução histórica da EaD
A evolução histórica da EaD
 
A EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL G
A EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL GA EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL G
A EXPERIÊNCIA NA DEFINIÇÃO DE UM PROCESSO BASEADO NO MPS.BR NÍVEL G
 
Tutor EaD - importância e funções
Tutor EaD - importância e funçõesTutor EaD - importância e funções
Tutor EaD - importância e funções
 
Avaliação da aprendizagem na EAD
Avaliação da aprendizagem na EADAvaliação da aprendizagem na EAD
Avaliação da aprendizagem na EAD
 
Apoio do computador e da web à atividade educativa
Apoio do computador e da web à atividade educativaApoio do computador e da web à atividade educativa
Apoio do computador e da web à atividade educativa
 
O uso de recursos multimídia em sala de aula
O uso de recursos multimídia em sala de aulaO uso de recursos multimídia em sala de aula
O uso de recursos multimídia em sala de aula
 
Planejamento e organização de sistemas de ead
Planejamento e organização de sistemas de eadPlanejamento e organização de sistemas de ead
Planejamento e organização de sistemas de ead
 
Ferramentas para TIC na educação
Ferramentas para TIC na educaçãoFerramentas para TIC na educação
Ferramentas para TIC na educação
 
Tecnologia na educação 2.0
Tecnologia na educação 2.0Tecnologia na educação 2.0
Tecnologia na educação 2.0
 
Introdução websemantica (minicurso)
Introdução websemantica (minicurso)Introdução websemantica (minicurso)
Introdução websemantica (minicurso)
 

Proposta de um arcabouço computacional para aprendizagem semi-automatizada de ontologias a partir de documentos textuais

  • 1.
  • 2. Sumário Introdução Fundamentação Teórica Proposta de trabalho Estudo de Caso Resultados Esperados Planejamento
  • 3.
  • 4. O que são Ontologias? Servem como esquemas de metadados [MAEDCHE, 2001]; Fornecendo um vocabulário controlado de conceitos [MAEDCHE, 2001]; Compostas por [DRUMOND, 2009]: • conceitos, relacionamentos taxonômicos e não taxonômicos, instâncias dos conceitos e asserções/regras; Podem definir um conjunto de primitivas de representação para modelar um domínio de conhecimento [GRUBER, 2008]. É uma visão abstrata do mundo que se deseja representar. [GRUBER, 1995]
  • 5. Problemas Encontrados Inexistência de um arcabouço computacional para a construção de ontologias na língua portuguesa. Poucas ontologias construídas na língua portuguesa. Poucos trabalhos científicos sobre construção de ontologias na língua portuguesa Reduzido o número de Grupos de Pesquisa no Brasil sobre construção de Ontologias. A aprendizagem das ontologias depende da linguística utilizada.
  • 6. Hipótese Como criar ontologias de forma semi-automatizada a partir de documentos textuais que descrevem o modelo de domínio da Segurança Pública?
  • 7. Objetivos 1 - Projetar um arcabouço computacional 2 - Criar um arcabouço computacional 4 - Validar a construção de ontologias na área estudada. 3 - Realizar o Estudo de Caso na área de Segurança Pública
  • 8. Processo de Extração de Ontologias Pré- Processamento Extração Termos Identificação de Conceitos Extração de Relações Gerador de Ontologias Ontologias [CIMIANO, 2006] adaptado
  • 10. Pré-Processamento Analisador Seleção Importador Conversor PDF/Doc/XLS e etc UTF-8 Streaming/ Tokenização Saída StopList
  • 11. Extração de Termos Pesagem dos Termos métodos estatísticos TF-DCF [LOPES, 2012] Filtragem de Lixo Entrada StopList Refinagem Gerador de Termos Candidatos UTF-8
  • 12. Identificador de Conceitos Etiquetagem Morfossintática [DOMINGUES, 2007] hipótese de Markov [DOMINGUES, 2011] Gerador da Lista de Conceitos UTF-8
  • 13. Extração de Relações Taxonômicas Relações hierárquicas Não-taxonômicas Abordagem de SERRA Gerador da Lista de Relações UTF-8
  • 14. Estruturação das Ontologias Gerador da estrutura Memória RAM Exportador OWL RDF
  • 15. Visualização Integrador Protegé Validação Manual Exportador PDF
  • 16. Estudo de Caso Segurança Pública – Convênio entre SSP/GO e UFG Documentos digitais disponíveis (Livros, Trabalhos Acadêmicos, Periódicos). Etapa manual de treinamento e validação
  • 17. Resultados Esperados Sabença: Um arcabouço computacional Semi-automatizado Desenvolvido na linguagem Java Extensível para novos métodos e padrões Modelo documentado Ontologias na área de Segurança Pública.
  • 19. Conclusão A automatização completa da aprendizagem de ontologias é algo estudado por décadas e de difícil realização. O maior desafio é a criação das regras (axiomas) que acredito ser o gargalo da automatização. As regras são dificílimas para o ser humano construir e não chegamos a técnicas satisfatórias que recriem esse intelecto humano. O arcabouço proposto se enquadra como semi-automatizado por não implementar os axiomas e a sua validação será manual com ajuda de especialista de domínio.
  • 20. Referências BUITELAAR, P.; BUITELAAR, P.; CIMIANO, P. Ontology Learning and Population: Bridging the Gap between Text and Knowledge - Volume 167 Frontiers in Artificial Intelligence and Applications. IOS Press, Amsterdam, The Netherlands, The Netherlands, 2008. BUITELAAR, P.; OLEJNIK, D.; SINTEK, M. A protege plug-in for ontology extraction from text based on linguistic analysis. In: Proceedings of the 1st European Semantic Web Symposium (ESWS), Heraklion, Greece, 2004.
  • 21. Referências CAO, Y.; WANG, X.; ZHANG, F.; YANG, W. Ontology-based domain knowledge acquisition technology. In: Computational Intelligence and Design (ISCID), 2012 Fifth International Symposium on, volume 2, p. 487– 490, Oct 2012. CARVALHEIRA, L. C. D. C. Método semi-automático de construção de ontologias parciais de domínio com base em textos. Master’s thesis, Escola Politécnica da Universidade de São Paulo, Departamento de Engenharia da Computação e Sistemas Digitais, ago 2007.
  • 22. Referências CIARAMITA, M.; GANGEMI, A.; RATSCH, E.; ŠARIC, J.; ROJAS, I. Unsupervised learning of semantic relations between concepts of a molecular biology ontology. In: Proceedings of the 19th International Joint Conference on Artificial Intelligence, IJCAI’05, p. 659–664, San Francisco, CA, USA, 2005. Morgan Kaufmann Publishers Inc. CIMIANO, P.; VÖLKER, J. Text2onto: A framework for ontology learning and data-driven change discovery. In: Proceedings of the 10th International Conference on Natural Language Processing and Information Systems, NLDB’05, p. 227–238, Berlin, Heidelberg, 2005. Springer-Verlag.
  • 23. Referências CONRADO, M. D. S.; FELIPPO, A. D.; PARDO, T. A. S.; REZENDE, S. O. A survey of automatic term extraction for brazilian portuguese. Journal of the Brazilian Computer Society, 20(1):12, 2014. DOMINGUES, M. L.; FAVERO, E. L.; MEDEIROS, I. P. Etiquetagem de palavras para o português do brasil. In: Proceedings of TIL - V Workshop em tecnologia da informação e da linguagem humana, p. 4, Rio de Janeiro, Brazil, 06 2007. Anais do XXVII Congresso da SBC. DRUMOND, L. R. Aquisição automatizada de hierarquias de conceitos de ontologias utilizando aprendizagem estatística relacional. Master’s thesis, UFMA, Engenharia de Eletricidade, 2009.
  • 24. Referências GRUBER, T. Ontology (Computer Science) - definition in Encyclopedia of Database Systems. In: Liu, L.; Özsu, T. M., editors, Encyclopedia of Database System, 2008. FERREIRA, V. H. Uma proposta para descoberta automática de relações não-taxonômicas a partir de corpus em língua portuguesa. Master’s thesis, Universidade Católica do Rio Grande do Sul, Faculdade de Informática, dez 2012. GAMMA, E.; JOHNSON, R.; HELM, R.; VLISSIDES, J. Padrões de Projetos: Soluções Reutilizáveis. BOOKMAN COMPANHIA ED, 2006.
  • 25. Referências LEE, C.-S.; KAO, Y.-F.; KUO, Y.-H.; WANG, M.-H. Automated ontology construction for unstructured text documents. Data Knowl. Eng., 60(3):547–566, Mar. 2007. LOPES, L. Extração automática de conceitos a partir de textos em língua portuguesa. Master’s thesis, Universidade Católica do Rio Grande do Sul - PUCRS, Faculdade de Informática, jan 2012. LOPES, L.; FERNANDES, P.; VIEIRA, R. Domain term relevance through tf-dcf. In: Proceedings of the 2012 International Conference on Artificial Intelligence (ICAI 2012), ICAI 2012, p. 1001–1007, Las Vegas, USA, 2012. CSREA Press.
  • 26. Referências MAEDCHE, A.; STAAB, S. Ontology Learning for the Semantic Web. IEEE Intelligent Systems, 16(2):72–79, Mar. 2001. MENDONÇA, F.; ALMEIDA, M. B.; SOUZA, R. R.; SILVA, D. L. Extração automática de termos candidatos às ontologias: um estudo de caso no domínio da hemoterapia. In: Malucelli, A.; Bax, M. P., editors, ONTOBRAS-MOST, volume 938 de CEUR Workshop Proceedings, p. 170–175. CEUR-WS. org, 2012. MORAES, S. M. W. Construção de estruturas ontológicas a partir de textos: Um estudo baseado no método Formal Concept Analysis e em papéis semânticos. Master’s thesis, PUC-RS, Faculdade de Informática, mar 2012.
  • 27. Referências SAINCHEZ, D.; MORENO, A. Learning non-taxonomic relationships from web documents for domain ontology construction. Data and Knowledge Engineering, 64(3):600 – 623, 2008. SERRA, I.; GIRARDI, R.; NOVAIS, P. Parnt: A statistic based approach to extract non-taxonomic relationships of ontologies from text. In: Information Technology: New Generations (ITNG), 2013 Tenth International Conference on, p.561–566, April 2013. SILVA, J.; BRANCO, A.; CASTRO, S.; REIS, R. Out-of-the-box robust parsing of portuguese. In: Pardo, T.; Branco, A.; Klautau, A.; Vieira, R.; de Lima, V., editors, Computational Processing of the Portuguese Language, volume 6001 de Lecture Notes in Computer Science, p. 75–85. Springer Berlin Heidelberg, 2010.
  • 28. Referências STANFORD.EDU. The Protégé project. http://protege.stanford.edu, último acesso em julho de 2013. TELINE, M. F. Avaliação de métodos de extração automática de terminologias para textos em portugues. Master’s thesis, Universidade de São Paulo, ICMCUSP São Carlos, fev 2004. WONG, W.; LIU, W.; BENNAMOUN, M. Ontology learning from text: A look back and into the future. ACM Comput. Surv., 44(4):20:1–20:36, Sept. 2012. ZAHRA, F. M.; MALUCELLI, A.; FREDDO, A. R.; TACLA, C. A. Ferramentas para aprendizagem de ontologias a partir de textos. In: Perspectivas em Ciência da Informação, volume 19, p. 3–21, 2014.

Notas do Editor

  1. Motivação:
  2. Problemas: A inexistência de um arcabouço computacional para a construção de ontologias na língua portuguesa do Brasil. O reduzido número de ontologias disponíveis na língua portuguesa em áreas específicas do conhecimento. A inexistência de ontologias nas áreas de Segurança Pública, Agropecuária, Zootecnia, Pedagogia, entre outras. O reduzido número de trabalhos científicos com abordagens práticas que visam a construção de ontologias na língua portuguesa do Brasil. Motivação: Hipótese: Como criar ontologias de forma semi-automatizada a partir de documentos textuais que descrevem o modelo de domínio da Segurança Pública? Objetivos Projetar o arcabouço computacional Criar o arcabouço computacional Realizar o Estudo de Caso
  3. Problemas: A inexistência de um arcabouço computacional para a construção de ontologias na língua portuguesa do Brasil. O reduzido número de ontologias disponíveis na língua portuguesa em áreas específicas do conhecimento. A inexistência de ontologias nas áreas de Segurança Pública, Agropecuária, Zootecnia, Pedagogia, entre outras. O reduzido número de trabalhos científicos com abordagens práticas que visam a construção de ontologias na língua portuguesa do Brasil. Motivação: Hipótese: Como criar ontologias de forma semi-automatizada a partir de documentos textuais que descrevem o modelo de domínio da Segurança Pública? Objetivos Projetar o arcabouço computacional Criar o arcabouço computacional Realizar o Estudo de Caso
  4. Problemas: A inexistência de um arcabouço computacional para a construção de ontologias na língua portuguesa do Brasil. O reduzido número de ontologias disponíveis na língua portuguesa em áreas específicas do conhecimento. A inexistência de ontologias nas áreas de Segurança Pública, Agropecuária, Zootecnia, Pedagogia, entre outras. O reduzido número de trabalhos científicos com abordagens práticas que visam a construção de ontologias na língua portuguesa do Brasil. Motivação: Hipótese: Como criar ontologias de forma semi-automatizada a partir de documentos textuais que descrevem o modelo de domínio da Segurança Pública? Objetivos Projetar o arcabouço computacional Criar o arcabouço computacional Realizar o Estudo de Caso
  5. Pré-Requisito de todas as etapas Etapa mais complexa, termos ligados ao domínio O objetivo é obter os substantivos e seus modificadores (adjetivos e advérbios) Gerar os “termos candidatos” geralmente etapa manual de validação Independente de linguagem – melhor que método linguístico O Term Frequency-Disjoint Corpora Frequency (TF-DCF), baseia-se na frequência do termo absoluto de cada termo, temperada pela sua frequência em outro corpora (contrastante).
  6. São extraídos os candidatos a termos Morfossintática etiquetas morfossintáticas que as identificam como categorias gramaticais (substantivos, verbos, entre outros) gênero e número para um substantivo Expert Advisory Group on Language Engineering Standards (EAGLES) sugere 13 etiquetas básicas Hipótese de Markov A hipótese de que a probabilidade de uma palavra depende apenas da palavra anterior
  7. Relações hierárquicas – Método de Heast ((<Termo1> é um <Termo principal>). descoberta das relações is-a (ou seja, hiperoímia/hiponímia), equivalências, atributos gerais de termos (inclusive relações has-a (tem um) ou part-of (parte de)), Página 28 em diante As relações não-taxonômica são as interações entre os conceitos os verbos são bons indicadores de relações não-taxonômica As relações não-taxonômicas não estão relacionadas com a hierarquia, contribuem na estruturação de um domínio e na classificação de conceitos Abordagem de Serra Independente (propriedade [paí e mãe] e agregação[parte-todo]) ou dependente do domínio (específico da área) Abordagem de Ferreira