SlideShare uma empresa Scribd logo
1 de 28
О МЕТОДОЛОГИИ  НАПОЛНЕНИЯ ОНТОЛОГИЙ Рубашкин В. Ш. кафедр а   информационных систем  в искусстве и гуманитарных науках   Факультет филологии и искусств СПбГУ
Общая ситуация: «Технология впереди методологии» Концептуальное моделирование – область, не имеющая прочных дисциплинарных традиций.  «Междисциплинарная» или «бездисциплинарная»? «Где готовят…?» «Инженерия знаний»? Языковый комплекс RDF/OWL  превращается в стандарт де-факто для сетевого представления знаний.  Как применять?... Границы приличий…
Как наполнять зависит от ответа на вопрос что должно наполняться.  Единого ответа пока нет.  Поэтому приходится начинать с вопроса о  востребованной функциональности онтологии .
[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Целевые технологии   Традиционные : Автоматический перевод:  1. Выбор правильного переводного эквивалента  2. Поддержка синтаксического анализа. 3. Поддержка перевода "по прецедентам" (генерализация образцов).  OCR  и  Speech Recognition : 1. Семантические фильтры (на лексическом и грамматическом уровнях) 2. Поиск подходящего прецедента (генерализация образцов).   Грамматический корректор : 1. Проверка семантических согласований в синтаксических связях. 2. Проверка наличия семантически обязательных элементов в предложении.  3. Поиск подходящего прецедента (генерализация образцов).
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Функциональность двух последних типов в большинстве онтологий отсутствует вообще или реализована не полностью.
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Функциональность двух последних типов в большинстве онтологий отсутствует вообще или реализована не полностью.
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Язык OWL
Как поступать с реальной терминологией, чтобы описать ее средствами OWL? Немногие примеры, предлагаемые в качестве образца и методического руководства и имеющие один источник OWL Web Ontology Language Guide   http://www.w3.org/TR/2004/REC-owl-guide-20040210/ бродят по всему Интернету  и воспроизводятся в тысячах документов.  –  «Виноделие»    –   «Пицца»  Язык OWL   и наполнение   онтологии Natalya Noy -  так приходит слава!
установление отношения объемной совместимости между концептами.  В OWL для этого имеется конструкция  disjointWith .  Конкретный пример – определение несовместимости понятий через использование конструкции  D isjointWith <owl:Class rdf:ID=&quot; Паста &quot;> <rdfs:subClassOf rdf:resource=&quot;# Съестное &quot;/> <owl:disjointWith rdf:resource=&quot;# Мясо &quot;/> <owl:disjointWith rdf:resource=&quot;# Дичь &quot;/> <owl:disjointWith rdf:resource=&quot;# Морепродукты &quot;/> <owl:disjointWith rdf:resource=&quot;# Десерт &quot;/> <owl:disjointWith rdf:resource=&quot;# Фрукты &quot;/> </owl:Class> «каждый с каждым»? - Ср. «Русский семантический словарь»! Язык OWL   и наполнение   онтологии
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Язык OWL   и наполнение   онтологии Далее можно определять несовмесимые подклассы рептилий: <owl:Class rdf:about=&quot;#Amphisbaenidae&quot;> <rdfs:subClassOf rdf:resource=&quot;#Reptile&quot; /> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty rdf:resource=&quot;#family-name&quot;/> <owl:hasValue>Amphisbaenidae</owl:hasValue> </owl:Restriction> </rdfs:subClassOf> </owl:Class> <owl:Class rdf:about=&quot;#Agamidae&quot;> <rdfs:subClassOf rdf:resource=&quot;#Reptile&quot; /> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty rdf:resource=&quot;#family-name&quot;/> <owl:hasValue>Agamidae</owl:hasValue> </owl:Restriction> </rdfs:subClassOf> </owl:Class> и т.д.
Язык OWL   и наполнение   онтологии При таком описании все подклассы исходного класса  обязаны  быть несовместимыми.  Что исключает возможность многоаспектной классификации.  ( DisjointUnionOf  в  OWL   отсутствует.) Макротело   - красный - синий - зеленый -  … - тяжелый - легкий -  … - твердый - жидкий - газ Так таксономия  OWL  может только констатировать, что все перечисляемое есть подклассы класса  Макротело . Нужно : Совместимость признаков и несовместимость их значений
Язык OWL   и наполнение   онтологии Возникают трудности и с формализацией вопросно-ответных соответствий.  (Потеряна связь с соответствующими признаками:  цвет, вес, агрегатное состояние, форма ) Чтобы восстановить эту связь, свойство цвет придется определить так: < owl : ObjectProperty rdf : ID  = ”Цвет”> <rdf:type rdf:resource=&quot;&owl:FunctionalProperty&quot; /> <rdfs:domain rdf:resource = ”#  Макротело ” /> <rdfs:range rdf:resource  = ”#  Макротело ”/>  </owl:ObjectProperty>
Язык OWL   и наполнение   онтологии Для вопроса  Какого цвета (этот) шар?  необходимо формально отграничить  корректные ответы ( Шар  красный )  от некорректных  (Шар  тяжелый , Шар  твердый  и т. д.). Ср. * Какого цвета (этот) синий шар?
Язык OWL   и наполнение   онтологии При традиционном использовании  OWL  остается одна возможность - сформировать искусственные подклассы и переопределить в терминах этих подклассов области значений всех релевантных для исходного класса  Макротело  признаков: Макротело  - Тела имеющие цвет -- красный -- синий -- зеленый --  … - Тела имеющие вес -- тяжелый -- легкий --  … - Тела, характеризующиеся агрегатным состоянием --твердый -- жидкий --  газ
Язык OWL   и наполнение   онтологии Признак  Цвет  теперь можно теперь уточнить так: <owl:ObjectProperty rdf:ID = ” Цвет ”> <rdf:type rdf:resource=&quot;&owl;FunctionalProperty&quot; /> <rdfs:domain rdf:resource = ”#   Макротело ” /> <rdfs:range rdf:resource  = ”#   Тела   имеющие   цвет ”/> </owl:ObjectProperty> В примере «Виноделие»  значения свойства  WineColor   ( красный, белый, розовый, … ) неестественным образом предлагается определять  как индивиды) ! ,[object Object],[object Object],[object Object],[object Object]
Язык OWL   и наполнение   онтологии Следующий естественный шаг: Макротело  -  по цвету: -- красный -- синий -- зеленый --  … - по весу: -- тяжелый -- легкий --  … - по агрегатному состоянию: --твердый -- жидкий --  газ --  …
Язык OWL   и наполнение   онтологии И далее превращаем в  дерево признаков : Макротело  -  по цвету: -- красный -- синий -- зеленый --  … - по весу: -- тяжелый -- легкий --  … - по агрегатному состоянию: --твердый -- жидкий --  газ --  … ,[object Object],[object Object],[object Object],[object Object]
Язык OWL   и наполнение   онтологии Состав собственно таксономии: терминология предметной области  или специально конструируемое &quot;дерево признаков&quot;? Чаще всего набор предметных имен не может быть упорядочен в одном аспекте, но может быть описан в некотором пространстве «призначных координат».  Техническое устройство:   описание в двух аспектах –  - функциональность   - принцип действия  (способ реализации функции).
Язык OWL   и наполнение   онтологии Для конкретных классов объектов обычно возникают специализированные аспекты классификации.  Транспортные средства:   - среда перемещения ( наземный, водный,  воздушный транспорт );  - источник энергии движения  ( электротранспорт ,  топливосжигающий транспорт,  ветровой транспорт, мускульный транспорт,  … ).  Воздушный транспорт:   -  способ создания подъемной силы   (самолет, вертолет,   аэростат) .
Язык OWL   и наполнение   онтологии Конкретные названия будут  определяться  в терминах релевантных таксономических классов.  Троллейбус     НЕРЕЛЬСОВЫЙ  &  ЭЛЕКТРИЧЕСКИЙ  &  ПАССАЖИРСКИЙ  & БЕЗ_АВТОНОМНОГО ИСТОЧНИКА ЭНЕРГИИ
Язык OWL   и наполнение   онтологии Сами имена таксономических классов зачастую вообще не имеют явного представления в профессиональном языке - конструктор онтологии вынужден заниматься терминотворчеством (не всегда удовлетворительным с чисто языковой точки зрения, но неизбежным). SUMO  –  MILO:  SelfPoweredRoadVehicle (subclass SelfPoweredRoadVehicle RoadVehicle) (subclass SelfPoweredRoadVehicle PoweredVehicle) (documentation SelfPoweredRoadVehicle EnglishLanguage   &quot;  …   &% SelfPoweredRoadVehicle  covers motorcycles, semi-trailers, RVs, etc., as well as Automobiles.  This class includes vehicles powered by electricity, gasoline, diesel, and other fuels.&quot;)
Общие рекомендации 1)  Объектом формализации должны быть не отдельные термины, а терминосистемы, представляющие определенную предметную область.  Формализация должна быть одинаковой для всего ряда однотипных языковых явлений.  2)  Формализация  частных терминосистем должна опираться на хорошо выстроенную онтологию верхнего уровня
Действия по формализации частных терминосистем 1)  Содержательный анализ словарных определений и вычленение из них базовых признаков и других информационно значимых элементов. 2)  Построение иерархической системы базовых признаков для рассматриваемой предметной области (&quot;дерева признаков&quot;). 3)  Логическая реконструкция словарных определений в терминах построенной на этапе 2 системы базовых признаков.  4)  Перевод полученных толкований на язык описания лексики, принятый в онторедакторе. Логический контроль должен быть &quot;зашит&quot; в технологию ввода;  должен не  обнаруживать  ошибки, а  предотвращать  их появление.

Mais conteúdo relacionado

Destaque

Twitter 101 in 30 minutes
Twitter 101 in 30 minutesTwitter 101 in 30 minutes
Twitter 101 in 30 minutesCindy Kendall
 
Time Management Movie Ppt Version Sample
Time Management Movie Ppt Version SampleTime Management Movie Ppt Version Sample
Time Management Movie Ppt Version SampleAndrew Schwartz
 
B24 t043 performance_testing
B24 t043 performance_testingB24 t043 performance_testing
B24 t043 performance_testingGlen Gatin
 
Queensland Public Library Conference
Queensland Public Library ConferenceQueensland Public Library Conference
Queensland Public Library Conferenceguest5bb72f
 
Paulus
PaulusPaulus
Pauluseka
 
A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...
A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...
A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...jaumebp
 
Halloween 2007
Halloween 2007Halloween 2007
Halloween 2007CarCal
 
Aviaq P
Aviaq PAviaq P
Aviaq Peka
 
S Kerr Ip3 Part 2, Continued
S Kerr Ip3 Part 2, ContinuedS Kerr Ip3 Part 2, Continued
S Kerr Ip3 Part 2, Continuedkerrshar
 
Latvia PowerPoint Content
Latvia PowerPoint Content Latvia PowerPoint Content
Latvia PowerPoint Content Andrew Schwartz
 

Destaque (12)

Twitter 101 in 30 minutes
Twitter 101 in 30 minutesTwitter 101 in 30 minutes
Twitter 101 in 30 minutes
 
Time Management Movie Ppt Version Sample
Time Management Movie Ppt Version SampleTime Management Movie Ppt Version Sample
Time Management Movie Ppt Version Sample
 
B24 t043 performance_testing
B24 t043 performance_testingB24 t043 performance_testing
B24 t043 performance_testing
 
Queensland Public Library Conference
Queensland Public Library ConferenceQueensland Public Library Conference
Queensland Public Library Conference
 
Paulus
PaulusPaulus
Paulus
 
A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...
A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...
A Mixed Discrete-Continuous Attribute List Representation for Large Scale Cla...
 
Halloween 2007
Halloween 2007Halloween 2007
Halloween 2007
 
Milieu
MilieuMilieu
Milieu
 
Discover SEM
Discover SEMDiscover SEM
Discover SEM
 
Aviaq P
Aviaq PAviaq P
Aviaq P
 
S Kerr Ip3 Part 2, Continued
S Kerr Ip3 Part 2, ContinuedS Kerr Ip3 Part 2, Continued
S Kerr Ip3 Part 2, Continued
 
Latvia PowerPoint Content
Latvia PowerPoint Content Latvia PowerPoint Content
Latvia PowerPoint Content
 

Semelhante a I M S Rubashkin

WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...AINL Conferences
 
Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных. Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных. Victor Agroskin
 
Построение системы онтологий для предметной области “Петрология”
Построение системы онтологий для предметной области “Петрология”Построение системы онтологий для предметной области “Петрология”
Построение системы онтологий для предметной области “Петрология”Alex Shkotin
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text AlalizeOchirov Tsyren
 
разработка бизнес приложений (6)
разработка бизнес приложений (6)разработка бизнес приложений (6)
разработка бизнес приложений (6)Alexander Gornik
 
Msu.Center.Lectures.J02 Classes And Objects
Msu.Center.Lectures.J02 Classes And ObjectsMsu.Center.Lectures.J02 Classes And Objects
Msu.Center.Lectures.J02 Classes And Objectsolegol
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. Lidia Pivovarova
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 finalyaevents
 
Devconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataDevconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataLeonid Yuriev
 
Msu.Center.Lectures.J03 Oop And Uml
Msu.Center.Lectures.J03 Oop And UmlMsu.Center.Lectures.J03 Oop And Uml
Msu.Center.Lectures.J03 Oop And Umlolegol
 
Диаграмма классов
Диаграмма классовДиаграмма классов
Диаграмма классовDEVTYPE
 
Павел Павлов - Scala для профессионалов - Joker 2013
Павел Павлов - Scala для профессионалов - Joker 2013Павел Павлов - Scala для профессионалов - Joker 2013
Павел Павлов - Scala для профессионалов - Joker 2013ScalaNsk
 

Semelhante a I M S Rubashkin (20)

Dialog
DialogDialog
Dialog
 
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...
 
Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных. Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных.
 
OntoEd
OntoEdOntoEd
OntoEd
 
Построение системы онтологий для предметной области “Петрология”
Построение системы онтологий для предметной области “Петрология”Построение системы онтологий для предметной области “Петрология”
Построение системы онтологий для предметной области “Петрология”
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
 
Yablomsky
YablomskyYablomsky
Yablomsky
 
Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015
 
разработка бизнес приложений (6)
разработка бизнес приложений (6)разработка бизнес приложений (6)
разработка бизнес приложений (6)
 
Msu.Center.Lectures.J02 Classes And Objects
Msu.Center.Lectures.J02 Classes And ObjectsMsu.Center.Lectures.J02 Classes And Objects
Msu.Center.Lectures.J02 Classes And Objects
 
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций.
 
Методы интеграции разнородных онтологий
Методы интеграции разнородных онтологийМетоды интеграции разнородных онтологий
Методы интеграции разнородных онтологий
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
 
Devconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataDevconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigData
 
rubashkin
rubashkinrubashkin
rubashkin
 
Msu.Center.Lectures.J03 Oop And Uml
Msu.Center.Lectures.J03 Oop And UmlMsu.Center.Lectures.J03 Oop And Uml
Msu.Center.Lectures.J03 Oop And Uml
 
Проблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстовПроблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстов
 
Диаграмма классов
Диаграмма классовДиаграмма классов
Диаграмма классов
 
Павел Павлов - Scala для профессионалов - Joker 2013
Павел Павлов - Scala для профессионалов - Joker 2013Павел Павлов - Scala для профессионалов - Joker 2013
Павел Павлов - Scala для профессионалов - Joker 2013
 

Mais de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Mais de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

I M S Rubashkin

  • 1. О МЕТОДОЛОГИИ НАПОЛНЕНИЯ ОНТОЛОГИЙ Рубашкин В. Ш. кафедр а информационных систем в искусстве и гуманитарных науках Факультет филологии и искусств СПбГУ
  • 2. Общая ситуация: «Технология впереди методологии» Концептуальное моделирование – область, не имеющая прочных дисциплинарных традиций. «Междисциплинарная» или «бездисциплинарная»? «Где готовят…?» «Инженерия знаний»? Языковый комплекс RDF/OWL превращается в стандарт де-факто для сетевого представления знаний. Как применять?... Границы приличий…
  • 3. Как наполнять зависит от ответа на вопрос что должно наполняться. Единого ответа пока нет. Поэтому приходится начинать с вопроса о востребованной функциональности онтологии .
  • 4.
  • 5.
  • 6.
  • 7.
  • 8. Целевые технологии Традиционные : Автоматический перевод: 1. Выбор правильного переводного эквивалента 2. Поддержка синтаксического анализа. 3. Поддержка перевода &quot;по прецедентам&quot; (генерализация образцов). OCR и Speech Recognition : 1. Семантические фильтры (на лексическом и грамматическом уровнях) 2. Поиск подходящего прецедента (генерализация образцов). Грамматический корректор : 1. Проверка семантических согласований в синтаксических связях. 2. Проверка наличия семантически обязательных элементов в предложении. 3. Поиск подходящего прецедента (генерализация образцов).
  • 9.
  • 10.
  • 11.
  • 12. Как поступать с реальной терминологией, чтобы описать ее средствами OWL? Немногие примеры, предлагаемые в качестве образца и методического руководства и имеющие один источник OWL Web Ontology Language Guide http://www.w3.org/TR/2004/REC-owl-guide-20040210/ бродят по всему Интернету и воспроизводятся в тысячах документов. – «Виноделие» – «Пицца» Язык OWL и наполнение онтологии Natalya Noy - так приходит слава!
  • 13. установление отношения объемной совместимости между концептами. В OWL для этого имеется конструкция disjointWith . Конкретный пример – определение несовместимости понятий через использование конструкции D isjointWith <owl:Class rdf:ID=&quot; Паста &quot;> <rdfs:subClassOf rdf:resource=&quot;# Съестное &quot;/> <owl:disjointWith rdf:resource=&quot;# Мясо &quot;/> <owl:disjointWith rdf:resource=&quot;# Дичь &quot;/> <owl:disjointWith rdf:resource=&quot;# Морепродукты &quot;/> <owl:disjointWith rdf:resource=&quot;# Десерт &quot;/> <owl:disjointWith rdf:resource=&quot;# Фрукты &quot;/> </owl:Class> «каждый с каждым»? - Ср. «Русский семантический словарь»! Язык OWL и наполнение онтологии
  • 14.
  • 15. Язык OWL и наполнение онтологии Далее можно определять несовмесимые подклассы рептилий: <owl:Class rdf:about=&quot;#Amphisbaenidae&quot;> <rdfs:subClassOf rdf:resource=&quot;#Reptile&quot; /> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty rdf:resource=&quot;#family-name&quot;/> <owl:hasValue>Amphisbaenidae</owl:hasValue> </owl:Restriction> </rdfs:subClassOf> </owl:Class> <owl:Class rdf:about=&quot;#Agamidae&quot;> <rdfs:subClassOf rdf:resource=&quot;#Reptile&quot; /> <rdfs:subClassOf> <owl:Restriction> <owl:onProperty rdf:resource=&quot;#family-name&quot;/> <owl:hasValue>Agamidae</owl:hasValue> </owl:Restriction> </rdfs:subClassOf> </owl:Class> и т.д.
  • 16. Язык OWL и наполнение онтологии При таком описании все подклассы исходного класса обязаны быть несовместимыми. Что исключает возможность многоаспектной классификации. ( DisjointUnionOf в OWL отсутствует.) Макротело - красный - синий - зеленый - … - тяжелый - легкий - … - твердый - жидкий - газ Так таксономия OWL может только констатировать, что все перечисляемое есть подклассы класса Макротело . Нужно : Совместимость признаков и несовместимость их значений
  • 17. Язык OWL и наполнение онтологии Возникают трудности и с формализацией вопросно-ответных соответствий. (Потеряна связь с соответствующими признаками: цвет, вес, агрегатное состояние, форма ) Чтобы восстановить эту связь, свойство цвет придется определить так: < owl : ObjectProperty rdf : ID = ”Цвет”> <rdf:type rdf:resource=&quot;&owl:FunctionalProperty&quot; /> <rdfs:domain rdf:resource = ”# Макротело ” /> <rdfs:range rdf:resource = ”# Макротело ”/> </owl:ObjectProperty>
  • 18. Язык OWL и наполнение онтологии Для вопроса Какого цвета (этот) шар? необходимо формально отграничить корректные ответы ( Шар красный ) от некорректных (Шар тяжелый , Шар твердый и т. д.). Ср. * Какого цвета (этот) синий шар?
  • 19. Язык OWL и наполнение онтологии При традиционном использовании OWL остается одна возможность - сформировать искусственные подклассы и переопределить в терминах этих подклассов области значений всех релевантных для исходного класса Макротело признаков: Макротело - Тела имеющие цвет -- красный -- синий -- зеленый -- … - Тела имеющие вес -- тяжелый -- легкий -- … - Тела, характеризующиеся агрегатным состоянием --твердый -- жидкий -- газ
  • 20.
  • 21. Язык OWL и наполнение онтологии Следующий естественный шаг: Макротело - по цвету: -- красный -- синий -- зеленый -- … - по весу: -- тяжелый -- легкий -- … - по агрегатному состоянию: --твердый -- жидкий -- газ -- …
  • 22.
  • 23. Язык OWL и наполнение онтологии Состав собственно таксономии: терминология предметной области или специально конструируемое &quot;дерево признаков&quot;? Чаще всего набор предметных имен не может быть упорядочен в одном аспекте, но может быть описан в некотором пространстве «призначных координат». Техническое устройство: описание в двух аспектах – - функциональность - принцип действия (способ реализации функции).
  • 24. Язык OWL и наполнение онтологии Для конкретных классов объектов обычно возникают специализированные аспекты классификации. Транспортные средства: - среда перемещения ( наземный, водный, воздушный транспорт ); - источник энергии движения ( электротранспорт , топливосжигающий транспорт, ветровой транспорт, мускульный транспорт, … ). Воздушный транспорт: - способ создания подъемной силы (самолет, вертолет, аэростат) .
  • 25. Язык OWL и наполнение онтологии Конкретные названия будут определяться в терминах релевантных таксономических классов. Троллейбус  НЕРЕЛЬСОВЫЙ & ЭЛЕКТРИЧЕСКИЙ & ПАССАЖИРСКИЙ & БЕЗ_АВТОНОМНОГО ИСТОЧНИКА ЭНЕРГИИ
  • 26. Язык OWL и наполнение онтологии Сами имена таксономических классов зачастую вообще не имеют явного представления в профессиональном языке - конструктор онтологии вынужден заниматься терминотворчеством (не всегда удовлетворительным с чисто языковой точки зрения, но неизбежным). SUMO – MILO: SelfPoweredRoadVehicle (subclass SelfPoweredRoadVehicle RoadVehicle) (subclass SelfPoweredRoadVehicle PoweredVehicle) (documentation SelfPoweredRoadVehicle EnglishLanguage &quot; … &% SelfPoweredRoadVehicle covers motorcycles, semi-trailers, RVs, etc., as well as Automobiles. This class includes vehicles powered by electricity, gasoline, diesel, and other fuels.&quot;)
  • 27. Общие рекомендации 1) Объектом формализации должны быть не отдельные термины, а терминосистемы, представляющие определенную предметную область. Формализация должна быть одинаковой для всего ряда однотипных языковых явлений. 2) Формализация частных терминосистем должна опираться на хорошо выстроенную онтологию верхнего уровня
  • 28. Действия по формализации частных терминосистем 1) Содержательный анализ словарных определений и вычленение из них базовых признаков и других информационно значимых элементов. 2) Построение иерархической системы базовых признаков для рассматриваемой предметной области (&quot;дерева признаков&quot;). 3) Логическая реконструкция словарных определений в терминах построенной на этапе 2 системы базовых признаков. 4) Перевод полученных толкований на язык описания лексики, принятый в онторедакторе. Логический контроль должен быть &quot;зашит&quot; в технологию ввода; должен не обнаруживать ошибки, а предотвращать их появление.