SlideShare uma empresa Scribd logo
1 de 102
Открытые базы знаний и
семантические вики
Катков Юрий, WikiVote!

1
Содержание
• Linked Open Data и Semantic Web
• Стандарты LOD
• Основные базы знаний и примеры использования
• Dbpedia
• Мастер-класс по Dbpedia

2
Semantic web и Linked Data
Основные стандарты

3
Linked Open Data и Semantic Web
• Открытые базы знаний являются частью направления Semantic
Web
• Ядром Semantic Web являются стандарты
• Объект стандартизации – способ представления и обмена
данными
• Linked Data использует только часть стандартов Semantic Web

4
5

Слоеный пирог SW
6

Слоеный пирог SW
URI

URL – частный
случай URI
Uniform Resource Identifier

основное правило: не существует двух объектов с
одинаковыми URI

7
8

Слоеный пирог SW
RDF позволяет представлять данные
в виде троек, формируя граф данных
( subject , predicate , object )

9
RDF позволяет представлять данные
в виде троек, формируя граф данных
( subject , predicate , object )

URI

URI

URI или литерал
10
Леонардо да Винчи родился в
городе Винчи 15 апреля 1452 года
Леонардо место_рождения Винчи
Леонардо дата_рождения 15.04.1452
<http://ex.org/Leo> <http://ex.org/birthDate> "1452-04-15"^^xsd:date
<http://ex.org/Leo> <http://ex.org/birthPlace> <http://ex.org/Vinci>

11
RDF позволяет представлять данные
в виде троек, формируя граф данных
( subject , predicate , object )
вершина

ребро

вершина
12
13
14
15
16
RDF имеет несколько способов записи

17
Turtle

N3

N-triples

RDF имеет несколько способов записи

18
@prefix xsd:
<http://www.w3.org/2001/XMLSchema#> .
@prefix ex: <http://ex.org/> .

ex:Leo ex:birthDate "1452-04-15"^^xsd:date .
ex:Leo ex:birthPlace ex:Vinci .

19
Turtle

N3

N-triples

RDF имеет несколько способов записи
XML
JSON
20
<?xml version="1.0"?>
<rdf:RDF
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:ex="http://ex.org/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntaxns#">
<rdf:Description rdf:about="http://ex.org/Leo">
<ex:birthDate rdf:datatype =
"http://www.w3.org/2001/XMLSchema#date">1452-04-15
</ex:birthDate>
<ex:birthPlace rdf:resource="http://ex.org/Vinci" />
</rdf:Description>
</rdf:RDF>
21
22

Слоеный пирог SW
RDFS и OWL
Стандарты для создания структурированных словарей

23
RDFS и OWL
Стандарты для создания структурированных словарей

24
RDFS и OWL
Стандарты для создания структурированных словарей

25
RDFS и OWL
Стандарты для создания

26
RDFS и OWL
Стандарты для создания

27
глоссариев

RDFS и OWL
Стандарты для создания

28
тезаурусов

глоссариев

RDFS и OWL
Стандарты для создания

29
тезаурусов

глоссариев

RDFS и OWL
Стандарты для создания

тематических карт
30
тезаурусов

глоссариев

RDFS и OWL
Стандарты для создания

тематических карт
31
тезаурусов

глоссариев
семантических сетей

RDFS и OWL
Стандарты для создания

тематических карт
32
тезаурусов

глоссариев
семантических сетей

RDFS и OWL
Стандарты для создания

тематических карт
33
тезаурусов

глоссариев
семантических сетей

RDFS и OWL
Стандарты для создания

TBox
тематических карт
34
тезаурусов

глоссариев
семантических сетей

RDFS и OWL
Стандарты для создания

онтологий

TBox
тематических карт
35
тезаурусы

глоссарии
семантические сети

ЗАЧЕМ НУЖНЫ
онтологии

TBox
тематические карты
36
Онтологии нужны для

37
стандартизации
терминологии

«

Предложение: связь национальность
Будем всегда называть термином
http://dbpedia.org/property/nationality

»

Онтологии нужны для

38
стандартизации
терминологии

«
«

Предложение: связь национальность
Будем всегда называть термином
http://dbpedia.org/property/nationality

Давайте, если говорим о Леонардо да
Винчи, будем всегда пользоваться его
идентификатором в Dbpedia

»
»

Онтологии нужны для
Любой, кто имеет свойство
национальность, является
человеком, а его национальность
является страной. А страна – это
частный случай населенного места

«

»

автоматического
обогащения данных
39
40
41
42
43
44
45
46

Слоеный пирог SW
SPARQL
Запросы к RDF-данным

47
SPARQL
SPARQL Protocol
and
RDF Query Language

48
Выполняем на dbpedia.org/sparql

PREFIX rdf:
<http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dbpedia-owl:
<http://dbpedia.org/ontology/>

SELECT * WHERE
{
?a rdf:type dbpedia-owl:Company .
}
LIMIT 100
OFFSET 300
49
50
Запрос:
?a rdf:type dbpedia-owl:Company

51
Запрос:
?a rdf:type dbpedia-owl:Company

52
Открытые базы знаний
Обзор состава данных Linked data
Применение в реальных приложениях

53
54
55
56
57
58
59
60
61
данные

Откуда берутся дети?

62
данные

Откуда берутся дети?

63
данные

Откуда берутся дети?

64
данные

Откуда берутся дети?
SIOC

exporters

65
66
Для чего нужны данные

67
Открытые гос. данные

68
Для чего нужны данные

69
Рекомендационные
системы

70
Для чего нужны данные

71
72
Для чего нужны данные

73
Pubmed

SNOMED-CT

74
Для чего нужны данные

75
CKAN

Как искать данные
Q&A

Mailing lists

76
77
Как знакомиться
с данными
VoiD

Linksailor

Semantic Sitemap
78
http://freebase.com/

79
http://mappings.dbpedia.org/server/statistics/ru/

80
Пробные SPARQL-запросы

SELECT DISTINCT ?p
WHERE
{
?s ?p ?o .
}
LIMIT 1000
81
Пробные SPARQL-запросы
SELECT ?p
(COUNT ?p as ?countPredicate)
WHERE {
?s ?p ?o
}
GROUP BY ?p
ORDER BY DESC (?countPredicate)
LIMIT 100

16.03.2012

Прагматическое введение в Linked Data

82
Повсеместно используемые термины

rdf:type

owl:Class
skos:Concept

a
rdfs:subClassOf

owl:sameAs

rdfs:label

rdfs:Class
83
Очень частые термины
foaf:name
skos:related

dc:subject

rdfs:range

rdfs:domain

84
http://dbpedia.org/sparql
SELECT * WHERE
{
?a <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Company> .
}
LIMIT 100

93
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>
SELECT * WHERE
{
?a rdf:type dbpedia-owl:Company .
}
LIMIT 100

94
SELECT * WHERE
{
?a rdf:type dbpedia-owl:Company .
}
LIMIT 100

95
SELECT * WHERE
{
?a rdf:type
dbpedia-owl:Company .
?a dbpprop:companyName ?corporation .
}
LIMIT 100

96
SELECT * WHERE
{

;

?a rdf:type
dbpedia-owl:Company
dbpprop:companyName ?corporation .
}
LIMIT 100

97
SELECT * WHERE
{
?companyURL rdf:type
dbpedia-owl:Company ;
dbpprop:companyName ?corporation
dbpedia-owl:foundedBy ?founderURL
}
LIMIT 100

;
.

98
SELECT * WHERE
{
?companyURL rdf:type
dbpedia-owl:Company;
dbpprop:companyName ?corporation
;
dbpedia-owl:foundedBy ?founderURL
.
?founderURL rdf:type
dbpedia-owl:Artist .
}
LIMIT 100

99
SELECT * WHERE
{
?companyURL rdf:type
dbpedia-owl:Company ;
dbpprop:companyName ?corporation
;
dbpedia-owl:foundedBy ?founderURL
.
{ ?founderURL rdf:type dbpedia-owl:Artist. }
UNION
{ ?founderURL rdf:type dbpedia-owl:Actor. }
UNION
{ ?founderURL rdf:type dbpedia-owl:MartialArtist. }
UNION
{ ?founderURL dbpedia-owl:occupation dbpedia:Martial_arts.}
}
LIMIT 100
100
SELECT * WHERE
{
?companyURL rdf:type
dbpedia-owl:Company ;
dbpprop:companyName ?corporation
;
dbpedia-owl:foundedBy ?founderURL
.
?founderURL rdf:type
dbpedia-owl:Artist
;
rdf:type
dbpedia-owl:Actor
;
rdf:type
dbpedia-owl:MartialArtist ;
dbpedia-owl:occupation dbpedia:Martial_arts .
}
LIMIT 100

101
SELECT * WHERE
{
?companyURL rdf:type
dbpedia-owl:Company ;
dbpprop:companyName ?corporation
;
dbpedia-owl:foundedBy ?founderURL
.
?founderURL dbpedia-owl:birthDate ?founderBirth
.
FILTER (?founderBirth > "1940-03-10"^^xsd:date )
.
{ ?founderURL rdf:type dbpedia-owl:Artist. }
UNION
{ ?founderURL rdf:type dbpedia-owl:Actor. }
UNION
{ ?founderURL rdf:type dbpedia-owl:MartialArtist. }
UNION
{ ?founderURL dbpedia-owl:occupation dbpedia:Martial_arts.}
}
LIMIT 100
102

Mais conteúdo relacionado

Destaque

Обзор рекомендаций W3C
Обзор рекомендаций W3CОбзор рекомендаций W3C
Обзор рекомендаций W3CGetDev.NET
 
Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)
Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)
Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)PayDox
 
Прагматическое введение в Linked data - применения. Поиск данных
Прагматическое введение в Linked data - применения. Поиск данныхПрагматическое введение в Linked data - применения. Поиск данных
Прагматическое введение в Linked data - применения. Поиск данныхYury Katkov
 
формализация смысла комических текстов через концепцию инвективных имен
формализация смысла комических текстов через концепцию инвективных именформализация смысла комических текстов через концепцию инвективных имен
формализация смысла комических текстов через концепцию инвективных именYury Katkov
 
IBM ECM & Discovery Strategy
IBM ECM & Discovery StrategyIBM ECM & Discovery Strategy
IBM ECM & Discovery StrategyIBM IBM
 
Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"
Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"
Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"DIRECTUM
 
Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"
Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"
Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"DIRECTUM
 
DIRECTUM: возможности системы электронного документооборота
DIRECTUM: возможности системы электронного документооборотаDIRECTUM: возможности системы электронного документооборота
DIRECTUM: возможности системы электронного документооборотаDIRECTUM
 
Тестирование в BI проектах
Тестирование в BI проектахТестирование в BI проектах
Тестирование в BI проектахSQALab
 
Презентация - Обзор BPM CBOK
Презентация - Обзор BPM CBOK Презентация - Обзор BPM CBOK
Презентация - Обзор BPM CBOK Andrey Koptelov
 

Destaque (10)

Обзор рекомендаций W3C
Обзор рекомендаций W3CОбзор рекомендаций W3C
Обзор рекомендаций W3C
 
Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)
Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)
Адаптивный кейс-менеджмент (ACM) vs. BPM и ECM (СЭД)
 
Прагматическое введение в Linked data - применения. Поиск данных
Прагматическое введение в Linked data - применения. Поиск данныхПрагматическое введение в Linked data - применения. Поиск данных
Прагматическое введение в Linked data - применения. Поиск данных
 
формализация смысла комических текстов через концепцию инвективных имен
формализация смысла комических текстов через концепцию инвективных именформализация смысла комических текстов через концепцию инвективных имен
формализация смысла комических текстов через концепцию инвективных имен
 
IBM ECM & Discovery Strategy
IBM ECM & Discovery StrategyIBM ECM & Discovery Strategy
IBM ECM & Discovery Strategy
 
Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"
Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"
Practicum DIRECTUM. Прощание с бумагой. Расставляем все точки над "i"
 
Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"
Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"
Вебинар "Practicum DIRECTUM. Lean + ECM = рецепт офисной кухни"
 
DIRECTUM: возможности системы электронного документооборота
DIRECTUM: возможности системы электронного документооборотаDIRECTUM: возможности системы электронного документооборота
DIRECTUM: возможности системы электронного документооборота
 
Тестирование в BI проектах
Тестирование в BI проектахТестирование в BI проектах
Тестирование в BI проектах
 
Презентация - Обзор BPM CBOK
Презентация - Обзор BPM CBOK Презентация - Обзор BPM CBOK
Презентация - Обзор BPM CBOK
 

Semelhante a школа открытых данны. открытые базы знаний и семантические вики

Технологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDFТехнологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDFAlik Kirillovich
 
построение хранилищ
построение хранилищпостроение хранилищ
построение хранилищYury Katkov
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...Vitaly Yushkevich
 
Linked data, semantic web и семантические вики
Linked data, semantic web и семантические викиLinked data, semantic web и семантические вики
Linked data, semantic web и семантические викиYury Katkov
 
разработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSwразработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSwYury Katkov
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS) Fred Kozlov
 
Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Irene Pochinok
 
Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных. Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных. Victor Agroskin
 
Открытые данные в образовании
Открытые данные в образованииОткрытые данные в образовании
Открытые данные в образованииMikhail Navrotskii
 
Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Timur Ovadia Berezin
 
Devconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataDevconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataLeonid Yuriev
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 finalyaevents
 
THOR: Technical and Human infrastructure for Open Research
THOR: Technical and Human infrastructure for Open ResearchTHOR: Technical and Human infrastructure for Open Research
THOR: Technical and Human infrastructure for Open ResearchIrina Radchenko
 
Использование цифрового идентификатора объекта (DOI) в современной научной ко...
Использование цифрового идентификатора объекта (DOI) в современной научной ко...Использование цифрового идентификатора объекта (DOI) в современной научной ко...
Использование цифрового идентификатора объекта (DOI) в современной научной ко...Alexey Skalaban
 
Open data: quality and values
Open data: quality and valuesOpen data: quality and values
Open data: quality and valuesIrina Radchenko
 
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...Open City Foundation
 
РИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigDataРИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigDataLeonid Yuriev
 
Web осень 2012 лекция 5
Web осень 2012 лекция 5Web осень 2012 лекция 5
Web осень 2012 лекция 5Technopark
 
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИITMO University
 

Semelhante a школа открытых данны. открытые базы знаний и семантические вики (20)

Технологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDFТехнологии Semantic Web. Часть II. Формат представления данных RDF
Технологии Semantic Web. Часть II. Формат представления данных RDF
 
построение хранилищ
построение хранилищпостроение хранилищ
построение хранилищ
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
 
Linked data, semantic web и семантические вики
Linked data, semantic web и семантические викиLinked data, semantic web и семантические вики
Linked data, semantic web и семантические вики
 
разработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSwразработка методов извлечения информации из веб ресурсовSw
разработка методов извлечения информации из веб ресурсовSw
 
Linked Open Data (EIS)
Linked Open Data (EIS) Linked Open Data (EIS)
Linked Open Data (EIS)
 
Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...
 
Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных. Реальный мир и хорошие модели данных.
Реальный мир и хорошие модели данных.
 
Открытые данные в образовании
Открытые данные в образованииОткрытые данные в образовании
Открытые данные в образовании
 
Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017
 
Devconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigDataDevconf-2014: Ноотропы для BigData
Devconf-2014: Ноотропы для BigData
 
2 неделя 27_03_2013
2 неделя 27_03_20132 неделя 27_03_2013
2 неделя 27_03_2013
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
 
THOR: Technical and Human infrastructure for Open Research
THOR: Technical and Human infrastructure for Open ResearchTHOR: Technical and Human infrastructure for Open Research
THOR: Technical and Human infrastructure for Open Research
 
Использование цифрового идентификатора объекта (DOI) в современной научной ко...
Использование цифрового идентификатора объекта (DOI) в современной научной ко...Использование цифрового идентификатора объекта (DOI) в современной научной ко...
Использование цифрового идентификатора объекта (DOI) в современной научной ко...
 
Open data: quality and values
Open data: quality and valuesOpen data: quality and values
Open data: quality and values
 
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
Антон Полухин, Данные «Портала открытых данных правительства Москвы» в формат...
 
РИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigDataРИТ-2014: Ноотропы RDF для BigData
РИТ-2014: Ноотропы RDF для BigData
 
Web осень 2012 лекция 5
Web осень 2012 лекция 5Web осень 2012 лекция 5
Web осень 2012 лекция 5
 
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
ПРИМЕНЕНИЕ ОНТОЛОГИЙ В СИСТЕМЕ УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ РЕСУРСАМИ
 

школа открытых данны. открытые базы знаний и семантические вики

Notas do Editor

  1. Навеяно презентацией Елены Симперл в школе ESWC2011: http://summerschool.eswc2011.org/sites/default/files/eswcsummerschool2010_ontologies_final.pdf
  2. Навеяно презентацией Елены Симперл в школе ESWC2011: http://summerschool.eswc2011.org/sites/default/files/eswcsummerschool2010_ontologies_final.pdf