SlideShare uma empresa Scribd logo
1 de 16
Baixar para ler offline
RDF БАЗИ ОТ ДАННИ
Доц. д-р Цветанка Георгиева-Трифонова
RDF БАЗИ ОТ ДАННИ – СЪДЪРЖАНИЕ
 Характеристики на RDF (Resource Description
Framework) базите от данни
 Предимства на RDF бази от данни
 Сравняване на RDF с XML и релационни бази от
данни
22Цветанка Георгиева Моделиране на информационни системи
ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ
 RDF системите за бази от данни
 са стандартизирани NoSQL решения, които се основават
на:
 прост, единен модел на данни;
 мощен, декларативен език за заявки.
 предлагат преносимост на данните и съвместимост между
конкурентни приложения.
33Цветанка Георгиева Моделиране на информационни системи
ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ
 RDF системите за бази от данни формират подмножество на
графовите бази от данни – една от категориите NoSQL бази
от данни.
 Примери за RDF бази от данни са:
 AllegroGraph, Virtuoso, Stardog, др.;
 както и такива с отворен код: ARC, 4store, др.
 RDF данните могат да бъдат разглеждани като насочен граф,
където дъгите:
 започват с URI на субектите;
 имат етикети с URI на предикатите;
 завършват, като сочат URI на обектите или скаларни
стойности.
44Цветанка Георгиева Моделиране на информационни системи
ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ
 Пример
55Цветанка Георгиева Моделиране на информационни системи
ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ
 Прост и единен стандартен модел на данните
 NoSQL базите от данни имат специфични модели на
данните и възможности, предназначени специално за
всяка реализация;
 Като правило, тези модели на данните не са нито
съвместими, нито стандартизирани и обикновено са
описани в документацията на съответната версия на
конкретния програмен продукт;
 В сравнение с тях системите за RDF бази от данни
използват един добре дефиниран и W3C-стандартизиран
модел на данните.
66Цветанка Георгиева Моделиране на информационни системи
ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ
 Стандартизирани формати за обмен на информация
 Някои NoSQL бази от данни имат възможност за
импорт/експорт от/към структури, специфични за
реализацията, представени в XML или JSON формат.
 От друга страна всички RDF бази от данни имат
възможност за импорт/експорт въз основа на добре
дефинирани, стандартизирани формати за сериализиране
като RDF/XML, N-Triples, N-Quads, др.
77Цветанка Георгиева Моделиране на информационни системи
ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ
 Мощен стандартен език за заявки
 NoSQL базите от данни обикновено не предоставят
декларативен език за заявки от високо ниво, подобен на
SQL;
 Изпълняването на заявки при тези бази от данни се
програмира според конкретния модел на данните, според
конкретния език и дори според конкретно приложение;
 Ако е налице език за заявки, той е напълно специфичен
за реализацията (например SimpleDB или GQL);
 SPARQL е голямо предимство за RDF базите от данни, тъй
като представлява стандартен език за заявки, който има
възможности, сравними с тези на SQL и е дефиниран при
запазване на голяма част от познатия синтаксис.
88Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
 Преносимост на данните
 При използване на различни конкуриращи се системи за
бази от данни, за да се:
 включат множество различни решения едновременно;
 обменят данни с външни организации,
 данните могат да бъдат предавани, без да се налага да се
пише и използва допълнителен потребителски код за
преобразуване на някои формати и структури от данни в
други несъвместими формати и структури от данни.
99Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
 Съвместимост (Toolchain interoperability)
 Библиотеките и инструментите (toolchains) за RDF
обикновено не са или са слабо свързани с конкретната
реализация на СУБД;
 По принцип не е от значение с коя специално RDF-
базирана система се осъществява връзката, ако
например се използва и програмира с Jena или Sesame
за Java и Scala, RDFLib за Python, ARC за PHP или RDF.rb
за Ruby;
 Подобно на релационните бази от данни, RDF-базираният
код не трябва да се променя, само защото е нужно да се
направи еквивалент на преминаване от MySQL към
PostgreSQL.
1010Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
 Липсва зависимост от доставчика (No vendor lock-in)
 Ако дадено приложение използва RDF базата от данни X,
но по някаква причина възникнат проблеми, то може да
се извърши преминаване към RDF база от данни Y или Z
или някоя друга от наличните съвместими решения;
 Тази задача не толкова тежка, в сравнение с
превключване между две не-RDF решения.
1111Цветанка Георгиева Моделиране на информационни системи
ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ
ДАННИ
 Гарантирано бъдеще
 RDF е дефиниран стандарт за публикуване на свързани
данни (linked data) в интернет и е изцяло построен въз
основа на утвърдени стандарти като URI адреси;
 Напълно основателно може да се предположи, че RDF
данните ще бъдат използваеми в бъдеще;
 Не може да се твърди същото за някои от другите NoSQL
решения, много от които неизбежно ще се окажат по-
скоро краткотрайни.
1212Цветанка Георгиева Моделиране на информационни системи
СРАВНЯВАНЕ НА RDF С XML
 XML се използва за представяне на модел на
полуструктурираните данни
 Йерархична структура с вложени елементи, която е дърво,
но в общия случай може да представлява граф;
 Служи за представяне на структурата и семантиката на
данните.
 Моделите на XML данните и RDF данните са различни
 Моделът на RDF данните:
 е граф (съвкупност от субект/предикат/обект изрази);
 служи за представяне на семантиката на данните;
 е абстрактен модел с няколко формати за
сериализиране, един от които е RDF/XML.
1313Цветанка Георгиева Моделиране на информационни системи
СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ
ДАННИ
 RDF данните могат да бъдат представени с помощта на
релационния модел.
 Отделните твърдения в RDF се изразяват като триплети от
субект, предикат, обект.
 Множества от триплети с общ предикат могат да бъдат
съпоставени с бинарните връзки в релационния модел чрез
таблица от две колони.
1414Цветанка Георгиева Моделиране на информационни системи
СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ
ДАННИ
 В релационния модел, даден ред в таблица всъщност
представлява твърдението, че релацията е валидна за
стойностите в реда.
 Една SELECT заявка избира твърдения, които са верни за
дадените условия.
 Релационната СУБД поддържа логически съгласуваността
между всички данни, които съдържа.
 По този начин релационната база от данни може да се
разглежда като машина за разсъждения (reasoning engine).
1515Цветанка Георгиева Моделиране на информационни системи
1616Цветанка Георгиева
Цветанка Георгиева-Трифонова, 2017
Някои права запазени.
Презентацията е достъпна под лиценз Creative Commons,
Признание-Некомерсиално-Без производни,
https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode

Mais conteúdo relacionado

Mais de Tsvetanka Georgieva

Визуализиране на данни с Power BI
Визуализиране на данни с Power BIВизуализиране на данни с Power BI
Визуализиране на данни с Power BITsvetanka Georgieva
 
Въведение в анализирането и визуализирането на данни
Въведение в анализирането и визуализирането на данни Въведение в анализирането и визуализирането на данни
Въведение в анализирането и визуализирането на данни Tsvetanka Georgieva
 
Добиване на данни от текст (text mining) с RapidMiner. Класифициране на текс...
Добиване на данни от текст (text mining) с RapidMiner.  Класифициране на текс...Добиване на данни от текст (text mining) с RapidMiner.  Класифициране на текс...
Добиване на данни от текст (text mining) с RapidMiner. Класифициране на текс...Tsvetanka Georgieva
 
Онлайн инструменти за научни изследвания
Онлайн инструменти за научни изследвания Онлайн инструменти за научни изследвания
Онлайн инструменти за научни изследвания Tsvetanka Georgieva
 
Модели и методи за анализ на текстови данни
Модели и методи за анализ на текстови данниМодели и методи за анализ на текстови данни
Модели и методи за анализ на текстови данниTsvetanka Georgieva
 
Поддържане на стандарта SQL/MM Still Image в Oracle Multimedia
Поддържане на стандарта SQL/MM Still Image в Oracle MultimediaПоддържане на стандарта SQL/MM Still Image в Oracle Multimedia
Поддържане на стандарта SQL/MM Still Image в Oracle MultimediaTsvetanka Georgieva
 
Добиване на асоциативни правила (association rule mining)
Добиване на асоциативни правила (association rule mining)Добиване на асоциативни правила (association rule mining)
Добиване на асоциативни правила (association rule mining)Tsvetanka Georgieva
 
Системи за онлайн аналитична обработка на данни (OLAP)
Системи за онлайн аналитична обработка на данни (OLAP) Системи за онлайн аналитична обработка на данни (OLAP)
Системи за онлайн аналитична обработка на данни (OLAP) Tsvetanka Georgieva
 
Архитектура на системите за управление на бази от данни
Архитектура на системите за управление на бази от данниАрхитектура на системите за управление на бази от данни
Архитектура на системите за управление на бази от данниTsvetanka Georgieva
 
Складиране на данни (data warehousing)
Складиране на данни (data warehousing)Складиране на данни (data warehousing)
Складиране на данни (data warehousing)Tsvetanka Georgieva
 
Работа с XML данни в релационни бази от данни
Работа с XML данни в релационни бази от данниРабота с XML данни в релационни бази от данни
Работа с XML данни в релационни бази от данниTsvetanka Georgieva
 
Модифициране на XML данни с XQuery Update
Модифициране на XML данни с XQuery UpdateМодифициране на XML данни с XQuery Update
Модифициране на XML данни с XQuery UpdateTsvetanka Georgieva
 
Полуструктурирани данни
Полуструктурирани данниПолуструктурирани данни
Полуструктурирани данниTsvetanka Georgieva
 
Заявки за намиране на пермутации, вариации и комбинации
Заявки за намиране на пермутации, вариации и комбинацииЗаявки за намиране на пермутации, вариации и комбинации
Заявки за намиране на пермутации, вариации и комбинацииTsvetanka Georgieva
 
Описание на методите за сравняване на изображения evaluateScore и isSimilar в...
Описание на методите за сравняване на изображения evaluateScore и isSimilar в...Описание на методите за сравняване на изображения evaluateScore и isSimilar в...
Описание на методите за сравняване на изображения evaluateScore и isSimilar в...Tsvetanka Georgieva
 
Модел на вложените множества (Nested Set Model)
Модел на вложените множества (Nested Set Model)Модел на вложените множества (Nested Set Model)
Модел на вложените множества (Nested Set Model)Tsvetanka Georgieva
 
Складиране (data warehousing) и добиване на данни (data mining)
Складиране (data warehousing) и добиване на данни (data mining)Складиране (data warehousing) и добиване на данни (data mining)
Складиране (data warehousing) и добиване на данни (data mining)Tsvetanka Georgieva
 

Mais de Tsvetanka Georgieva (19)

08 python knn
08 python knn08 python knn
08 python knn
 
Визуализиране на данни с Power BI
Визуализиране на данни с Power BIВизуализиране на данни с Power BI
Визуализиране на данни с Power BI
 
Въведение в анализирането и визуализирането на данни
Въведение в анализирането и визуализирането на данни Въведение в анализирането и визуализирането на данни
Въведение в анализирането и визуализирането на данни
 
Добиване на данни от текст (text mining) с RapidMiner. Класифициране на текс...
Добиване на данни от текст (text mining) с RapidMiner.  Класифициране на текс...Добиване на данни от текст (text mining) с RapidMiner.  Класифициране на текс...
Добиване на данни от текст (text mining) с RapidMiner. Класифициране на текс...
 
Онлайн инструменти за научни изследвания
Онлайн инструменти за научни изследвания Онлайн инструменти за научни изследвания
Онлайн инструменти за научни изследвания
 
Модели и методи за анализ на текстови данни
Модели и методи за анализ на текстови данниМодели и методи за анализ на текстови данни
Модели и методи за анализ на текстови данни
 
Поддържане на стандарта SQL/MM Still Image в Oracle Multimedia
Поддържане на стандарта SQL/MM Still Image в Oracle MultimediaПоддържане на стандарта SQL/MM Still Image в Oracle Multimedia
Поддържане на стандарта SQL/MM Still Image в Oracle Multimedia
 
NewSQL системи
NewSQL системиNewSQL системи
NewSQL системи
 
Добиване на асоциативни правила (association rule mining)
Добиване на асоциативни правила (association rule mining)Добиване на асоциативни правила (association rule mining)
Добиване на асоциативни правила (association rule mining)
 
Системи за онлайн аналитична обработка на данни (OLAP)
Системи за онлайн аналитична обработка на данни (OLAP) Системи за онлайн аналитична обработка на данни (OLAP)
Системи за онлайн аналитична обработка на данни (OLAP)
 
Архитектура на системите за управление на бази от данни
Архитектура на системите за управление на бази от данниАрхитектура на системите за управление на бази от данни
Архитектура на системите за управление на бази от данни
 
Складиране на данни (data warehousing)
Складиране на данни (data warehousing)Складиране на данни (data warehousing)
Складиране на данни (data warehousing)
 
Работа с XML данни в релационни бази от данни
Работа с XML данни в релационни бази от данниРабота с XML данни в релационни бази от данни
Работа с XML данни в релационни бази от данни
 
Модифициране на XML данни с XQuery Update
Модифициране на XML данни с XQuery UpdateМодифициране на XML данни с XQuery Update
Модифициране на XML данни с XQuery Update
 
Полуструктурирани данни
Полуструктурирани данниПолуструктурирани данни
Полуструктурирани данни
 
Заявки за намиране на пермутации, вариации и комбинации
Заявки за намиране на пермутации, вариации и комбинацииЗаявки за намиране на пермутации, вариации и комбинации
Заявки за намиране на пермутации, вариации и комбинации
 
Описание на методите за сравняване на изображения evaluateScore и isSimilar в...
Описание на методите за сравняване на изображения evaluateScore и isSimilar в...Описание на методите за сравняване на изображения evaluateScore и isSimilar в...
Описание на методите за сравняване на изображения evaluateScore и isSimilar в...
 
Модел на вложените множества (Nested Set Model)
Модел на вложените множества (Nested Set Model)Модел на вложените множества (Nested Set Model)
Модел на вложените множества (Nested Set Model)
 
Складиране (data warehousing) и добиване на данни (data mining)
Складиране (data warehousing) и добиване на данни (data mining)Складиране (data warehousing) и добиване на данни (data mining)
Складиране (data warehousing) и добиване на данни (data mining)
 

RDF бази от данни

  • 1. RDF БАЗИ ОТ ДАННИ Доц. д-р Цветанка Георгиева-Трифонова
  • 2. RDF БАЗИ ОТ ДАННИ – СЪДЪРЖАНИЕ  Характеристики на RDF (Resource Description Framework) базите от данни  Предимства на RDF бази от данни  Сравняване на RDF с XML и релационни бази от данни 22Цветанка Георгиева Моделиране на информационни системи
  • 3. ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ  RDF системите за бази от данни  са стандартизирани NoSQL решения, които се основават на:  прост, единен модел на данни;  мощен, декларативен език за заявки.  предлагат преносимост на данните и съвместимост между конкурентни приложения. 33Цветанка Георгиева Моделиране на информационни системи
  • 4. ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ  RDF системите за бази от данни формират подмножество на графовите бази от данни – една от категориите NoSQL бази от данни.  Примери за RDF бази от данни са:  AllegroGraph, Virtuoso, Stardog, др.;  както и такива с отворен код: ARC, 4store, др.  RDF данните могат да бъдат разглеждани като насочен граф, където дъгите:  започват с URI на субектите;  имат етикети с URI на предикатите;  завършват, като сочат URI на обектите или скаларни стойности. 44Цветанка Георгиева Моделиране на информационни системи
  • 5. ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ  Пример 55Цветанка Георгиева Моделиране на информационни системи
  • 6. ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Прост и единен стандартен модел на данните  NoSQL базите от данни имат специфични модели на данните и възможности, предназначени специално за всяка реализация;  Като правило, тези модели на данните не са нито съвместими, нито стандартизирани и обикновено са описани в документацията на съответната версия на конкретния програмен продукт;  В сравнение с тях системите за RDF бази от данни използват един добре дефиниран и W3C-стандартизиран модел на данните. 66Цветанка Георгиева Моделиране на информационни системи
  • 7. ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Стандартизирани формати за обмен на информация  Някои NoSQL бази от данни имат възможност за импорт/експорт от/към структури, специфични за реализацията, представени в XML или JSON формат.  От друга страна всички RDF бази от данни имат възможност за импорт/експорт въз основа на добре дефинирани, стандартизирани формати за сериализиране като RDF/XML, N-Triples, N-Quads, др. 77Цветанка Георгиева Моделиране на информационни системи
  • 8. ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Мощен стандартен език за заявки  NoSQL базите от данни обикновено не предоставят декларативен език за заявки от високо ниво, подобен на SQL;  Изпълняването на заявки при тези бази от данни се програмира според конкретния модел на данните, според конкретния език и дори според конкретно приложение;  Ако е налице език за заявки, той е напълно специфичен за реализацията (например SimpleDB или GQL);  SPARQL е голямо предимство за RDF базите от данни, тъй като представлява стандартен език за заявки, който има възможности, сравними с тези на SQL и е дефиниран при запазване на голяма част от познатия синтаксис. 88Цветанка Георгиева Моделиране на информационни системи
  • 9. ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Преносимост на данните  При използване на различни конкуриращи се системи за бази от данни, за да се:  включат множество различни решения едновременно;  обменят данни с външни организации,  данните могат да бъдат предавани, без да се налага да се пише и използва допълнителен потребителски код за преобразуване на някои формати и структури от данни в други несъвместими формати и структури от данни. 99Цветанка Георгиева Моделиране на информационни системи
  • 10. ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Съвместимост (Toolchain interoperability)  Библиотеките и инструментите (toolchains) за RDF обикновено не са или са слабо свързани с конкретната реализация на СУБД;  По принцип не е от значение с коя специално RDF- базирана система се осъществява връзката, ако например се използва и програмира с Jena или Sesame за Java и Scala, RDFLib за Python, ARC за PHP или RDF.rb за Ruby;  Подобно на релационните бази от данни, RDF-базираният код не трябва да се променя, само защото е нужно да се направи еквивалент на преминаване от MySQL към PostgreSQL. 1010Цветанка Георгиева Моделиране на информационни системи
  • 11. ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Липсва зависимост от доставчика (No vendor lock-in)  Ако дадено приложение използва RDF базата от данни X, но по някаква причина възникнат проблеми, то може да се извърши преминаване към RDF база от данни Y или Z или някоя друга от наличните съвместими решения;  Тази задача не толкова тежка, в сравнение с превключване между две не-RDF решения. 1111Цветанка Георгиева Моделиране на информационни системи
  • 12. ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ  Гарантирано бъдеще  RDF е дефиниран стандарт за публикуване на свързани данни (linked data) в интернет и е изцяло построен въз основа на утвърдени стандарти като URI адреси;  Напълно основателно може да се предположи, че RDF данните ще бъдат използваеми в бъдеще;  Не може да се твърди същото за някои от другите NoSQL решения, много от които неизбежно ще се окажат по- скоро краткотрайни. 1212Цветанка Георгиева Моделиране на информационни системи
  • 13. СРАВНЯВАНЕ НА RDF С XML  XML се използва за представяне на модел на полуструктурираните данни  Йерархична структура с вложени елементи, която е дърво, но в общия случай може да представлява граф;  Служи за представяне на структурата и семантиката на данните.  Моделите на XML данните и RDF данните са различни  Моделът на RDF данните:  е граф (съвкупност от субект/предикат/обект изрази);  служи за представяне на семантиката на данните;  е абстрактен модел с няколко формати за сериализиране, един от които е RDF/XML. 1313Цветанка Георгиева Моделиране на информационни системи
  • 14. СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ ДАННИ  RDF данните могат да бъдат представени с помощта на релационния модел.  Отделните твърдения в RDF се изразяват като триплети от субект, предикат, обект.  Множества от триплети с общ предикат могат да бъдат съпоставени с бинарните връзки в релационния модел чрез таблица от две колони. 1414Цветанка Георгиева Моделиране на информационни системи
  • 15. СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ ДАННИ  В релационния модел, даден ред в таблица всъщност представлява твърдението, че релацията е валидна за стойностите в реда.  Една SELECT заявка избира твърдения, които са верни за дадените условия.  Релационната СУБД поддържа логически съгласуваността между всички данни, които съдържа.  По този начин релационната база от данни може да се разглежда като машина за разсъждения (reasoning engine). 1515Цветанка Георгиева Моделиране на информационни системи
  • 16. 1616Цветанка Георгиева Цветанка Георгиева-Трифонова, 2017 Някои права запазени. Презентацията е достъпна под лиценз Creative Commons, Признание-Некомерсиално-Без производни, https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode