1. IT Seminar on 30/08/2012
Semantic Web and Ontology :
The next big thing?
Krich Intratip (Peakmaker): PhD.IT.Student@SPU
2. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Agenda
Fundamental of Semantic Web
Technology
Semantic Web application :
Development and Challenging
Research trend on Semantic Web
Questions & Suggestions
3. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Fundamental of Semantic Web
Technology
4. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Semantic Web was introduced
”The Semantic Web is an extension of the
current web in which information is given
Well-defined meaning, better enabling
computers and people to work in
cooperation.”
Berners-Lee at the Home Office,
London, 2010
T. Berners Lee, J. Hendler and O. Lassila.
The Semantic Web. Scientific American, May 2001.
5. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Semantic Web was introduced
“The semantic web is designed to
smoothly interconnect personal
information management, enterprise
application integration, and the global
sharing of commercial, scientific and
culture data. We are talking about data
here, not human documents.”
Berners-Lee at the Home Office,
London, 2010
The semantic web : an interview with Tim Berners Lee, Consortium
Standard Bulletin, 2005.
http://www.consortiuminfo.org/bulletins/semanticweb.php
6. IT Seminar on 30/08/2012 @ KU : Krich Intratip
What Is An Ontology?
• Ontology (Socrates & Aristotle 400-360 BC)
• The study of being
• Word borrowed by computing for the
explicit description of the conceptualisation of a domain:
– concepts
– properties and attributes of concepts
– constraints on properties and attributes
– Individuals (often, but not always)
• An ontology defines
– a common vocabulary
– a shared understanding
http://www.co-ode.org/resources/tutorials/iswc2005
6
7. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Why Develop an Ontology?
• To share common understanding of the
structure of descriptive information
– among people
– among software agents
– between people and software
• To enable reuse of domain knowledge
– to avoid “re-inventing the wheel”
– to introduce standards to allow interoperability
http://www.co-ode.org/resources/tutorials/iswc2005
8. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Data-Information-Knowledge-Wisdom
Wisdom
Knowledge
Information
Data
Concept Technology
9. IT Seminar on 30/08/2012 @ KU : Krich Intratip
2.0 VS 3.0
10. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Database App. VS Semantic Web App.
Transaction Semantic
• Table & Data • Concept & Instance
• Relationship for join data • Relationship create meaning
• Query • Inference
• Can’t separate domain knowledge • Domain knowledge independence
from programming code • Intelligence by machine
• Intelligence by human
11. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Triple makes a semantic
Predicate
Subject Object
Meaning
12. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Concept & Instance
instance
instance Concept instance
instance
13. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Relations
Is-a
Part-of
Super Sub RDF/OWL
class class
Attribute
-of
Relations Class roles Ontology
14. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Semantic Web Stack
15. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Database represents
Semantic Web Concept
represents is
Ontology Knowledge Relation of Things
applied with
implemented by is
Logic
OWL introduces Data
implemented by
is a kind of SWRL Intelligence
is a kind of
Semantic Web Technology
16. IT Seminar on 30/08/2012 @ KU : Krich Intratip
used by
Semantic Web Knowledge
has a has a has
Logic
Domain concept Instances
is a are
is a Rules of the knowledge Data items of the
concepts or entities
Group of entities increases
Knowledge powerful
(Intelligence)
stored in referred by
captures from represented by
has
Interested topics Relations Class URI
referred by
17. IT Seminar on 30/08/2012 @ KU : Krich Intratip
URIs / IRIs
• URIs are “Uniform Resource Identifiers”
– IRI: Unicode-based “Internationalized Resource Identifiers”
• Every URI identifies one entity
• Semantic Web URIs usually use HTTP
– HyperText Transfer Protocol
– Can be resolved to get more data (ideally)
– Linked data
NamespaceDomain Local name
Protocol
http://semanticweb.org/id/Denny_Vrandecic
thing:Denny_Vrandecic
Prefix
18. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Angola Africa
Continent
Country
Zambia
type
18
19. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Africa
Angola
Located in
http://ontoworld.org/id/Africa
http://ontoworld.org/id/Angola
Borders
http://ontoworld.org/id/Category:Continent
Continent
http://ontoworld.org/id/Category:Country
Country
http://ontoworld.org/id/Zambia
http://www.w3.org/1999/02/22/rdf-syntax-ns#type
Zambia http://www.w3.org/2000/01/rdf-schema#label
19
20. IT Seminar on 30/08/2012 @ KU : Krich Intratip
ทวีปแอฟริกา
ประเทศแองโกลา
แห่ง
http://ontoworld.org/id/Africa
http://ontoworld.org/id/Angola
ชายแดน
http://ontoworld.org/id/Category:Continent
ทวีป
http://ontoworld.org/id/Category:Country
http://ontoworld.org/id/Zambia
ประเทศ
http://www.w3.org/1999/02/22/rdf-syntax-ns#type
ประเทศแซมเบีย http://www.w3.org/2000/01/rdf-schema#label
20
21. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Africa
Angola
Located in
http://ontoworld.org/id/Africa
http://ontoworld.org/id/Angola
Borders
http://ontoworld.org/id/Category:Continent
Continent
http://ontoworld.org/id/Category:Country
Country
http://ontoworld.org/id/Zambia
http://www.w3.org/1999/02/22/rdf-syntax-ns#type
Zambia http://www.w3.org/2000/01/rdf-schema#label
21
22. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Slide 22
23. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Web 3.0, Semantic Web, Ontology, Linked data
• Web 3.0 เป็ นยุคของเว็บ จะเข้าใจเรื่ องยุคของเว็บต้องไปดูความเป็ นมาจาก Web
1.0(Hyperlink-Web of documents) -> Web 2.0(Social,
Collaborative, Networking Web) ->Web 3.0(Intelligent Web,
Web of linked data) ซึ่ งแต่ละยุคก็เน้นประโยชน์การใช้งานเว็บไปคนละอย่าง
่
• Semantic Web เป็ นเทคโนโลยีหนึ่งของ Web 3.0 ที่วาด้วยเว็บเชิงความหมายที่
คอมพิวเตอร์สามารถอ่านแล้วรับรู ้ได้(machine readable) เทียบเคียงคล้ายกับ SOA ที่
เป็ นเทคโนโลยีหนึ่งของ Web 2.0
• Ontology เป็ น main component ของ Semantic Web หมายความว่าหาก
ไม่มี ontology แล้วก็จะไม่เกิด Semantic Web นันเอง แต่ ontology ไม่ใช่
่
ทั้งหมดของ Semantic Web แค่องค์ประกอบหลักเท่านั้น
• Linked data เป็ นลักษณะหนึ่งหรื อแนวทางหนึ่งในการ implement ตัว
Semantic Web แน่นอนที่สุดแล้วสิ่ งที่อยูเ่ บื้องหลังมันก็คือ ontology นันเอง
่
24. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Knowledge representation and Ontology
25. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Semantic Web application
Development and Challenging
26. IT Seminar on 30/08/2012 @ KU : Krich Intratip
กระบวนการจัดการความรู้ (KM Processes)
Structuring
Knowledge
ดร.มารุต บูรณรัช, Ontology for Information System Design
and Development, 28 พฤศจิกายน 2553
27. IT Seminar on 30/08/2012 @ KU : Krich Intratip
สิ่ งที่ตองรู้ในการสร้าง Ontology
้
หน้าตาของความรู้ที่นามาสร้างเป็ น Ontology เป็ นอย่างไร?
ใครคือ Domain experts(ตัวจริ งที่เป็ นตัวแทนประชากรได้)/Stakeholders?
Intend to use
กระบวนการตรวจสอบความถูกต้อง
• ความรู้ที่นามาทาเป็ น Ontology
• Well-formed Design of ontology
Ontology improvement
28. IT Seminar on 30/08/2012 @ KU : Krich Intratip
กระบวนการพัฒนา Ontology
Natalya F. Noy and Deborah L. McGuinness , Ontology Development 101:
A Guide to Creating Your First Ontology, Stanford University, Stanford, CA,
94305
http://protege.stanford.edu/publications/ontology_development/ontology
101-noy-mcguinness.html
29. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Some of ontology (re)-engineering processes
(Knowledge extraction)
• Define topic area
– หัวข้อที่สนใจคืออะไร?
• Define domain specific
– ประเด็นที่สนใจในหัวข้อนั้นที่ตองการให้ความหมายหรื อการอธิบายคืออะไร?
้
• Define intend to use (Domain expert)
– การให้ความหมายหรื อการอธิบายนั้นเพื่อวัตถุประสงค์ใด?
• Breakdown into sub-domains/concepts
– กลุ่มแนวความคิดย่อยหรื อความหมายกลุ่มย่อยคืออะไรบ้าง?
– Review literature (Consider reuse)
• Define indicators in each concept
• Define indicator measurement
• Define scale of the measurement
32. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Instrument & Ontology design
ให้ ความหมาย
ในสิ่งที่ต้องการ
Domain อธิบาย
ตัวบ่งชี ้นามธรรม Concept Concept
1 2
ตัวบ่งชี ้สังเกตได้
Att. 1 Att. 2 Att. 3 Att. 4 Att. 5
Int String
ขอบเขต
มาตรวัด Intend to use
33. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Principle of defining class and its relation
• Class (นามธรรมที่ต้องการการอธิบาย)
– มี class node อยู่ 2 ประเภท
• Concept node ควรต้ องได้ รับการอธิบายเพิ่มเติมจาก node อื่น
– กฎ : ไม่สามารถเป็ นที่อยู่ของ Instance ได้
• Attribute node ควรต้ องได้ รับการอธิบายเพิ่มเติมด้ วยการใส่ Instance
– กฎ : เป็ นที่อยู่ของ Instance
– มีความสัมพันธ์ระหว่าง concept node ได้ สองแบบ
• Is-a, Part-of
– มีความสัมพันธ์ระหว่าง concept node กับ Attribute node ได้
แบบเดียว คือ Attribute-of
34. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Principle of defining instance and its relation
• Instance (data item)
– กฎ : ต้ องถูกบรรจุอยู่ใน Attribute node
• One fact in one place
• Atomic value
• Relation
– กับ Attribute node เป็ น Instance-of
– ระหว่าง Instance อื่นใน Attribute node อื่นจะเป็ น Has_???
• เข้ าใจธรรมชาติของ Instance ว่าสามารถเจริญเติมโตไปเป็ น Node ได้ เมื่อ
มีการเปลี่ยนแปลงจาเป็ นต้ อง re-structure ontology
35. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Class/Instance and their relations
parent
concept concept concept
Is-a Part-of Att-of
attribute
concept concept
Ins-of
instance
child
Intrinsic/Concrete VS Extrinsic/Logical
36. IT Seminar on 30/08/2012 @ KU : Krich Intratip
INFERENCE ?
QUERY & RULE
36
37. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Inference and Decision
• ข้ อเท็จจริง
– ความสูง(m)
– น ้าหนัก(kg)
• เกิดคุณสมบัติตามมา (Query)
– BMI = ความสูง(m) * น ้าหนัก(kg)ยกกาลังสอง
• การอนุมาน
– ใช้ เกณฑ์มาตัดสิน หรื อการให้ ความหมาย
http://en.wikipedia.org/wiki/First-order_logic
http://www.chulabook.com/description.asp?barcode=978974
0326960
39. IT Seminar on 30/08/2012 @ KU : Krich Intratip
หลักการสาคัญในการออกแบบ Ontology
• พิจารณาความละเอียดหยาบของสิงที่ต้องการอธิบาย และให้ แต่ละระดับของการ
่
อธิบายมีความละเอียดหยาบพอๆกัน (Generic VS Specific)
• ปกติแล้ ว Ontology ใช้ หลักการจัดกลุมจัดประเภทข้ อมูลหรื อกลุมแนวคิด
่ ่
เป็ นหมวดหมู่ (Taxonomy) เป็ น Hierarchy แล้ วใช้ First order
logic ในการอนุมานความหมาย ซึงความหมายจะไม่คลุมเครื อถ้ าหากข้ อมูล
่
หรื อกลุมแนวคิดนันมีอยูที่เดียว(Unique) ในโครงสร้ าง Ontology
่ ้ ่
• จะเพิ่มความสามารถในการ Reuse ให้ กบ Ontology ได้ โดยทาให้
ั
Ontology นันมีความหมายชัดเจนอย่างใดอย่างหนึงตามเจตนารมณ์การใช้
้ ่
งาน
40. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Ontology quality attributes
• Business (Usage) Objectives and scope must
be clearly identified
• Knowledge must be reliable
• Knowledge must be accessible and available
• Knowledge must be shared and integrated
seamlessly
41. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Ontology quality attributes
• Business (Usage) Objectives and scope must
intention
reliable
be clearly identified sources/processes
• Knowledge must be reliable
• Knowledge musttechnology
Web be accessible and available
and triple
• Knowledge must be shared and integrated
seamlessly
43. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Knowledge & Ontology development life cycle
Describe
domain and
intend to use
Inference
Instrument
over
development
ontology
meaning
Practice
based Gather
ontology information
design
Build up
domain
knowledge
44. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Maintenance and performance problems
Domain knowledge Unnecessary
is in both its One fact is in many Ontology is
nodes or
ontology and its places too big
programming code instances
Hard to Lack of
maintenance performance
45. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Goals
Easy to Increase Ontology
maintenance performance improvement
46. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Domain knowledge is in both the ontology and
its programming code
• Not only programming problem but also
ontology design problem
• Domain knowledge should be in ontology and
should not be in programming code
• Hard to maintain the ontology (adding,
deleting, removing, modifying)
• Blur in domain and range of the attribute
• Cause to composite value
47. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Example of composite value
Black t-shirt,
color of t-shirt is black
Black color Label
Black box, color of box is black
Red Box, color of box is red
Black Label Red Label
Product name
48. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Example of composite value
Black t-shirt,
color of t-shirt is black
Black color Label
Composite value Non-composite value
Black box, color of box is black
Red Box, color of box is red
Black Label Red Label
Product name
49. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Example of composite value
Black t-shirt,
color of t-shirt is black
Black color Label
It is a design problem issue, not only programming problem issue.
Black box, color of box is black
Red Box, color of box is red
Black Label Red Label
Product name
50. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Some domain knowledge are thrown
in Programming area
“Black box”
Composite value
What does it mean?
“Black box”
Separate to
Programming area
for Black
What is the box color?
for Box
What is the item?
Ontology area
51. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Optimizing Rules
• Step-wise approach for improving for ontology
design
– 4 optimizing rules
• Remove composite-values to optimize the
maintenance
• Remove one fact in many places to optimize the
maintenance
• Remove unused class to optimize the performance
• Remove unnecessary class to optimize the
maintenance and performance
“Optimize both the maintenance and performance”
52. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Berners-Lee says the next big thing for changing and
understanding the world, and the next big thing for the
internet, is the ability to access whatever data we need,
whenever we need it. By connecting our data together
we can solve world problems and make life easier.
Research trend on Semantic Web
53. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Web Technology Trend
54. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Research trend
Semantic Search Recommendations
•New Google •DSS
•Helpdesk •suggestion
Personalized assistant Business intelligent
•Meeting •Education/Library
•Planning •Healthcare
•Living •Advertisement
•Personalize •CRM
Linked data Geo-based
•Large scale/Big data •Military
•Semantic based CMS •Agriculture
•Multimedia •Infrastructure
Knowledge engineering Knowledge grid Knowledge repository NLP
Knowledge as Service Knowledge transformation Cloud computing
55. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Linked-data : Method
Genera- Collabora-
Training Adjusting Using Sharing
ting ting
56. IT Seminar on 30/08/2012 @ KU : Krich Intratip
Semantic-Based Geo
Event
Time
Geo Person
Transaction
Object
http://www.geonames.org/