Mais conteúdo relacionado
Semelhante a Structure attribute computation of similarities between nodes of a graph with application in clustering (10)
Structure attribute computation of similarities between nodes of a graph with application in clustering
- 1. ﺩﺍﻧﺸﮕﺎﻩ ﺍﺻﻔﻬﺎﻥ
ﺩﺍﻧﺸﮑﺪﻩ ﻓﻨﻲ ﻭ ﻣﻬﻨﺪﺳﻲ
ﮔﺮﻭﻩ ﮐﺎﻣﭙﻴﻮﺗﺮ
ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ/ﺧﺼﻮﺻﻴﺘﻲ ﺑﻴﻦ
ﻧﻮﺩﻫﺎﯼ ﮔﺮﺍﻑ RDFﻭ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺁﻥ ﺑﺮﺍﯼ
ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ
Structure/Attribute Computation of Similarities
Between Nodes of a RDF Graph with
Application to Linked Data Clustering
ﻣﺤﻘﻖ: ﺍﺳﺘﺎﺩ ﺭﺍﻫﻨﻤﺎ:
ﻫﺎﺩﻱ ﺧﺴﺮﻭﻱ ﻓﺎﺭﺳﺎﻧﯽ ﺩﮐﺘﺮ ﻣﺤﻤﺪﻋﻠﯽ ﻧﻌﻤﺖ ﺑﺨﺶ
1 72/9/0931
- 2. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
2 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 3. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
3 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 4. ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )(Linked Data Principles
• ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ URIﺑﺮﺍﯼ ﺷﻨﺎﺳﺎﻳﻲ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ
• ﺍﺯ ﭘﺮﻭﺗﮑﻞ HTTPﺑﺮﺍﯼ ﺩﺳﺘﺮﺳﯽ ﺑﻪ ﺍﻳﻦ ﻧﺎﻣﻬﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ
• ﻫﻨﮕﺎﻣﯽ ﮐﻪ ﻳﮏ ﻓﺮﺩ، ﺩﺭﺧﻮﺍﺳﺖ ﻳﮏ URIﺭﺍ ﻣﯽ ﮐﻨﺪ، ﺗﻤﺎﻣﯽ ﺍﻃﻼﻋﺎﺕ ﻣﻔﻴﺪ ﺑﻪ ﻓﺮﻣﺖ RDFﻧﺸﺎﻥ ﺩﺍﺩﻩ ﺷﻮﺩ
• ﻋﺒﺎﺭﺗﻬﺎﯼ RDFﻻﺯﻡ ﺍﺳﺖ ﺑﻪ ﺩﻳﮕﺮ URIﻫﺎ ﺍﻧﻮﺍﻉ ﻣﺨﺘﻠﻒ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺑﺎﺷﻨﺪ ﺑﻪ ﺻﻮﺭﺗﯽ ﮐﻪ ﺍﻓﺮﺍﺩ ﻗﺎﺩﺭ ﺑﺎﺷﻨﺪ
ﺍﻃﻼﻋﺎﺕ ﺑﻴﺸﺘﺮﯼ ﺩﺭ ﻣﻮﺭﺩ ﺁﻥ ﻣﻮﺟﻮﺩﻳﺖ ﮐﺴﺐ ﮐﻨﻨﺪ.
4 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 5. ﺗﻌﺮﻳﻒ ﻣﻨﺎﺑﻊ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﺻﻮﻝ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ )ﻣﺜﺎﻝ(
http://dbpedia.org/page/Nigel_Clough
5 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 7. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
7 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 8. ﻣﺴﺎﻟﻪ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ
ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺑﻪ ﭼﻪ ﺷﮑﻠﯽ ﺍﻧﺠﺎﻡ ﺷﻮﺩ . •
ﺍﻳﺪﻩ: •
• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﻭ ﺳﭙﺲ ﺍﻋﻤﺎﻝ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﺎﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺩﺭ ﻫﺮ ﺧﻮﺷﻪ
ﺩﺭ ﻫﺮ ﮐﺪﺍﻡ ﺍﺯ ﺧﻮﺷﻪ ﻫﺎ ﻧﻮﺩﻫﺎﯼ ﺑﺴﻴﺎﺭ ﻣﺸﺎﺑﻪ ﻗﺮﺍﺭ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﻧﺪ •
• ﺑﺮﺍﯼ ﻣﺜﺎﻝ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﻭﺭﺯﺵ ﺳﺎﺧﺘﻪ ﺷﻮﺩ، ﮐﻼﺳﺘﺮ ﺩﻳﮕﺮﯼ ﺑﺮﺍﯼ ﺣﻮﺯﻩ ﺁﮐﺎﺩﻣﻴﮏ
ﺗﺸﮑﻴﻞ ﺷﻮﺩ ﻭ ...
• ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﻣﺜﻼ ﮐﻼﺳﺘﺮ ﻭﺭﺯﺷﯽ ﺑﻪ ﮐﻼﺳﺘﺮ ﺁﮐﺎﺩﻣﻴﮏ ﺣﺬﻑ ﻣﯽ ﺷﻮﻧﺪ ﭼﺮﺍ ﮐﻪ
ﻟﻴﻨﮏ ﻳﮏ ﻓﺮﺩ ﺁﮐﺎﺩﻣﻴﮏ ﺑﻪ ﻳﮏ ﻓﺮﺩ ﻭﺭﺯﺵ ﺍﺭﺯﺵ ﮐﻤﯽ ﺩﺍﺭﺩ
ﺩﺭ ﺩﺭﻭﻥ ﻫﺮ ﮐﻼﺳﺘﺮ، ﺍﻟﮕﻮﺭﻳﺘﻢ PageRankﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺷﻮﺩ •
• ﺍﻓﺰﺍﻳﺶ ﺩﻗﺖ
• ﮐﺎﻫﺶ ﺍﻧﺪﺍﺯﻩ ﮔﺮﺍﻑ ﻭ ﺩﺭ ﻧﺘﻴﺠﻪ ﮐﺎﻫﺶ ﻫﺰﻳﻨﻪ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﻧﻮﺩﻫﺎ
8 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 9. ﺯﻳﺮ ﻣﺴﺎﻳﻞ ﭘﺎﻳﺎﻥ ﻧﺎﻣﻪ
ﻓﺎﺯﻫﺎﯼ ﭘﺮﻭﮊﻩ •
• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﺍﻟﮕﻮﺭﻳﺘﻢ ﭘﺎﻳﻪ PageRank
• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﻫﺎ ﻭ ﻣﻮﺟﻮﺩﻳﺖ ﺩﺭ ﻫﺮ dataset
• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ - ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ
• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ
• ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﻫﺮ ﮐﻼﺳﺘﺮ ﻭ ﻣﻘﺎﻳﺴﻪ ﺑﺎ ﺭﻭﺵ ﭘﺎﻳﻪ
ﺍﻳﻦ ﺍﺭﺍﺋﻪ: •
• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻧﻮﺩﻫﺎ ﻭ ﻟﻴﻨﮑﻬﺎ – ﺑﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺧﺼﻮﺻﻴﺎﺕ
ﺯﻳﺮ ﻣﺴﺎﻟﻪ: •
• ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ
• ﻧﻴﺎﺯ ﺑﻪ ﺩﺍﺷﺘﻦ ﺍﻟﮕﻮﺭﻳﺘﻤﯽ ﺗﻮﺍﻧﺎ ﺟﻬﺖ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺗﺸﺎﺑﻪ ﺩﻭ ﺍﻳﺘﻢ
•
9 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 10. ﻣﺜﺎﻝ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ
ﻫﻤﻪ ﻧﻮﺩﻫﺎ ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺘﺨﺮﺍﺝ ﺷﺪﻩ ﺍﺳﺖ •
ﺗﻨﻬﺎ ﻳﮏ ﻧﻮﻉ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺍﺳﺖ wikiPagewikilink •
• ﺑﺎ ﮔﺬﺍﺷﺘﻦ ﭘﻴﺸﻮﻧﺪ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﻭ ﻳﺎ ﻭﻳﮑﯽ ﭘﺪﻳﺎ ﺑﻪ ﺍﺑﺘﺪﺍﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﻣﯽ ﺗﻮﺍﻥ ﺁﻥ ﻧﻮﺩ ﺭﺍ ﺩﺭ ﻭﺏ ﺑﺮﺭﺳﯽ ﮐﺮﺩ
• ﻻﺯﻡ ﺑﻪ ﺫﮐﺮ ﺍﺳﺖ ﮐﻪ ﺍﻳﻦ ﮔﺮﺍﻑ ﺑﺨﺶ ﮐﻮﭼﮑﯽ ﺍﺯ ﮔﺮﺍﻑ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺍﺳﺖ. ﺗﻌﺪﺍﺩ ﺯﻳﺎﺩﯼ ﺍﺯ ﻟﻴﻨﮏ ﻫﺎﯼ ﺍﻳﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ
ﺳﺎﺩﮔﯽ ﺧﺬﻑ ﺷﺪﻩ ﺍﺳﺖ.
01 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 11. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
11 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 12. ﺭﻭﺷﻬﺎﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ
ﺑﻪ ﺳﻪ ﺩﺳﺘﻪ ﮐﻠﯽ ﺗﻘﺴﻴﻢ ﺑﻨﺪﯼ ﻣﯽ ﺷﻮﻧﺪ •
• ﺭﻭﺷﻬﺎﯼ ﺳﺎﺧﺘﺎﺭﯼ
• ﮐﻪ ﺗﻨﻬﺎ ﺍﺯ ﺳﺎﺧﺘﺎﺭ ﻟﻴﻨﮏ ﻣﺎﺑﻴﻦ ﻧﻮﺩﻫﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ
SimRank, BipartiteRank, PRank •
ﺭﻭﺷﻬﺎﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ •
• ﮐﻪ ﺍﺯ ﺧﺼﻮﺻﻴﺎﺕ ﻭ ﻣﻘﺎﺩﻳﺮ ﺁﻧﻬﺎ ﺑﺮﺍﯼ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.
• ﻣﻌﻤﻮﻻ ﺑﺮ ﺍﺳﺎﺱ ﻣﺤﺎﺳﺒﻪ ﺷﺒﺎﻫﺖ Jaccardﻫﺴﺘﻨﺪ.
ﺭﻭﺷﻬﺎﯼ ﺗﺮﮐﻴﺒﯽ •
• ﮐﻪ ﺍﺯ ﻫﺮ ﺩﻭ ﺭﻭﺵ ﻗﺒﻠﯽ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻧﻮﺩﻫﺎ ﺍﺳﺘﻔﺎﺩﻩ ﻣﯽ ﮐﻨﺪ.
21 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 13. ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ SimRank
ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﻭﺭﻭﺩﯼ •
ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ
31 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 14. ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ Bipartite
ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ •
ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ
41 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 15. ﺭﻭﺵ ﺳﺎﺧﺘﺎﺭﯼ PRank
ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﻧﻮﺩﻫﺎﯼ ﺧﺮﻭﺟﯽ •
ﻭ ﻭﺭﻭﺩﯼ ﺁﻥ ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﺑﺎﺷﻨﺪ
51 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 16. ﺭﻭﺵ ﻣﺒﺘﻨﯽ ﺑﺮ Jaccard
ﺩﻭ ﻧﻮﺩ ﻣﺸﺎﺑﻪ ﻫﺴﺘﻨﺪ ﺍﮔﺮ ﺩﺍﺭﺍﯼ ﺗﻌﺪﺍﺩ ﺑﻴﺸﺘﺮﯼ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺑﺎﺷﻨﺪ •
Nﺑﺮﺍﺑﺮ ﺗﻌﺪﺍﺩ ﮐﻞ ﺧﺼﻮﺻﻴﺎﺕ ﻣﻮﺟﻮﺩ ﺩﺭ ﮔﺮﺍﻑ •
61 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 17. ﺭﻭﺵ ﺗﺮﮐﻴﺒﯽ
ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺑﻪ ﺻﻮﺭﺕ ﺿﺮﻳﺒﯽ ﺍﺯ ﺷﺒﺎﻫﺖ ﺳﺎﺧﺘﺎﺭﯼ ﻭ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮﺩ •
ﺭﻭﺵ ﺩﻳﮕﺮ ﺗﺒﺪﻳﻞ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭ •
• ﺩﻭ ﻧﻮﺩ ﮐﻪ ﺷﺒﺎﻫﺖ ﺧﺼﻮﺻﻴﺖ-ﻣﻘﺪﺍﺭ ﺁﻧﻬﺎ ﺍﺯ ﺣﺪ ﺁﺳﺘﺎﻧﻪ ﺑﻴﺸﺘﺮ ﺑﺎﺷﺪ ﻧﻮﺩﻱ ﺍﻳﺠﺎﺩ ﻣﻲ ﺷﻮﺩ ﮐﻪ ﺑﻪ ﻫﺮ ﺩﻭﯼ
ﺁﻧﻬﺎ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﺪ ﻭ ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺁﻧﻬﺎ ﺩﺭ ﮔﺮﺍﻑ ﺳﺎﺧﺘﺎﺭﯼ ﺑﻪ ﻫﻤﺪﻳﮕﺮ ﻧﺰﺩﻳﮑﺘﺮ ﻣﯽ ﺷﻮﻧﺪ
• ﭘﻴﭽﻴﺪﮔﯽ ﺁﻥ ﺑﺴﻴﺎﺭ ﺯﻳﺎﺩ ﺧﻮﺍﻫﺪ ﺷﺪ.
71 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 18. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
81 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 19. ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ
ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺩﻭ ﻧﻮﺩ ﺩﺭ ﻳﮏ ﮔﺮﺍﻑ ﺟﻬﺖ ﺩﺍﺭ ﺑﻪ ﻣﻮﺍﺭﺩ ﺯﻳﺮ ﻭﺍﺑﺴﺘﻪ ﺍﺳﺖ •
91 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 22. ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ
1. ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ
2. ﺍﺩﻏﺎﻡ ﺩﻭ ﺧﻮﺷﻪ ﺑﺎ ﺑﺎﻻﺗﺮﻳﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ
3. ﺗﻮﻗﻒ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺩﺭ ﺻﻮﺭﺕ ﺭﺳﻴﺪﻥ ﺑﻪ ﻣﻘﺪﺍﺭ ﺁﺳﺘﺎﻧﻪ
22 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 23. ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺪﻝ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺭﺍﻩ ﺣﻞ ﭘﻴﺸﻨﻬﺎﺩﯼ
ﺑﺮﺍﯼ ﺍﻳﺠﺎﺩ ﺧﻮﺷﻪ ﻫﺎﯼ ﺩﻭ ﻣﻨﺒﻌﯽ، ﺍﺯ ﺗﻮﺍﺑﻊ ﻣﺠﻤﻮﻉ، ﻣﺎﮐﺰﻳﻤﻢ، ﺗﻌﺪﺍﺩ، ﻣﻴﻨﻴﻤﻢ ﻭ ﻣﻴﺎﻧﮕﻴﻦ ﻣﯽ ﺗﻮﺍﻥ ﺍﺳﺘﻔﺎﺩﻩ ﻧﻤﻮﺩ.
ﺩﺭ ﭘﻴﺎﺩﻩ ﺳﺎﺯﯼ ﺻﻮﺭﺕ ﮔﺮﻓﺘﻪ، ﺍﺯ ﺗﺎﺑﻊ ﻣﺠﻤﻮﻉ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﺑﻴﻦ ﺩﻭ ﻧﻮﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.
ﻓﺮﻣﻮﻝ ﺯﻳﺮ ﺑﺮﺍﯼ ﺗﺮﮐﻴﺐ ﺩﻭ ﮐﻼﺳﺘﺮ ﺩﺭ ﻣﺮﺣﻠﻪ ﺩﻭﻡ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.
32 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 24. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
42 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 25. ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ
• ﺍﺯ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺑﺮﺍﯼ ﺧﻮﺷﻪ ﺑﻨﺪﯼ ﻣﻨﺎﺑﻊ ﺍﺳﺘﻔﺎﺩﻩ ﺷﺪﻩ ﺍﺳﺖ. ﮐﻪ ﺩﺭ ﺣﺎﻝ ﺣﺎﺿﺮ ﺑﺎﻟﻎ ﺑﺮ 6.1 ﻣﻴﻠﻴﻮﻥ
ﻣﻮﺟﻮﺩﻳﺖ ﺩﺍﺭﺩ
• ﺑﺎﻟﻎ ﺑﺮ 063 ﻫﺰﺍﺭ ﺍﺯ ﻣﻨﺎﺑﻊ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺍﻓﺮﺍﺩ ﺭﺍ ﺗﻮﺻﻴﻒ ﻣﯽ ﮐﻨﻨﺪ. ﮐﻪ ﺍﻳﻦ ﺍﻓﺮﺍﺩ ﺗﻮﺳﻂ ﻟﻴﻨﮏ
Wikipageredirectﺑﻪ ﻫﻤﺪﻳﮕﺮ ﺍﺷﺎﺭﻩ ﻣﯽ ﮐﻨﻨﺪ.
ﻣﻨﺎﺑﻊ ﺗﻮﺳﻂ ﻟﻴﻨﮏ Wordnetﺑﻪ ﺁﻧﺘﻮﻟﻮﮊﯼ ﺯﺑﺎﻧﯽ ﻭﺭﺩﻧﺖ ﻟﻴﻨﮏ ﺩﺍﺷﺘﻪ ﺍﻧﺪ. •
ﺍﺯ ﮐﻞ ﻣﻨﺎﺑﻊ ﺍﻓﺮﺍﺩ ﻣﻮﺟﻮﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ ﺗﻨﻬﺎ 021 ﻫﺰﺍﺭ ﻋﺪﺩ ﺍﺯ ﺁﻧﻬﺎ ﺣﺎﻭﯼ ﻣﻘﺪﺍﺭ ﺑﺮﺍﯼ ﺍﻳﻦ ﻟﻴﻨﮏ ﻫﺴﺘﻨﺪ. •
ﺍﻓﺮﺍﺩ ﺩﺭ ﺩﯼ ﺑﯽ ﭘﺪﻳﺎ، ﺑﻪ 03 ﮐﻼﺱ ﺩﺳﺘﻪ ﺑﻨﺪﯼ ﺷﺪﻩ ﺍﻧﺪ. •
ﻫﺪﻑ ﺍﺯ ﺧﻮﺷﻪ ﺑﻨﺪﯼ، ﺗﻮﻟﻴﺪ ﻫﻤﻴﻦ ﮐﻼﺳﻬﺎ ﺑﺪﻭﻥ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻟﻴﻨﮏ ﻭﺭﺩﻧﺖ •
• ﺑﻌﺪ ﺍﺯ ﻓﻴﻠﺘﺮﻳﻨﮓ ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺍﯼ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ ﮐﻪ ﻧﺴﺨﻪ ﺍﯼ ﺍﺯ ﺁﻥ ﺩﺭ ﻭﺏ ﺑﺮﺍﯼ ﺍﺳﺘﻔﺎﺩﻩ ﻫﺎﯼ ﺑﻌﺪﯼ
ﺍﻧﺘﺸﺎﺭ ﺩﺍﺩﻩ ﺷﺪﻩ ﺍﺳﺖ.
52 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 28. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
82 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 29. ﻣﺘﺪﻫﺎﯼ ﺍﺭﺯﻳﺎﺑﯽ
ﺁﻧﺘﺮﻭﭘﻲ: •
• ﻋﺪﺩﯼ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﻋﻀﻮﻫﺎﯼ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﻪ ﻳﮏ ﮐﻼﺱ ﺗﻨﻬﺎ ﺗﻌﻠﻖ ﺩﺍﺭﻧﺪ
ﺩﻗﺖ: •
• ﺩﺭﺻﺪﯼ ﺍﺯ ﻳﮏ ﮐﻼﺳﺘﺮ ﺍﺳﺖ ﮐﻪ ﺷﺎﻣﻞ ﺍﺷﻴﺎﺀ ﺍﺯ ﻳﮏ ﮐﻼﺱ ﻣﺸﺨﺺ ﺑﺎﺷﺪ.
ﺑﺎﺯﻳﺎﺑﯽ •
• ﻋﺪﺩﻱ ﺍﺳﺖ ﮐﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﺍﻳﻦ ﺍﺳﺖ ﮐﻪ ﺍﻋﻀﺎﻱ ﻳﮏ ﮐﻼﺱ، ﺩﺭ ﻳﮏ ﮐﻼﺳﺘﺮ ﺑﺎ ﻫﻤﺪﻳﮕﺮ ﻭﺍﻗﻊ ﻣﯽ ﺷﻮﻧﺪ
F-Measure •
•
92 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 30. ﻓﻬﺮﺳﺖ ﻣﻄﺎﻟﺐ
ﻣﻘﺪﻣﻪ ﺍﯼ ﺑﺮ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
ﻣﺴﺎﻟﻪ ﮐﻠﯽ ﭘﺮﻭﭘﻮﺯﺍﻝ •
ﻃﺮﺡ ﺯﻳﺮ ﻣﺴﺎﻟﻪ •
ﺗﺎﺭﻳﺨﭽﻪ ﮐﺎﺭﻫﺎﯼ ﺍﻧﺠﺎﻡ ﺷﺪﻩ •
ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ •
ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺳﺎﺧﺘﻪ ﺷﺪﻩ •
ﺭﻭﺵ ﺍﺭﺯﻳﺎﺑﯽ •
ﻧﺘﺎﻳﺞ ﺍﺭﺯﻳﺎﺑﯽ •
03 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 31. ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ
•
13 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 32. ﻧﺘﺎﻳﺞ ﻣﻘﺎﻳﺴﻪ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺎ ﺭﻭﺷﻬﺎﯼ ﻗﺒﻠﯽ
•
23 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 33. ﻧﺘﺎﻳﺞ ﺑﻪ ﺻﻮﺭﺕ ﮔﺮﺍﻑ
•
33 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 34. ﻧﺘﻴﺠﻪ ﮔﻴﺮﯼ ﻭ ﮐﺎﺭﻫﺎﯼ ﺁﻳﻨﺪﻩ
ﺭﻭﺷﻲ ﺑﺮﺍﯼ ﻳﺎﻓﺘﻦ ﻣﻴﺰﺍﻥ ﺷﺒﺎﻫﺖ ﻣﻨﺎﺑﻊ ﺩﺭ ﻭﺏ ﻣﺒﺘﻨﯽ ﺑﺮ ﺩﺍﺩﻩ ﺍﺭﺍﺋﻪ ﺷﺪﻩ ﺍﺳﺖ •
ﺍﻋﻤﺎﻝ ﻣﺘﺪ ﭘﻴﺸﻨﻬﺎﺩﯼ ﺑﺮ ﺭﻭﯼ ﮔﺮﺍﻑ ﺷﺒﮑﻪ ﻫﺎﯼ ﺍﺟﺘﻤﺎﻋﯽ •
ﺍﺭﺍﺋﻪ ﻳﮏ ﻣﺘﺪ ﻋﻤﻮﻣﯽ ﺩﺍﺭﺍﯼ ﻗﺎﺑﻠﻴﺖ ﺳﻔﺎﺭﺷﯽ ﺷﺪﻥ ﺑﺮﺍﯼ ﻫﺮ ﺣﻮﺯﻩ ﺧﺎﺹ •
ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺍﻳﻦ ﺭﻭﺵ ﺑﺮﺍﯼ ﻣﺤﺎﺳﺒﻪ ﺭﺗﺒﻪ ﺑﻨﺪﯼ ﻧﻮﺩﻫﺎ ﺩﺭ ﮔﺮﺍﻑ ﺩﺍﺩﻩ ﻫﺎﯼ ﭘﻴﻮﻧﺪﯼ •
43 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931
- 35. ﺑﺎ ﺗﺸﮑﺮ ﺍﺯ ﺣﺴﻦ ﺗﻮﺟﻪ ﺷﻤﺎ
53 ﺧوﺷﮫ ﺑﻧدی در داده ھﺎی ﭘﯾوﻧدی 72/9/0931