SlideShare uma empresa Scribd logo
1 de 28
Baixar para ler offline
Математические модели
 интернет-технологий:
от интернет рекламы до
   социальных сетей

     Леонид Жуков
       (ГУ ВШЭ)

                    1
План доклада
Talk outline

    Социальные сети
      нахождение сообществ

    Поисковая реклама
      сегментация рынка

    Интернет радио
      рекомендационная система


    Математическая модель:
      Граф
      Кластеризация (алгоритмы на графах)

2
Социальные сети
Social networks

    Социальная сеть (social network) — социальная структура,
    состоящая из группы узлов, которыми являются социальные
    объекты (люди или организации), и связей между ними
    (социальных взаимоотношений) - Wikipedia


    Интернет (2000 - ...)
      MySpace (300 млн), FaceBook, (50 млн), Friendster, ...
      Одноклассники (11 млн), В контакте (7 млн), Мой Круг ...


    Математическое представление – граф G( V, E)
       Множество вершин | V | – “люди”
       Множество ребер | E | – “отношения”
       Направленный / ненаправленный



3
Возможные исследование
Study topics

    Анализ структуры
      идентификации ролей пользователей
      развитие и рост сети
      нахождение сообществ


    Процессы в сети
      распостранение информации
      распостранение влияния
      сетевая экономика


    Реклама и монетизация

4
Социальная сеть Flickr
Flickr social network




5
Графическое представление
Flickr graph




6
Матрица смежности
Adjacency matrix




                    7
Матрица смежности
Adjacency matrix




8                  580,000 users,   3,500,000 links
Сортировка Cuthill-McKee
Reverse Cuthill-McKee ordering




9                 580,000 users,   3,500,000 links
Flickr: статистика
Flickr stats

     количество узлов (пользователей)= 584,207
     количество ребер (связей) = 3,555,115

     максимальная входящая степень узла = 3531
     максимальная выходящая степень узла = 8976
     < входящая степень узла > = < выходящая степень узла > = 6
     диаметр графа = 18
     средняя длина пути = 5.3

     число сильно связанных компонент = 152,324
     наибольшие сильно связанные комп = 274,649 : 374 : 186 :155 : …

     число связанных компонент = 43,189
     наибольшие связанные компоненты = 404,893 : 378 : 112 : 108 : …

     максимальное ядро (core number) = 249 (size 668)

10
Безмасштабные сети
 Scale-free (complex) networks



     Степенной закон распределения степеней узлов
     (power law)


     Медленно растущее среднее расстояние между
     узлами (small world)

     Высокий коэффициент кластеризации

     Наличие гигантской связанной компоненты

11
Безмасштабные сети
 Scale free


      Функция вероятности распределения    Кумулятивная функция распределения
PDF




                                          CDF
                                                CDF



                Node degree                              Node degree




12
Безмасштабные сети
   Scale free




                       Node degree
Nodes sorted
by in-degrees



                                     Node number
                 Node degree




Nodes sorted
by out-degrees



  13                                 Node number
K - ядра
K - core




15         2-core, 7,815 nodes
K - ядра
K - core




           5-core, 2,233 nodes
16
K - ядра
K - core




17
           10-core, 819 nodes
Разделение графа
Graph partitioning




18
Разделение графа
Graph partitioning




                     1           2       3       4
                                                         5
                         6
                                     7       8
                             A                       B



         Graph separators:




         Normalized cut:


19
                                                             J. Shi and J. Malik, 2000
Спектральное разделение графа
Spectral graph partitioning



                             2                                            M. Fielder, 1973
                     1                3          4
                                                        5
                         6
                                  7          8


     assign each node indicator                  ,   p= {-1,-1,-1,-1, +1, +1, +1}

     smallest cut:



     combinatorial optimization, NP hard, relax:


20
Решение
Solution


Quadratic optimization:




Eigenvalue problem:


Rounding off




                          p= {-1,-1,-1,-1, +1, +1, +1}

 21
Пример: нормированное разделение
Example: normalized cuts



      1        2       3   4
                                5
          6
                   7       8
          -1                   +1




L =                                 x=   p=




22
Спектральное разделение графа
Spectral graph cut
           node layout   Eigenvector – sorted




                              Cut values




x=



23
Спектральная сортировка
Spectral ordering

           Eigenvector                                Eigenvector – sorted




                         perm =   [1 2 6 7 3 8 4 5]

         Adjacency matrix                      Adjacency matrix – re-ordered




24
Спектральная сортировка
Spectral ordering




                    2^N vs N
25
Кластеризация
Clustering




26
Рекурсивное дерево
Recursive partitioning tree




27
Спектральная сортировка ядра Flickr
Flickr: “10-core” spectral ordering




28
Иерархическая кластеризация (таксономия)
Hierarchical clustering




29

Mais conteúdo relacionado

Destaque

ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013
Leonid Zhukov
 
Social Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to MacrobehaviorSocial Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to Macrobehavior
Leonid Zhukov
 
Business of Big Data
Business of Big DataBusiness of Big Data
Business of Big Data
Leonid Zhukov
 
socialnetworkszhukov
socialnetworkszhukovsocialnetworkszhukov
socialnetworkszhukov
Leonid Zhukov
 

Destaque (19)

Инфорамционные каскады
Инфорамционные каскадыИнфорамционные каскады
Инфорамционные каскады
 
Vis03 Workshop. DT-MRI Visualization
Vis03 Workshop. DT-MRI VisualizationVis03 Workshop. DT-MRI Visualization
Vis03 Workshop. DT-MRI Visualization
 
ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013
 
Numerical Linear Algebra for Data and Link Analysis
Numerical Linear Algebra for Data and Link AnalysisNumerical Linear Algebra for Data and Link Analysis
Numerical Linear Algebra for Data and Link Analysis
 
Monitorium DLP
Monitorium DLPMonitorium DLP
Monitorium DLP
 
Революция Больших Данных
Революция Больших ДанныхРеволюция Больших Данных
Революция Больших Данных
 
Russian Big Data Startups
Russian Big Data StartupsRussian Big Data Startups
Russian Big Data Startups
 
Social Networks
Social NetworksSocial Networks
Social Networks
 
Data Scientists
 Data Scientists Data Scientists
Data Scientists
 
Ecosystem challenges around data use
Ecosystem challenges around data useEcosystem challenges around data use
Ecosystem challenges around data use
 
Большие Данные
Большие ДанныеБольшие Данные
Большие Данные
 
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRIOriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
 
Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data Scientist
 
Social Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to MacrobehaviorSocial Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to Macrobehavior
 
Information cascades
Information cascadesInformation cascades
Information cascades
 
Business of Big Data
Business of Big DataBusiness of Big Data
Business of Big Data
 
Big Data at Ancestry.com
Big Data at Ancestry.comBig Data at Ancestry.com
Big Data at Ancestry.com
 
socialnetworkszhukov
socialnetworkszhukovsocialnetworkszhukov
socialnetworkszhukov
 
Numerical Linear Algebra for Data and Link Analysis.
Numerical Linear Algebra for Data and Link Analysis.Numerical Linear Algebra for Data and Link Analysis.
Numerical Linear Algebra for Data and Link Analysis.
 

Semelhante a Social Network Analysis

Глобальная дискретная оптимизация при помощи разрезов графов
Глобальная дискретная оптимизация при помощи разрезов графовГлобальная дискретная оптимизация при помощи разрезов графов
Глобальная дискретная оптимизация при помощи разрезов графов
romovpa
 
якобовский - введение в параллельное программирование (2)
якобовский - введение в параллельное программирование (2)якобовский - введение в параллельное программирование (2)
якобовский - введение в параллельное программирование (2)
Michael Karpov
 
якобовский - введение в параллельное программирование (3)
якобовский - введение в параллельное программирование (3)якобовский - введение в параллельное программирование (3)
якобовский - введение в параллельное программирование (3)
Michael Karpov
 
Лекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработкиЛекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработки
Victor Kulikov
 
CSEDays. Александр Семенов
CSEDays. Александр СеменовCSEDays. Александр Семенов
CSEDays. Александр Семенов
LiloSEA
 

Semelhante a Social Network Analysis (12)

Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.ppt
 
Глобальная дискретная оптимизация при помощи разрезов графов
Глобальная дискретная оптимизация при помощи разрезов графовГлобальная дискретная оптимизация при помощи разрезов графов
Глобальная дискретная оптимизация при помощи разрезов графов
 
якобовский - введение в параллельное программирование (2)
якобовский - введение в параллельное программирование (2)якобовский - введение в параллельное программирование (2)
якобовский - введение в параллельное программирование (2)
 
якобовский - введение в параллельное программирование (3)
якобовский - введение в параллельное программирование (3)якобовский - введение в параллельное программирование (3)
якобовский - введение в параллельное программирование (3)
 
"Социально-сетевой анализ форумов при помощи пакета UCINet"
"Социально-сетевой анализ форумов при помощи пакета UCINet""Социально-сетевой анализ форумов при помощи пакета UCINet"
"Социально-сетевой анализ форумов при помощи пакета UCINet"
 
L05 features
L05 featuresL05 features
L05 features
 
Лекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработкиЛекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработки
 
Реляционные базы данных
Реляционные базы данныхРеляционные базы данных
Реляционные базы данных
 
CSEDays. Александр Семенов
CSEDays. Александр СеменовCSEDays. Александр Семенов
CSEDays. Александр Семенов
 
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
 
Лекция 2
Лекция 2Лекция 2
Лекция 2
 
Efficiency vvv
Efficiency vvvEfficiency vvv
Efficiency vvv
 

Social Network Analysis