SlideShare uma empresa Scribd logo
1 de 15
Baixar para ler offline
Факторный анализ
в рекомендательной
системе imhonet
Данные


                                              Расчёты


Пользователи


                              Сервис
               • единомышленники       • прогнозы
               • рекомендации          • навигация
Данные              С.С.А.


                                                  Расчёты


Пользователи


                              Сервис
               • единомышленники        • прогнозы
               • рекомендации           • навигация
Большая разреженная матрица         Факторы пользователей
         оценок m x n
                                            mxk
(m пользователей, n объектов)




                                                 Сингулярные числа         Факторы объектов
                                                       kxk                             kxn




                                ≈                •              •



                                                              ε1 ≥ ε2 ≥ ε 3 ≥ ε4 ≥ …
1-й фактор
2-й фактор
3-й фактор
4-й фактор
Значения сингулярных чисел.




1.   ориентация на качество vs ориентация на новизну   [установка на качество]
2.   доброе-простое vs трэш-сатира                     [эмоциональный знак]
3.   мужской vs женский                                [пол]
4.   высокобюджетный компактный vs дешевый сериал      [дегьги/время]
1-й фактор для книг по оценкам imhonet.

•   Мертвые души                           •   Код да Винчи (Д.Браун)
•   Преступление и наказание               •   Последний дозор (С.Лукьяненко)
•   Ревизор                                •   Ангелы и демоны (Д.Браун)
•   Евгений Онегин                         •   Дневной дозор (С.Лукьяненко)
•   Горе от ума                            •   Точка обмана (Д.Браун)
•   Идиот                                  •   Цифровая крепость (Д.Браун)
•   Капитанская дочка                      •   Ночной дозор (С.Лукьяненко)
•   Шинель                                 •   Вечеринка в стиле “вамп” (А.Кош)
•   Гамлет, принц датский                  •   Волкодав (М.Семенова)
•   Братья Карамазовы                      •   Чистовик (С.Лукьяненко)
•   Дон Кихот                              •   Сумерки (С.Майер)
•   Война и мир                            •   Огненный патруль (А.Кош)
•   Вишневый сад                           •   Черновик (С.Лукьяненко)
•   Илиада                                 •   Профессия: ведьма (О.Громыко)
•   Приключения Алисы в стране чудес       •   Таня Гроттер и Исчезающий Этаж
1-й фактор по оценкам Netflix
Новый пользователь.

                    Накопление
Регистрация         стартового        Сервис
                     профиля


   Пример сбора стартового профиля.
Прогнозы
                                              so
           ≈     •      •                   rпрогноз      p, q                 pt   t   qt
                                                                      t 1..k




                             Объяснения
  so
rпрогноз       p, ˆ q       ˆ
                            Ps ro         ai rio       ˆ
                                                       P rs           b j rjs
                                                        o
                                      i                           j



                        через оценки этого объекта     предыдущими оценками
                         другими пользователями            пользователя
факторный анализ в рекомендательной системе. в. бобриков. зал 4
vbobrikov@imhonet.ru

blog.imhonet.ru/community/1702/

pcaimhonet@googlegroups.com

Mais conteúdo relacionado

Mais de rit2011

что и почему вы должны программировать на Erlang.максим лапшин. зал 4
что и почему вы должны программировать на Erlang.максим лапшин. зал 4что и почему вы должны программировать на Erlang.максим лапшин. зал 4
что и почему вы должны программировать на Erlang.максим лапшин. зал 4rit2011
 
I pv6 малоизвестные подробности. андрей пантюхин. зал 2
I pv6   малоизвестные подробности. андрей пантюхин. зал 2I pv6   малоизвестные подробности. андрей пантюхин. зал 2
I pv6 малоизвестные подробности. андрей пантюхин. зал 2rit2011
 
безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4rit2011
 
как стать хорошим веб технологом. нарек мкртчян. зал 4
как стать хорошим веб технологом. нарек мкртчян. зал 4как стать хорошим веб технологом. нарек мкртчян. зал 4
как стать хорошим веб технологом. нарек мкртчян. зал 4rit2011
 
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...rit2011
 
выращиваем интерфейс своими руками. ольга павлова. зал 3
выращиваем интерфейс своими руками. ольга павлова. зал 3выращиваем интерфейс своими руками. ольга павлова. зал 3
выращиваем интерфейс своими руками. ольга павлова. зал 3rit2011
 
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2rit2011
 
от Flash к html5. александр бацуев. зал 4
от Flash к html5. александр бацуев. зал 4от Flash к html5. александр бацуев. зал 4
от Flash к html5. александр бацуев. зал 4rit2011
 
Ie9 и ie10. алекс могилевский. зал 2
Ie9 и ie10. алекс могилевский. зал 2Ie9 и ie10. алекс могилевский. зал 2
Ie9 и ie10. алекс могилевский. зал 2rit2011
 
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...rit2011
 
полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...
полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...
полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...rit2011
 
рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...
рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...
рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...rit2011
 
типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2
типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2
типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2rit2011
 
круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2rit2011
 
бэм! в.харисов, с. бережной. зал 2
бэм! в.харисов, с. бережной. зал 2бэм! в.харисов, с. бережной. зал 2
бэм! в.харисов, с. бережной. зал 2rit2011
 
круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2rit2011
 
менеджмент в стиле коучинг. с. панкратов. зал 2
менеджмент в стиле коучинг. с. панкратов. зал 2менеджмент в стиле коучинг. с. панкратов. зал 2
менеджмент в стиле коучинг. с. панкратов. зал 2rit2011
 
как объяснить заказчику, что он не прав. денис тучин. зал 3
как объяснить заказчику, что он не прав. денис тучин. зал 3как объяснить заказчику, что он не прав. денис тучин. зал 3
как объяснить заказчику, что он не прав. денис тучин. зал 3rit2011
 
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...rit2011
 
способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...
способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...
способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...rit2011
 

Mais de rit2011 (20)

что и почему вы должны программировать на Erlang.максим лапшин. зал 4
что и почему вы должны программировать на Erlang.максим лапшин. зал 4что и почему вы должны программировать на Erlang.максим лапшин. зал 4
что и почему вы должны программировать на Erlang.максим лапшин. зал 4
 
I pv6 малоизвестные подробности. андрей пантюхин. зал 2
I pv6   малоизвестные подробности. андрей пантюхин. зал 2I pv6   малоизвестные подробности. андрей пантюхин. зал 2
I pv6 малоизвестные подробности. андрей пантюхин. зал 2
 
безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4безопасность веб приложений сегодня. дмитрий евтеев. зал 4
безопасность веб приложений сегодня. дмитрий евтеев. зал 4
 
как стать хорошим веб технологом. нарек мкртчян. зал 4
как стать хорошим веб технологом. нарек мкртчян. зал 4как стать хорошим веб технологом. нарек мкртчян. зал 4
как стать хорошим веб технологом. нарек мкртчян. зал 4
 
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
 
выращиваем интерфейс своими руками. ольга павлова. зал 3
выращиваем интерфейс своими руками. ольга павлова. зал 3выращиваем интерфейс своими руками. ольга павлова. зал 3
выращиваем интерфейс своими руками. ольга павлова. зал 3
 
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
распределенное файловое хранилище (Nginx, zfs, perl). перепелица мамонтов. зал 2
 
от Flash к html5. александр бацуев. зал 4
от Flash к html5. александр бацуев. зал 4от Flash к html5. александр бацуев. зал 4
от Flash к html5. александр бацуев. зал 4
 
Ie9 и ie10. алекс могилевский. зал 2
Ie9 и ie10. алекс могилевский. зал 2Ie9 и ie10. алекс могилевский. зал 2
Ie9 и ie10. алекс могилевский. зал 2
 
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
сотни серверов, десятки компонент. автоматизация раскладки и конфигурирования...
 
полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...
полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...
полмиллиона юзеров в онлайне без падений оптимизация высоконагруженной Server...
 
рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...
рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...
рисуем тз. эффективный способ коммуникации в веб проектах. артем вольфтруб. з...
 
типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2
типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2
типология личности и прогноз отношений по а. афанасьеву. сергей котырев. зал 2
 
круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2
 
бэм! в.харисов, с. бережной. зал 2
бэм! в.харисов, с. бережной. зал 2бэм! в.харисов, с. бережной. зал 2
бэм! в.харисов, с. бережной. зал 2
 
круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2круглый стол по найму. александр зиза. зал 2
круглый стол по найму. александр зиза. зал 2
 
менеджмент в стиле коучинг. с. панкратов. зал 2
менеджмент в стиле коучинг. с. панкратов. зал 2менеджмент в стиле коучинг. с. панкратов. зал 2
менеджмент в стиле коучинг. с. панкратов. зал 2
 
как объяснить заказчику, что он не прав. денис тучин. зал 3
как объяснить заказчику, что он не прав. денис тучин. зал 3как объяснить заказчику, что он не прав. денис тучин. зал 3
как объяснить заказчику, что он не прав. денис тучин. зал 3
 
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
как написать масштабируемую баннерокрутилку. денис бирюков, артем гавриченков...
 
способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...
способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...
способы защиты медиа контента. возможен ли Drm в вебе. денис елданди, алексан...
 

факторный анализ в рекомендательной системе. в. бобриков. зал 4

  • 2. Данные Расчёты Пользователи Сервис • единомышленники • прогнозы • рекомендации • навигация
  • 3. Данные С.С.А. Расчёты Пользователи Сервис • единомышленники • прогнозы • рекомендации • навигация
  • 4. Большая разреженная матрица Факторы пользователей оценок m x n mxk (m пользователей, n объектов) Сингулярные числа Факторы объектов kxk kxn ≈ • • ε1 ≥ ε2 ≥ ε 3 ≥ ε4 ≥ …
  • 9. Значения сингулярных чисел. 1. ориентация на качество vs ориентация на новизну [установка на качество] 2. доброе-простое vs трэш-сатира [эмоциональный знак] 3. мужской vs женский [пол] 4. высокобюджетный компактный vs дешевый сериал [дегьги/время]
  • 10. 1-й фактор для книг по оценкам imhonet. • Мертвые души • Код да Винчи (Д.Браун) • Преступление и наказание • Последний дозор (С.Лукьяненко) • Ревизор • Ангелы и демоны (Д.Браун) • Евгений Онегин • Дневной дозор (С.Лукьяненко) • Горе от ума • Точка обмана (Д.Браун) • Идиот • Цифровая крепость (Д.Браун) • Капитанская дочка • Ночной дозор (С.Лукьяненко) • Шинель • Вечеринка в стиле “вамп” (А.Кош) • Гамлет, принц датский • Волкодав (М.Семенова) • Братья Карамазовы • Чистовик (С.Лукьяненко) • Дон Кихот • Сумерки (С.Майер) • Война и мир • Огненный патруль (А.Кош) • Вишневый сад • Черновик (С.Лукьяненко) • Илиада • Профессия: ведьма (О.Громыко) • Приключения Алисы в стране чудес • Таня Гроттер и Исчезающий Этаж
  • 11. 1-й фактор по оценкам Netflix
  • 12. Новый пользователь. Накопление Регистрация стартового Сервис профиля Пример сбора стартового профиля.
  • 13. Прогнозы so ≈ • • rпрогноз p, q pt t qt t 1..k Объяснения so rпрогноз p, ˆ q ˆ Ps ro ai rio ˆ P rs b j rjs o i j через оценки этого объекта предыдущими оценками другими пользователями пользователя