12. Хостовые дубликаты
Джоконда
<Мо?на Ли?за> (<Джоко?нда>; итал. La
Gioconda, фр. La Joconde, полное название Портре?т госпожи? Ли?зы Джоко?ндо, итал.
Ritratto di Monna Lisa
Винчи, находящаяся в Лувре (Париж, Франция),
одно из самых известных произведений живописи в
мире[1][2], которое, как считается,
Джоконда
dzhokonda_full.jpg
14. Дубликаты для поиска релевантных результатов
Флоренция
Мост
Базилика
Медичи
Мода
Дуомо
Кьянти
Санта Мария
Давид
Площадь
Тоскана
Боттичелли
Италия
Шопинг
Флоренция
Базилика
Мода
Дуомо
Санта Мария
Площадь
Тоскана
Италия
Флоренция
Дуомо
Санта Мария
16. Дубликаты для релевантности
Средняя релевантность
0,35
0,33
0,31
0,29
0,27
0,25
0,23
0,21
0,19
0,17
0,15
0
200
400
600
800
1000
1200
Количество дубликатов в группе
17. Дубликаты для ранжирования
• Как правило, копируют лучшие изображения.
• Лучшие изображения нужно показывать выше
Количество копий – очень важный фактор
ранжирования.
18. Только 1/3 изображений не имеют копий.
% of images
40,00%
35,00%
30,00%
25,00%
20,00%
15,00%
10,00%
5,00%
0,00%
0
2
4
6
8
10
12
14
16
number of duplicates
34. Что на картинке?
Мнение зрителя:
Спальня
Кровать
Подушка
Лампа
Метаданные:
Двухместный
WiFi
Парковка
Завтрак
35. Анализ визуального контента
• Классификация изображений или объектов
- фильтры
- настройка алгоритмов определения дубликатов
- выделение объектов для распознавания.
• Распознавание объектов:
– верификация текстовых описание
– добавление новых описаний