Preliminary Geo-tagging of Social Video Using Visual Content

•Transferir como PPTX, PDF•

1 gostou•744 visualizações

MediaEval2012

This document presents a system that aims to derive location information from visual content in videos without geo-tags. It divides the world into regions based on different criteria like temperature and biomes and uses visual similarity measures to match videos to these regions. Initial tests on 500 videos using a 22 biome classification achieved a 12.17% accuracy, better than random chance of 4.55%. Future work will focus on only using outdoor videos and excluding indoor images which provide noisy information.

Tecnologia

Preliminary Exploration of the Use of
Geographical Information for Content-
based Geo-tagging of Social Video

5-10-2012
Xinchao Li, Claudia Hauff, Martha Larson, Alan Hanjalic

Delft
University of
Technology

Challenge the future

System Overview

• Goal
derive location information from the visual content of videos

• Challenge
• no tags: 35.7%, only one tag: 13.1%
• improve metadata-based system

System Overview
Visual similarity measures for semantic video retrieval 2

•Assumption
divide the world map into regions that have a high within-
region visual stability and a high between-region variability

South Pole

Great Victoria Desert

System Overview
Visual similarity measures for semantic video retrieval 3

Different Division Methods

• Baseline

Visual similarity measures for semantic video Methods
Different Division retrieval 4

• Temperature Data based

Visual similarity measures for semantic video Methods
Different Division retrieval 5

• Temperature Data based

6 temperature regions: from -20◦C to 40◦C with 10◦C intervals.

Visual similarity measures for semantic video Methods
Different Division retrieval 6

• Biomes Data based

Visual similarity measures for semantic video Methods
Different Division retrieval 7

Run Results

Run Results
Visual similarity measures for semantic video retrieval 8

Run Results

22 Biomes classification: 12.17% (random, 4.55%)

Run Results
Visual similarity measures for semantic video retrieval 9

Discussion
• Visual Content of Test Videos
500 videos from the 4182 videos (12%)
• Indoor (42%)
• Outdoor Event (32%)
• Normal Outdoor (26%)

• Visual Content of Training Photos
458 photos from the 3M training set
• Indoor (27.5%)
Discussion
Visual similarity measures for semantic video retrieval 10

Indoor (42%)

Discussion
Visual similarity measures for semantic video retrieval 11

Outdoor Event (32%)

Discussion
Visual similarity measures for semantic video retrieval 12

Normal (26%)

Discussion
Visual similarity measures for semantic video retrieval 13

Conclusion and Future work

• Recall our assumption
“we can divide the world map into regions
that have a high within-region visual stability and a
high between-region variability.”
• indoor images are noisy information

• Only use outdoor videos to train and test

Discussion
Visual similarity measures for semantic video retrieval 14

Thank you!

X.Li-3@tudelft.nl

Visual similarity measures for semantic video retrieval 15

Mais conteúdo relacionado

Semelhante a Preliminary Geo-tagging of Social Video Using Visual Content

11 06 28_dublin_videoRoy Pea

CSTalks-Sensor-Rich Mobile Video Indexing and Search-17Augcstalks

Fast object re-detection and localization in video for spatio-temporal fragme...LinkedTV

Fast object re detection and localization in video for spatio-temporal fragme...MediaMixerCommunity

Semantic Summarization of videos, Semantic Summarization of videosdarsh228313

[AAAI 2021] Vid-ODE: Continuous-Time Video Generation with Neural Ordinary Di...Sunghyun Park

Research Proposal Presentation Pitchtchoonyong

Paul Wang SOED 2016Colleen Ganley

[2018 台灣人工智慧學校校友年會] 視訊畫面生成 / 林彥宇台灣資料科學年會

Presentación Tesis 08022016Universidad Politécnica de Madrid

Vdfp audio and video fingerprintingWietskevdHeuvel

2011 ISLPED: Backlight scaling serviceNational Taiwan Normal University

TUD at MediaEval 2012 genre tagging task: Multi-modality video categorization...MediaEval2012

2D to 3D conversion at CRC: A visual perception approach.Carlos Vazquez

Predicting Engagement in Video LecturesSahan Bulathwela

Presentation: Simulating High Quality Video from Still Images Alexander Chan

Crowdsourcing the Acquisition and Analysis of Mobile Videos for Disaster Resp...University of Southern California

Near-Duplicate Video Retrieval by Aggregating Intermediate CNN LayersSymeon Papadopoulos

Inverted File Based Search Technique for Video Copy Retrievalijcsa

Re-using Media on the Web tutorial: Media Fragment Creation and AnnotationMediaMixerCommunity

Semelhante a Preliminary Geo-tagging of Social Video Using Visual Content (20)

11 06 28_dublin_video

CSTalks-Sensor-Rich Mobile Video Indexing and Search-17Aug

Fast object re-detection and localization in video for spatio-temporal fragme...

Fast object re detection and localization in video for spatio-temporal fragme...

Semantic Summarization of videos, Semantic Summarization of videos

[AAAI 2021] Vid-ODE: Continuous-Time Video Generation with Neural Ordinary Di...

Research Proposal Presentation Pitch

Paul Wang SOED 2016

[2018 台灣人工智慧學校校友年會] 視訊畫面生成 / 林彥宇

Presentación Tesis 08022016

Vdfp audio and video fingerprinting

2011 ISLPED: Backlight scaling service

TUD at MediaEval 2012 genre tagging task: Multi-modality video categorization...

2D to 3D conversion at CRC: A visual perception approach.

Predicting Engagement in Video Lectures

Presentation: Simulating High Quality Video from Still Images

Crowdsourcing the Acquisition and Analysis of Mobile Videos for Disaster Resp...

Near-Duplicate Video Retrieval by Aggregating Intermediate CNN Layers

Inverted File Based Search Technique for Video Copy Retrieval

Re-using Media on the Web tutorial: Media Fragment Creation and Annotation

Mais de MediaEval2012

ClosingMediaEval2012

A Multimodal Approach for Video Geocoding MediaEval2012

Brave New Task: Musiclef Multimodal Music TaggingMediaEval2012

Search and Hyperlinking Task at MediaEval 2012MediaEval2012

CUNI at MediaEval 2012: Search and Hyperlinking TaskMediaEval2012

DCU Search Runs at MediaEval 2012: Search and Hyperlinking TaskMediaEval2012

Ghent University-IBBT at MediaEval 2012 Search and Hyperlinking: Semantic Sim...MediaEval2012

Brave New Task: User Account MatchingMediaEval2012

The CLEF Initiative From 2010 to 2012 and OnwardsMediaEval2012

Overview of MediaEval 2012 Visual Privacy TaskMediaEval2012

MediaEval 2012 Visual Privacy Task: Privacy and Intelligibility through Pixel...MediaEval2012

MediaEval 2012 Visual Privacy Task: Applying Transform-domain Scrambling to A...MediaEval2012

Violent Scenes Detection with Large, Brute-forced Acoustic and Visual Feature...MediaEval2012

mevd2012 esra_MediaEval2012

Technicolor/INRIA/Imperial College London at the MediaEval 2012 Violent Scene...MediaEval2012

The MediaEval 2012 Affect Task: Violent Scenes DetectioMediaEval2012

NII, Japan at MediaEval 2012 Violent Scenes Detection Affect TaskMediaEval2012

LIG at MediaEval 2012 affect task: use of a generic methodMediaEval2012

Violence Detection in Video by Large Scale Multi-Scale Local Binary Pattern D...MediaEval2012

ARF @ MediaEval 2012: An Uninformed Approach to Violence Detection in Hollywo...MediaEval2012

Mais de MediaEval2012 (20)

Closing

A Multimodal Approach for Video Geocoding

Brave New Task: Musiclef Multimodal Music Tagging

Search and Hyperlinking Task at MediaEval 2012

CUNI at MediaEval 2012: Search and Hyperlinking Task

DCU Search Runs at MediaEval 2012: Search and Hyperlinking Task

Ghent University-IBBT at MediaEval 2012 Search and Hyperlinking: Semantic Sim...

Brave New Task: User Account Matching

The CLEF Initiative From 2010 to 2012 and Onwards

Overview of MediaEval 2012 Visual Privacy Task

MediaEval 2012 Visual Privacy Task: Privacy and Intelligibility through Pixel...

MediaEval 2012 Visual Privacy Task: Applying Transform-domain Scrambling to A...

Violent Scenes Detection with Large, Brute-forced Acoustic and Visual Feature...

mevd2012 esra_

Technicolor/INRIA/Imperial College London at the MediaEval 2012 Violent Scene...

The MediaEval 2012 Affect Task: Violent Scenes Detectio

NII, Japan at MediaEval 2012 Violent Scenes Detection Affect Task

LIG at MediaEval 2012 affect task: use of a generic method

Violence Detection in Video by Large Scale Multi-Scale Local Binary Pattern D...

ARF @ MediaEval 2012: An Uninformed Approach to Violence Detection in Hollywo...

Último

Advanced Computer Architecture – An IntroductionDilum Bandara

"Debugging python applications inside k8s environment", Andrii SoldatenkoFwdays

"ML in Production",Oleksandr BaganFwdays

Unraveling Multimodality with Large Language Models.pdfAlex Barbosa Coqueiro

Developer Data Modeling Mistakes: From Postgres to NoSQLScyllaDB

SIP trunking in Janus @ Kamailio World 2024Lorenzo Miniero

How to write a Business Continuity PlanDatabarracks

The Fit for Passkeys for Employee and Consumer Sign-ins: FIDO Paris Seminar.pptxLoriGlavin3

Nell’iperspazio con Rocket: il Framework Web di Rust!Commit University

What is Artificial Intelligence?????????blackmambaettijean

Rise of the Machines: Known As Drones...Rick Flair

What is DBT - The Ultimate Data Build Tool.pdfMounikaPolabathina

Transcript: New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024BookNet Canada

Tampa BSides - Chef's Tour of Microsoft Security Adoption Framework (SAF)Mark Simos

Take control of your SAP testing with UiPath Test SuiteDianaGray10

Moving Beyond Passwords: FIDO Paris Seminar.pdfLoriGlavin3

What's New in Teams Calling, Meetings and Devices March 2024Stephanie Beckett

"Subclassing and Composition – A Pythonic Tour of Trade-Offs", Hynek SchlawackFwdays

Generative AI for Technical Writer or Information DevelopersRaghuram Pandurangan

SALESFORCE EDUCATION CLOUD | FEXLE SERVICESmohitsingh558521

Preliminary Geo-tagging of Social Video Using Visual Content

1. Preliminary Exploration of the Use of Geographical Information for Content- based Geo-tagging of Social Video 5-10-2012 Xinchao Li, Claudia Hauff, Martha Larson, Alan Hanjalic Delft University of Technology Challenge the future

2. System Overview • Goal derive location information from the visual content of videos • Challenge • no tags: 35.7%, only one tag: 13.1% • improve metadata-based system System Overview Visual similarity measures for semantic video retrieval 2

3. •Assumption divide the world map into regions that have a high within- region visual stability and a high between-region variability South Pole Great Victoria Desert System Overview Visual similarity measures for semantic video retrieval 3

4. Different Division Methods • Baseline Visual similarity measures for semantic video Methods Different Division retrieval 4

5. • Temperature Data based Visual similarity measures for semantic video Methods Different Division retrieval 5

6. • Temperature Data based 6 temperature regions: from -20◦C to 40◦C with 10◦C intervals. Visual similarity measures for semantic video Methods Different Division retrieval 6

7. • Biomes Data based Visual similarity measures for semantic video Methods Different Division retrieval 7

8. Run Results Run Results Visual similarity measures for semantic video retrieval 8

9. Run Results 22 Biomes classification: 12.17% (random, 4.55%) Run Results Visual similarity measures for semantic video retrieval 9

10. Discussion • Visual Content of Test Videos 500 videos from the 4182 videos (12%) • Indoor (42%) • Outdoor Event (32%) • Normal Outdoor (26%) • Visual Content of Training Photos 458 photos from the 3M training set • Indoor (27.5%) Discussion Visual similarity measures for semantic video retrieval 10

11. Indoor (42%) Discussion Visual similarity measures for semantic video retrieval 11

12. Outdoor Event (32%) Discussion Visual similarity measures for semantic video retrieval 12

13. Normal (26%) Discussion Visual similarity measures for semantic video retrieval 13

14. Conclusion and Future work • Recall our assumption “we can divide the world map into regions that have a high within-region visual stability and a high between-region variability.” • indoor images are noisy information • Only use outdoor videos to train and test Discussion Visual similarity measures for semantic video retrieval 14

15. Thank you! X.Li-3@tudelft.nl Visual similarity measures for semantic video retrieval 15

Preliminary Geo-tagging of Social Video Using Visual Content

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Preliminary Geo-tagging of Social Video Using Visual Content

Semelhante a Preliminary Geo-tagging of Social Video Using Visual Content (20)

Mais de MediaEval2012

Mais de MediaEval2012 (20)

Último

Último (20)

Preliminary Geo-tagging of Social Video Using Visual Content