Engineering Web Search Applications

Engineering Web Search Applications Alessandro Bozzon Marco Brambilla Vienna July 5, 2010

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],About the speakers © 2010 Alessandro Bozzon, Marco Brambilla ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 ABOUT //

AGENDA ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 AGENDA //

Some numbers … ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 INTRODUCTION //

Information Retrieval Applications ,[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION // ,[object Object],[object Object],[object Object],[object Object],Static Document Collection Ranked Result Ad-Hoc query Document Routing System Predetermined queries or User profiles Incoming Documents

The nature of information retrieval ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION //

Information Retrieval is NOT Data Retrieval ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION //

The Information Retrieval Process July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION // Content Management Query analysis Query Interaction Generic search-oriented application B A C K E N D F R O N T E N D q’ q r r’ Search Result Composition Result Manipulation

Search Engine vs. Search Application ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION //

Characterization of the user information need ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION //

Evaluating an IR System ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION //

Enterprise search ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla INTRODUCTION //

Case Studies ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 CASE STUDIES //

Chansonnier ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 CASE STUDIES //

Key Requirements and Design Dimensions for Web Search © 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REQUIREMENTS // ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Data Type ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REQUIREMENTS //

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Data Analysis July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // ,[object Object]

Query Format ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REQUIREMENTS //

YaGoBi ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS //

PHAROS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS //

Query Federation in PHAROS July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // JPG Long/Lat XPath Keywords “ amsterdam” where[contains(“amsterdam”)] and topic[contains(“building”)] Geo search R-tree index 52.37N 4.89 E Text search Inverted index XML search Semantic index Image search Similarity index Query analysis Federation

User Behavior ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // ,[object Object],[object Object],[object Object],Ricardo Baeza-Yates Next Generation Search , 2 nd SeCo Workshop, Milan, 24/06/2010 Start End I am craving for a good Wiener Schnitzel and a Sachertorte in Vienna Search Menu Reviews Map

Information Seeking [Bates, 2002] July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // Bates, Marcia J. 2002. Toward an integrated model for information seeking and searching. In: The Fourth International Conference on Information Needs, Seeking and Use in Diﬀerent Contexts.

… vs. exploratory search ,[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REQUIREMENTS // ,[object Object],[object Object],[object Object],[object Object],[object Object]

Liquid Queries Definition _1 ,[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // Concert Artist Exhibition Restaurant Hotel Movie Metro Station Theatre Photo Landmark News Photo Concert Metro Station Restaurant News Exhibition Artist Hotel = inputs, outputs + GR = global ranking

Liquid Queries Definition _2 ,[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // Photo Concert Metro Station Restaurant News Exhibition Artist Hotel Expand

Result Exploration Support ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // ,[object Object],[object Object]

User Intent ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // [from SIGIR 2008 Tutorial, Baeza-Yates and Jones] History nyonya food Singapore Airlines Jakarta Weather Nikon Finepix Car Rental Kuala Lumpur

Contextual Content Delivery ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // from Ricardo Baeza-Yates, Next Generation Search , 2 nd Search Computing Workshop, Milan, 24/06/2010 Demo: http://sandbox.yahoo.com/Motif

Result Diversification ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla REQUIREMENTS // Relevance Diversity

Performance ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REQUIREMENTS //

Other Requirements ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REQUIREMENTS //

Search Computing: the architecture July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // High level query “ Where can I attend a DB scientific conference close to a beautiful beach reachable with cheap flights?” Sub query 1 “ Where can I attend a DB scientific conference?” Sub query 2 “ place close to a beautiful beach?” Sub query 3 “ place reachable with cheap flight?”

Search Computing: the architecture July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // Low level query 1 ConfSearch(“DB”,placeX,dateY) Low level query 2 TourSearch(“Beach”,PlaceX) Low level query 3 Flight(“cost<200”,PlaceX,DateY)

Search Computing: the architecture July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // Services invocations and operators execution Presented results ESWC-Crete-Olympic CAISE- Hammamet – Alitalia TOOLS-Malaga-EasyJet Query plan Results

Design Dimensions July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // Design Dimension Affected Process Values Retrieval Policy Indexing Push Pull Data Homogeneity Indexing Homogeneity Heterogeneity Data Analysis Indexing Mono Annotation Multi Annotation Mono Modal Multi Modal Search Technology Indexing, Query and Result Presentation Search Engine(s) Type Homogeneity Heterogeneity Query Format Query and Result Presentation, User Interface Query Type Mono Modal Multi Modal Mono Domain Multi Domain User Interaction User Interface Direct Indirect Active Passive

Development Methodology ,[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

An example process model Content Analysis / BPMN - WebML ,[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Refinement M2M Transformation M2T Transformation

Modeling User Interface ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // Alessandro Bozzon, Model-driven development of Search Based Web Applications, Ph.D Thesis, Politecnico di Milano, April 2009.

Pharos: Modeling User Interface July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // http://www.youtube.com/watch?v=ZpxyNi6Ht50 KEYWORD REFINEMENT FACETED REFINEMENT CONTENT-BASED REFINEMENT RESULT PRESENTATION

Search Computing Model Example Search Service Model ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN //

Search Computing Query Meta-model ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN //

Search Computing Model Transformations ,[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // 1 1 2 4 3 Prototype: http://dbgroup.como.polimi.it/brambilla/SeCoMDA

Search Computing DSLs (& Transformations): Panta Rhei ,[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla DESIGN // D. Braga, S. Ceri, F. Corcoglioniti,M. Grossniklaus, and S. Vadacca: Panta Rhei: An Execution Model for Queries over Web Information Sources, http://www.search-computing.it/sites/cms.web.seco/files/pantarhei2010.pdf

From the models to implementation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 IMPLEMENTATION //

Search Framework Vs. Search Engine ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 IMPLEMENTATION //

Open Source Search Vs Open Search ,[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 IMPLEMENTATION // www2010 Tutorial Open Source Tools, Drake & Jones, Yahoo! ,[object Object],API v. 2

Open Source Search High level comparison July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // Extended version of www2010 Tutorial Open Source Tools, Drake & Jones, Yahoo! Product License Lang. Docs Ranking Users Parallel Scale Support Lucene Apache Java/ C++ Several Flexible Amazon Yes TB 5/5 Zettair BSD Like C HTML, TREC, TXT Flexible Research No TB 1/5 Indri BSD Like C++ Many Very Flexible Research Yes TB 1.5/5 Sphinx GPL C++ Many Flexible Craiglist Yes YB 4/5 Xapian GPL C++ Many Flexible GMane Yes TB 3/5 RDBMS BSD, GPL C Limited Maybe GB 4/5

Lucene ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Additional Indexing Features ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Additional Querying Features ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Why Open Search? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Open Search APIs ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // API v. 2

Google Ajax Search API ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // Code Snippets from Google Ajax Search API Documentation

Yahoo! Boss (+ Search Monkey) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // WWW 2010 Tutorial Open Search Tools - Drake & Jones SearchMonkey keyterms Bookmarks

SMILA ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Data Model ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Chansonnier Data Model ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

SMILA Architecture ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // CONNECTIVITY SEARCH PROCESSING

Processing Pipelines ,[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // Process Invocation Condition on a record attribute Condition on an annotation value Activity Invocation

Chansonnier Activities ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Content Analysis July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // Text Annotation Media Annotation Transcoding Media Artifact Generation Media Analysis Media Analysis Text Analysis Text Analysis Media Artifact Generation Media Item Text Item

Index Terms and Precision/Recall ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Text Analysis Process ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // Document Parsing Lexycal Analysis Phrases Stemming Indexing Weighting Structure Full text Index Terms Stopwords Removal

Document Parsing ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Lexical Analysis ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Tokenization ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Stopword Removal ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Phrases (noun groups) - Strategies ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Thesauri ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Stemming and Lemmatization ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Stemming ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Tools for text analysis _1 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Tools for text analysis _2 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla SECTION NAME //

Multimedia Content Analysis ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 IMPLEMENTATION //

Audio Segmentation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 IMPLEMENTATION //

Video Segmentation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // CREDITS: Thorsten Hermes@SSMT2006

Classification of Music Genre ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // Rock Dance!

Face Identification and Recognition ,[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION // CREDITS: Thorsten Hermes@SSMT2006

Image Concept Detection ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Tools for media analysis _1 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Tools for media analysis _2 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla IMPLEMENTATION //

Measures for IR Systems ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Measuring User Happiness ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Evaluation measures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Relevance as a measure of user happiness ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Evaluating Relevance ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION // NOT COVERED HERE

Set-based evaluation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Precision / Recall ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Difficulties in using precision/recall ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Measures for Ranked Based evaluation ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Discounted Cumulative Gain (DCG) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION // ,[object Object],[object Object],[object Object],[object Object]

Preference Judgment ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION // A: preferences in agreement D: preferences in disagreement N r = # of non-relevant docs above relevant doc r, In the first R non-relevant R = number of relevant results for the query

Presentation Metrics ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],July 5, 2010 © 2010 Alessandro Bozzon, Marco Brambilla VALIDATION //

Thank you for your attention! ,[object Object],© 2010 Alessandro Bozzon, Marco Brambilla Alessandro Bozzon Dipartimento di Elettronica e Informazione Politecnico di Milano Milano, Italy [email_address] http://home.dei.polimi.it/bozzon Marco Brambilla Dipartimento di Elettronica e Informazione Politecnico di Milano Milano, Italy [email_address] http://home.dei.polimi.it/mbrambil http://www.search-computing.org/book July 5, 2010 REFERENCES //

References – Books ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REFERENCES //

References - Tutorial ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REFERENCES //

References - Papers ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],© 2010 Alessandro Bozzon, Marco Brambilla July 5, 2010 REFERENCES //

References - Papers ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Engineering Web Search Applications

Engineering Web Search Applications

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (15)

Destaque

Destaque (20)

Semelhante a Engineering Web Search Applications

Semelhante a Engineering Web Search Applications (20)

Mais de Alessandro Bozzon

Mais de Alessandro Bozzon (11)

Último

Último (20)

Engineering Web Search Applications

Notas do Editor