1. Politecnico di Milano Polo regionale di Como TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA TELEVISIONE INTERATTIVA Relatore Prof. Francesco Fabio Violante Candidato: Andrea Cusini Correlatore Ing. Stefano Visconti Como, 22 Luglio 2008
2. Sommario Contesto Obiettivo Soluzione proposta Applicazione a un caso di studio Principali risultati ottenuti Conclusioni e Sviluppi futuri 2 22/07/2008
3. Contesto TV BROADCAST TV INTERATTIVA Palinsesto Triple play Unidirezionale VOD (Video On Demand) PVR (Personal Video Recorder) Servizi Avanzati L’operatore può conoscere in ogni istante cosa fanno e cosa guardano gli utenti. L’operatore ha come unico feedback l’ auditel. 3 22/07/2008
4. Obiettivo Fornire agli operatori di TV interattiva uno strumento per prevedere la popolarità di un nuovo contenuto a partire dai suoi metadati. Metadati Film 4 22/07/2008
12. Genere/iProblema 1: Come determinare le classi di visioni? Problema 2: Come trattare i metadati in input? Rete Neurale Input Preprocessing 6
13. Determinare le classi di visioni 22/07/2008 Input Preprocessing L’output del sistema consiste di N classi di visione con ampiezza definita mantenendo una quantità di film (item) costante in ogni classe. Classi di visioni Rete Neurale # Item Distribuzione cumulativa Film/Visioni 250 125 43 1000 75 5000 10000 Views Esempio: suddivisione in 5 classi di visioni. 1 2 3 4 5 7
33. Casa di produzioneIMDB (Internet Movie Database) 12 22/07/2008
34. Principali risultati ottenuti Training della rete: 2000 campioni (Film). 400 x 5 classi. Testing della rete: 50 campioni. Confronto Visioni reali – Visioni predette Reale Predetto Entro l’intervallo di una classe, la predizione può dirsi corretta. 13 22/07/2008
35. Risultati per ogni classe di visione 22/07/2008 Valutazione performance: %Bingo Rate: Percentuale di correttezza di una previsione. Si considera corretta la previsione se corrisponde alla classe reale. %W1C (Within 1 Class) Rate: Si considera corretta anche la previsione che cade in una classe adiacente (precedente o successiva) alla classe reale. La previsione entro una classe di correttezza è superiore al 70% in tutte le classi di visione. 14
36.
37.
38. Arricchire il preprocessing (ad esempio utilizzo di Association Rules).
44. Determinazione Classi di Output 22/07/2008 20 Algoritmo Lloyd-Max per la suddivisione di una pdf. Procedura iterativa per disegnare un generico quantizzatore ottimo per una pdf data. Views Utilizzo di uno script Matlab. Input: Numero di classi desiderate e pdf. Output: Intervalli ottimi.
46. Parametri per i metadati 22/07/2008 Modello Classi di visioni Input Preprocessing Rete Neurale Parametri per i metadati Modalità di utilizzo dei metadati Metadati da utilizzare Esempio: Utilizzare solo Attore, Genere e Regista Numero di categorie per ogni metedato testuale Esempio: Attore, 3 categorie (Star, Medio, Flop) 22
47. Determinare Peso Metadato 22/07/2008 Input Preprocessing Metadato Testuale Es. “Tom Cruise” Classi di visioni Valore numerico Es. “13709” Categoria Es. “1” Rete Neurale Rete Neurale Peso di un Metadato testuale 75-percentile delle visioni dei film in cui è presente Con P=75, N=num. Film 23
48. Rete Neurale - Procedimento 22/07/2008 Input Preprocessing Classi di visioni Rete Neurale Procedimento Sperimentale Test della rete variando il numero di input per un metadato multiplo Risultati Migliori dei precedenti? No Configurazione ottimale Sì 24
49. Training e Testing della rete 22/07/2008 25 Training Rete Neurale Testing
50. Esempio Algoritmo FPM Funzionamento dell’algoritmo Relim (RecursiveElimination). Definire un oridine per gli item (Ad esempio la frequenza nelle transazioni) Riordinare gli item nelle transazioni in base alla loro frequenza Ricorsivamente si creano delle liste dette “Prefix” a partire dall’Item con frequenza più elevata.
51. Input preprocessing: Validazione 22/07/2008 Input Preprocessing Classi di visioni Algoritmi di Frequent Pattern Mining per la determinazione di Regole di Associazione. Rete Neurale Esempio regola: Permettono di validare i risultati della categorizzazione dei metadati testuali. 27