O documento descreve um método para seleção de palavras-chave em páginas web para veiculação de propaganda contextualizada de forma mais eficiente. O método leva em conta a coleção de anúncios disponíveis para ranquear os termos-chave de acordo com a relevância das propagandas retornadas, melhorando os resultados em comparação a métodos tradicionais.
3. Introdução
• Crescimento da publicidade online
• Produtores de conteúdo: método de viabilizar
financeiramente seus serviços web
• Anunciantes: ótimo custo/benefício, escala
mundial
• Um dos modelos de maior sucesso é a
publicidade contextualizada
4. Propaganda Contextualizada
• Modelo aplicável tanto em grandes portais
quanto em pequenos blogs
• Anúncios veiculados são relacionados ao
contexto no qual o usuário está inserido
– Aumentar o interesse do usuário
– Aumentar a taixa de cliques/vendas de produtos
7. Sistema de Veiculação de Publicidade
Contextualizada
Melhores
Anúncios
Página Web Informação sobre Coleção de
o contexto Anúncios
Detecção de Ranking
Contexto
7
8. Detecção de Contexto
• Etapa que visa extrair informações sobre o
contexto no qual o usuário está inserido
• Diversos métodos podem ser aplicados
– Classificação
– Histórico de Navegação
– Seleção de Palavras-Chave
8
9. Seleção de Palavras-Chave
• Conteúdo textual da página Web geralmente
possui muito ruído
• Selecionar os termos que melhor representam
o conteúdo da página
– Melhores resultados
– Menor volume de dados
9
10. Finding Advertising Keywords on Web Pages,
WWW 2006
• Termos possuem características que podem
diferenciar um termo bom de um termo ruim:
– Freqüência do termo na página;
– Localização do termo;
– Frequëncia do termo em logs de consultas a
máquinas de busca.
• Utiliza regressão logística para classificar
10
11. Finding Advertising Keywords on Web
Pages, WWW 2006
Vetores de Características
termo1 E1 E2 E3 E4 EN-1 EN
termo2 E1 E2 E3 E4 EN-1 EN
Base de Treino
Página Web termo3 E1 E2 E3 E4 EN-1 EN
termo4 E1 E2 E3 E4 EN-1 EN
termo5 E1 E2 E3 E4 EN-1 EN
termo6 E1 E2 E3 E4 EN-1 EN
termo7 E1 E2 E3 E4 EN-1 EN
termo8 E1 E2 E3 E4 EN-1 EN
termo9 E1 E2 E3 E4 EN-1 EN
.
.
.
termoN E1 E2 E3 E4 EN-1 EN
11
12. Intuição
• Um termo considerado bom descritor de uma
página é necessariamente um bom termo
para recupera propagandas relevantes para
ela?
• Selecionar termos de acordo com a relevância
das propagandas retornadas por eles.
12
18. Conclusões
• ACAKS apresenta resultados similares ao
baseline em termos de precisão
• Resultados muito superiores em termos de
revocação
• Desempenho do IDEAL mostra que método
possui muita margem para melhora se
melhorarmos o aprendizado
18