This first study focuses on the personalized positioning of ads on content pages. It demonstrates a correlation between the level of attention that users devote to a content, and the position of the most noticeable graphic element on the side bar. In particular, we find that the graphic element most noticed by a user is roughly to the side of the point in the article where the user's attention waned. We argue that this finding lays the foundation for increasing display advertising effectiveness by tailoring ad positions on each article page impression to the user viewing it.
4. - 4 -
ENGAGEMENT-BASED USER
ATTENTION DISTRIBUTION ON
WEB ARTICLE PAGES
Joint work with Nadav Golbandi, Ronny Lempel, and Limor Leibovich
5. - 5 -
Motivation
• Online display advertising is a multi-billion
dollar business
• Ads are often sold by impression in a model
known as CPI (cost-per-impression) or CPM
(cost-per-mille)
• Advertiser return of investment (ROI) depends
on how much attention is paid to their ads by
users
– Till now the surrogate to that was thought to
be ad location
6. - 6 -
• Varies widely
• Benway and Lane studied “Banner blindness”
– Showed that users didn't find specific information
that they were asked to and if it was embedded in a
banner
– Moreover, ads located higher on a page are missed
more often than ads located lower on the page
• On the other hand, in a different online advertising
scenario --- sponsored search --- the most effective
(and expensive) ad spots on a page are the top ones
• We argue that users are neither blind to display
advertisements nor consume it only before/after the
main content
Main content
Ads
Users’ attention distribution
7. - 7 -
Our scope
• Hypothesis:
– For a given user reading a specific article page, the
best ad location is to the side of the point in the story
where the user's interest tapers off
• Envisioned application:
– Many media sites employ recommender systems
and other machine learned algorithms that predict
users' tendencies to click on stories
– Those algorithms will be enhanced to also predict -
given a user„s click on a story - where the user's
attention will wane
– The highest-cost ad position will then be to the side
of the predicted point of waning attention
8. - 8 -
Measuring ads effectiveness
• Recognition: is the awareness of having
previously experienced the stimuli
– Simply asking the respondent if he/she has
seen a specific ad would qualify as a
recognition measure of exposure
• Recall: is the mental reproduction of some
target item experienced or learned earlier
– To qualify as a recall measure of exposure,
the consumer would need to accurately
describe some aspect of the ad
R. Bagozzi and A. Silk. Recall, recognition, and the measurement of memory for print
advertisements. Marketing Science, 2:95-134, 1983
9. - 9 -
Experimental setup
Amazon Mechanical Turk
Primary
content
Instruction set Content page with ad slots Cool down page Questionnaire
1 2 3 4
10. - 10 -
Content page
“I‟m done reading”
button
Primary content
(from OMG!
Website)
Ad #1 slot
A total of 4
paragraphs
4 images acting
as ad surrogates
11. - 11 -
Images choice
• To measure recall in a valid manner, we used images that can
not be recognized easily by a superficial glance on the image
• Our images consisted of a photo of a famous person, whose
name should be familiar to most people but whose face is
much less known, along with a quote of the person with his
name at the end
• Only users who paid enough attention to the image and read
its text would be able to answer who was displayed in it
Instead of embedding ads in the
page, we used images as
surrogates.
We deemed it easier to control
recall aspects by using these
images.
12. - 12 -
Questionnaire page
• Contained questions on both the text and the images:
– Users were not told in advance the type of questions
they will be asked
– Furthermore, they were not able to return to the
article page once they started answering the
questions
• The purpose of the questions on the text is to allow a
confident estimation of the location in the text where the
user stopped reading the article
• The purpose of the questions on images is to measure
advertisements recall
13. - 13 -
Questionnaire page (cont.)
• The questionnaire contained 16 questions:
– 1 question on the overall level of interest they found
in the article
– 12 multiple choice questions, each with 6 possible
answers (one of them is “don't know”)
• 8 were on article‟s text (2 on every paragraph)
• 4 were on the images (1 recall question per image)
– 3 additional questions were to assess the
awareness of users
• E.g. “What was the main topic of the article”?
• Only users that answered correctly at least 2 of these 3
questions were included in the ensuing analysis
14. - 14 -
Classification of reading profiles
• The text shown to users was comprised of 4
paragraphs
• Users were asked 2 questions on every paragraph, and
their answers were coded as ternary response vectors
indicating the number of correct answers (0, 1 or 2) for
every paragraph
– Example: 0 2 1 0
Answered correctly both
questions of the second
paragraph
Answered correctly one
question of the third
paragraph
15. - 15 -
Classification of reading profiles (cont.)
• There are 81 possible response vectors
• Mapped into 5 reading profiles, indicating the number of
paragraphs read by the user -- ranging from 0 to 4
paragraphs
– Assumption: users read linearly (not necessarily
every sentence), from top to bottom
• Ideally, these 5 reading profiles correspond to the
response vectors 0000, 2000, 2200, 2220 and 2222
– In practice, only 21% of the response vectors
matched one of those 5 patterns
• We mapped the rest of the response vectors to one of
the 5 possible reading profiles based on probabilistic
considerations
– For more details please refer to the paper
16. - 16 -
Main result
• We report:
1. Correlation between workers‟ answers
about the level of their interest in the article
and the predicted reading profile (intuitive)
2. Correlation between the user's reading
profile and the recall measure on ad-
surrogate images (not intuitive)
17. - 17 -
Main result (cont.)
• 75% of the users were banner blind (consistent
with findings of Benway and Lane)
• We divided the 204 non-image blind worker
assignments into 3 reading profiles:
– very little reading (0-1 paragraphs)
– moderate reading (2-3 paragraphs)
– thorough reading (4 paragraphs)
• We next examined the average image recall
rate as a function of image position
18. - 18 -
Main result (cont.)
Baseline
T-TEST
significantly more recognized than the
corresponding points in little reading category
p-value=0.0121
p-value=0.0003
p-value=0.0053
19. - 19 -
Summary
• First step toward personalized placement of ads based
on attention considerations
• We argue that for a given user reading a specific article
page, the best ad location is to the side of the point in
the story where the user„s interest tapers off, which in
turn can be predicted from the expected user interest in
the content
• These findings lay the foundation for increasing display
advertising effectiveness by tailoring ad positions on
each article page impression to the user viewing it
Notas do Editor
Сегодня я расскажу о 2х исследованиях которые связаны с распределением и удержанием внимания пользователей на веб страницах с контентом. Первая работа была проведена с …… из нашей лаборатории и …. Из Техниона – Лимор проходила у нас практику прошлым летом.Эта работа была опубликована на прошлогодней конференции Hipertext2013.
Как вы, наверное, знаете, онлайновая реклама – это много-миллиардный бизнес, который составляет основу доходов интернет компаний. Реклама продаётся рекламодателю по модели CPI – где рекламодатель платит за каждый просмотр своей рекламы, или CPM - где рекламодатель платит за каждую 1000 просмотров.ROI – return of investment (окупаемость инвестиций) рекламодателя зависит от количества внимания которое пользователи уделяют его рекламе. И поскольку внимание пользователей – понятие довольно абстрактное, до сих пор считается что место расположения рекламы на странице является таким «суррогатом» распределения этого самого внимания
Распределение внимания пользователей сильно варьируется при просмотре страниц с контентом, поэтому расположение рекламы на странице очень важно В литературе существует теория, согласно которой пользователи вообще крайне редко замечают рекламу на странице. Это явления даже получило название «ракламная слепота» и впервые было введено в оборот в работе Бенвея и Лайна в 1998 году Они показали, что пользователи не могли найти информацию которую их просили найти, если она была расположена на рекламном банере. Более того, они показали что банеры которые находились в начале страницы, пропускались чаще чем банеры расположенные ниже Однако, другие работы, из совершенно другой области (которая вам безусловно близка) – sponsored search – указывают на то что наиболее эффективны именно банеры расположенные в самом верху. И конечно-же эти банеры самые дорогие В отличие от предыдущих исследований, в нашей работе мы показали что пользователи и не «слепы» к банерам, и не обращают на них внимание только перед или после основного материала
В этой работе мы выдвинули следующую гипотезу: для пользователя читающего определённую статью (контент) на странице, наилучшее место расположение рекламного банера является та точка в которой внимание пользователя ослабевает. Другими словами, в определённый момент пользователь перестаёт читать контент так же внимательно, как вначале, и начинает искать другие источники достойные его внимания. В этот момент наиболее выгоден для представления рекламы. Конечно, эта гипотеза требует доказательства. Но, если она верна – а я покажу вам почему она верна чуть позже – наши результаты могут быть использованы следующим образом: Многие медиа-ресурсы используют рекомендательные системы и другие алгоритмы из области Machine Learning чтобы предсказывать вероятность того что юзер захочет прочитать ту или иную статью Эти алгоритмы могут быть расширены чтобы пересказывать также где внимание юзера начнет ослабевать (конечно если юзер кликнул на эту статью) И тогда наиболее дорогой слот для банера будет расположен именно рядом с этой предполагаемой точкой
Теперь я хотел бы сказать пару слов о том как можно измерить эффективность рекламы. Традиционно, эффективность рекламы измеряется с помощью 2х оценок: воспоминание или воскрешение в памяти (recall) и опознание (recognition). Эту оценки похожи, но всё же они немного разные. Если мы спросим респондента, видел ли он определённую рекламу (только «да» или «нет») – то так мы сможем измерить степень опознания Но чтобы измерить степень воспоминания (воскрешения в памяти), респондент должен точно описать какой-либо аспект этой рекламы Мы использовали степень воспоминания для оценки эффективности рекламы в нашей работе, поскольку она более точная
Все наши эксперименты были проведены с помощью платформы Amazon Mechanical Turk и были построены следующим образом: «Работники» участвующие в эксперименте получали первую страницу с инструкциями, где их просили прочитать предложенную статью до тех пор пока им интересно, а потом ответить на несколько вопросов. После этого они перенаправлялись на страницу с самой статьёй, где был расположен основной контент а также несколько рекламных банеров с правой стороны. «Работники» могли прекратить читать статью в любой момент и перейти к вопроснику. Но перед этим они должны были «остудиться» ь подождать 10 секунд чтобы успеть «подзабыть» последнюю вещь которую они видели на странице с контентом И наконец, они должны были ответить на все вопросы в вопроснике
Вот так выглядела страница в нашем эксперименте Основная часть занята самой статьёй (с ресурса OMG!), с правой стороны вы видите банеры Статья состояла из 4 параграфов и возле каждого параграфа мы подставили картинку, заменяющую рекламный банер А на самом верху была расположена плавающая кнопка «Всё, мне надоело читать!» ь она спускалась вместе со скролингом страницы и позволяла перейти к вопроснику
А сейчас я хотел бы сказать пару слов о картинках которые мы использовали в качестве заменителей рекламы Мы не использовали настоящие рекламные банеры потому что так намного удобнее контролировать предвзятость в воспоминаниях Мы выбрали картинки которые не могут быть опознаны после беглого или поверхностного просмотра Наши картинка состояли из фотографии известного человека, имя которого широко известно, но чьё изображение известно намного меньше, и из цитаты этого человека с его именем в конце. Всё это было сделано для того, чтобы только пользователи которые уделили достаточно внимания картинке и прочитали текст смогли ответить кто изображён на ней
В конце они должны были ответить на вопросы. Вопросник состоял из вопросов о самом тексте и о картинках Разумеется, никто их не предупреждал какие типы вопросов будут задаваться Более того, они не могли вернуться назад (нажав кнопку «back») после того как они перешли на страницу вопросника Цель вопросов о тексте была в том чтобы установить до какого места пользователь дочитал А цель вопросов о картинка была в том чтобы измерить степень воспоминания
Всего было 16 вопросов Один вопрос был о там насколько пользователю была интересна статья Затем, 12 американских вопросов , каждый с 6 возможными ответами (один из которых «не знаю») 8 о тексте (2 на каждый параграф) и 4 о картинках (1 на каждую картинку) 3 дополнительных вопроса были включены чтобы проверить «честность» ответов - мы не хотели получать рандомальные ответы Например, «О чём была статья?» Только пользователи, которые правильно ответили на 2 из этих 3 вопросов были включены в конечный анализ
Как я уже говорил, текст состоял из 4 параграфов Мы задавали 2 вопроса на каждый параграф и ответы пользователей были трансформированы в тренарный вектор иллюстрирующий количество правильных ответов (0,1, или 2) на каждый параграф Например, вектор 0210 говорит о том, что пользователь правильно ответил на оба вопроса о 2ом параграфе и на один вопрос о третьем параграфе, тогда как на все вопросы о первом и о последнем параграфе он ответил неправильно
Всего есть 81 возможных векторов, которые мы соотнесли с 5 профилями – пользователи прочитавшие 0 параграфов, прочитавшие 1 параграф, 2, 3, или 4 Обратите внимание, что мы предполагали что пользователи читают линейно – с верху вниз, не обязательно каждую строчку, но обязательно линейно Это предположение основано на исследованиях в области которая называется «digital reading patterns» В идеале, эти 5 профилей соответствуют векторам 0000, 2000, 2200, 2220 и 2222 На практике, только 21% из них полностью соответствовали Остальные вектора мы отнесли к одному из профилей используя вероятностную модель описанную в статье
Основные результаты нашей работы следующие: Мы доказываем существование корреляции между ответами пользователей о степени их интереса к статье и предсказанным с помощью читательского профиля (это достаточно интуитивно, но всё равно требует доказательства) Мене интуитивен, и более значим второй результат – мы показываем корреляцию между читательским профилем пользователей и степенью воспоминания картинок заменяющих рекламу
Посмотрим более подробно на результаты: Мы подтвердили результат Бенвея и Лейна, показав что 75% пользователей действительно страдают «рекламной слепотой» Остальных пользователей мы разделили на 3 читательских профиля: ….. И измерили среднюю степень воспоминания как функцию места расположения рекламы
Теперь сами результату:На этих диаграммах расположение картинок пронумеровано сверху вниз (от «1» до «4») Мы взяли за базис самый первый профиль (пользователи которые прочитали мало текста) и применили односторонний T-TEST для картинок на том же самом месте в других профилях. В результате мы получили, что 3я картинка в среднем профиле (пользователи которые прочитали 2-3 параграфа) и две последние картинке в правом профиле (где пользователи прочитали весь текст) существенно более узнаваемы чем те же картинки в первом профиле. Это означает, что пользователи демонстрируют существенно лучшую степень воспоминания когда картинка расположена возле того места где они перестают читать Менее существенные результаты вы можете прочитать в статье
Суммируя выше сказанное: Мы сделали первый шаг в сторону автоматического персонализированного размещения рекламы на страницах с контентом Мы показали что для конкретного пользователя читающего конкретную статью, наилучшее место расположения рекламы находится в том месте где интерес пользователя иссякает, что в свою очередь может быть предсказано из степени интереса пользователя к статье Ети результаты открывают новые возможности для повышения эффективности рекламы