Большая посещаемость приходит на сайты, не имеющие проблем с индексацией. Как ускорить индексацию простыми методами, проверенными практически сотнями специалистов?
Проблемы с индексацией сайта?
Оптимизируйте краулинговый бюджет!
1
Проблемы с
индексацией
сайта?
Терминология
* Процесс обнаружения и
сбора новых и
обновленных страниц для
добавления в индекс ПС.
* Самый начальный этап;
* Данные собираются для
построения индекса и НЕ
отображаются в
результатах поиска.
* Просканированная
роботом страница не
всегда оказывается в
индексе
* Процесс сбора,
добавления и
обновления страниц в
индексе ПС;
* Второй этап;
* Зависит от
краулингового бюджета.
2
Краулинг
(Crawling)
Индексаци
я (Indexing)
Что такое краулинговый
бюджет (КБ)?
Краулинговый бюджет — это метрика,
которая определяет квоту страниц для
домена, подлежащих индексации в рамках
одного визита краулера ПС.
Используется до инициализации процесса
сканирования сайта.
От значения КБ зависит количество страниц,
которое краулер обработает в рамках посещения
сайта.
Значение КБ для каждого сайта рассчитывается
индивидуально.
4
Как рассчитывается
краулинговый бюджет?
Числовое значение КБ зависит от таких факторов:
Авторитетность сайта.
Способность сервера обрабатывать запросы, без
снижения скорости загрузки.
2 вектор работы:
1. Увеличение числового значения КБ
2. Увеличение количества проиндексированных
страниц при текущем КБ
5
Увеличение числового
значения КБ
1. Оптимизация скорости загрузки сайта
при обращении краулера.
Речь про скорость для краулеров, а не для пользователей
Для анализа работаем в Screaming Frog SEO Log File Analyser,
Jetoctopus.com, Botify.com, Power BI,
2. Повышение авторитетности сайта
путем внешней оптимизации сайта.
6
Анализ логов сайта
7
Зачем анализировать?
1. Определить просканированные URL
2. Узнать частоту сканирования
3. Узнать неработающие ссылки и ошибки
4. Проверить наличие редиректов
5. Найти неотсканированные урлы и
страницы-сироты
Увеличение количества проиндексированных
страниц при текущем КБ
1. Настройка 304 кода ответа сервера
304 Not Modified — сервер возвращает такой код, если клиент запросил
документ методом GET, использовал заголовок If-Modified-Since или If-
None-Match и документ не изменился с указанного момента. При этом
сообщение сервера не должно содержать тела.
11
SPA (single page application)
1. Проблемы индексации сайта из-за неправильного
использования реактивных фреймворков (Angular,
ReactVue и другие) приравнивают к проблемам SPA
проектов.
2. SPA ≠ Angular или React и т.д.
Angular, React,Vue - это инструменты использующие
парадигму реактивного программирования. Крайне
удобную для построения сложных интерфейсов, но
слабо адаптированную для создания традиционных
сайтов.
SPA это способ доставки контента в рамках сессии
пользователя, но не способ его формирования на
странице.
Итог: при помощиAngular, React можно делать SPA. Как и
при помощи микроскопа забивать гвозди 15
SPA (single page application)
3. Проблема индексации SPA сайтов, в 2006-2012 годах,
были в плоскости того, что javascript того времени не имел
возможностей управлять адресной строкой браузера.
Можно было изменять только хеш страницы.
http://example.com/page#page10
где:
http://example.com/page - URL
#page10 - хэш.
код мог изменить hash но не мог изменить URL
4. В HTML5 добавили стандарт History APi полностью
решающего ВСЕ проблемы SPA приложений.
Итого! НИКАКИХ ПРОБЛЕМ В ИНДЕКСАЦИИ SPA
приложений НЕТ. И никакие SSR ему для этого не нужны.
Для решения проблем фреймворков был реализован SSR -
как пример фееричного костыля 16
SPA (single page application)
CSR (Client-Side Rendering, рендеринг на клиенте) —
рендеринг приложения на стороне клиента (в браузере),
обычно с помощью DOM.
SSR (Server-Side Rendering, серверный рендеринг) —
рендеринг на сервере клиентской части или
универсального приложения в HTML.
17
Спасибо за внимание!
Вопросы?
18
writer@vlada-rykova.com
facebook.com/VladaRykova
t.me/vlada_rykova