SlideShare uma empresa Scribd logo
1 de 34
Analyse de logs
Pour qui ? Pour quoi ? Comment ?
Julien Deneuville
• 27 ans
• Monte des sites depuis 2004
• SEO pro depuis 2011
• Twitter : @diije
• Blog : http://blog.1-clic.info/
• Musique
• Vélo
Qui suis-je ?
Hello, World!
L’analyse de logs : les grandes lignes
Est-ce fait pour moi ?
A quels KPI m’intéresser ?
Outils et perspectives
3
Analyse de logs
Sommaire
Analyse de logs
De quoi parle-t-on ?
Client - Serveur
5
Quelques notions de réseau
Client :
• Envoie une requête au serveur
• Attend la réponse
• Affiche la réponse
6
Serveur :
• Reçoit des requêtes
• Effectue les traitements
• Renvoie les résultats
Client - Serveur
Quelques notions de réseau
• Navigateur web
• Client mail
• Spotify
• …
• Robot de moteur de recherche
• Serveur web (Apache, Nginx, IIS, …)
• Serveur mail
• Application spécifique
Client :
• Envoie une requête au serveur
• Attend la réponse
• Affiche la réponse
• Navigateur web
• Client mail
• Spotify
• …
• Robot de moteur de recherche
7
Serveur :
• Reçoit des requêtes
• Effectue les traitements
• Renvoie les résultats
• Serveur web (Apache, Nginx, IIS, …)
• Serveur mail
• Application spécifique
Client - Serveur
Quelques notions de réseau
Les logs serveur
Les serveurs web enregistrent toutes les demandes qu’ils reçoivent dans des
fichiers texte : ce sont les logs serveur.
Ils permettent notamment :
• D’obtenir des statistiques de fréquentation d’un site
• De débuguer un composant problématique
• De détecter les attaques de hackers
• … 8
Qu’est-ce que c’est quoi donc ?
Rappels :
• Googlebot ne déclenche pas les tags des
outils de webanalytics
• Les données de Google Search Console
sont-elles fiables ?
Avec les logs serveur on peut :
• Voir les pages que Googlebot visite
• Compléter Google Analytics et détecter
les visites en provenance de Google
• Trouver de nombreuses pistes
d’amélioration
9
Et en SEO ?
Pourquoi vouloir analyser les logs ?
Pour qui ?
Pour les sites à gros volume
• Quelques centaines de milliers de pages
Audit : une mine d’informations pour les optimisations
• Crawl utile/inutile
• Pages actives/inactives
• Trous de crawl
• …
Monitoring : un outil d’alerte indispensable
10
Et mon site dans tout ça ?
Pour tous les autres aussi :
il n’y a pas que les « gros » qui ont des problèmes !
Kit de survie
Logs 101
Accéder à vos logs
• Exemple pour un mutualisé OVH :
http://logs.ovh.net/mon-domaine.tld
• Récupérer les logs d’accès
Un terminal
• Intégré à Linux et Mac OS
• Installez Cygwin sous Windows
12
Starter Kit
De quoi ai-je besoin ?
La ligne de commande
Compter les hits de Googlebot
• ~$ grep "Googlebot" access.log | wc –l
Compter les hits de Googlebot par URL
• ~$ grep "Googlebot" access.log | cut –d " " –f7 | sort | uniq –c
Envoyer les résultats dans un fichier
• ~$ grep "Googlebot" access.log | sort | uniq –c > resultats.txt
13
Quelques exemples simples
Vous pouvez déjà faire 100% des analyses de logs dont vous
avez besoin !
Allez plus loin
Un article de l’excellent Paul Courtois :
http://blog.pole-conseils.com/maitrisez-lanalyse-de-logs-les-5-commandes-
indispensables-pour-devenir-autonome/
La rolls de l’analyse de logs en console : awk chez Jean-Benoît Moingt
http://www.watussi.fr/lanalyse-des-logs-serveur-une-mine-dinformation-pour-
le-seo
14
Liens utiles
Quels KPI ?
Un peu de méthode
Le crawl : le compagnon
indispensable de l’analyse de logs
Des outils :
• Logiciels : Xenu, Screaming Frog
• En SaaS : Botify, Oncrawl …
• Pour les geeks : Scrapy, Mnogosearch,
Nutch ...
16
Step 1 : crawler
Tâtez le terrain
Step 1 : crawler
Quels indicateurs ?
• Nombre de pages
• Codes réponse
• Profondeur de l’arborescence
• Titres dupliqués
• Maillage interne
• Temps de chargement
• …
En savoir plus sur le sujet ?
• Mode d’emploi de Xenu chez Daniel Roch : http://www.seomix.fr/xenu/
17
Tâtez le terrain
Crawlers
Crawlez souvent
• En recette, en prod
• Après chaque mise en production
• Périodiquement pour vous assurer que tout va bien
Ne crawlez pas toujours tout votre site
• Ca peut être long
• Rarement possible d’analyser de nombreux rapports
• Selon le site, les 4 ou 5 premiers niveaux sont suffisants
Conservez vos données
• Pour avoir un historique
• Pour comparer les crawls entre eux 18
Tips & tricks
Step 2 : analyse de logs
19
Vers l’infini et au-delà !
Googlebot hait les erreurs.
Erreurs 5xx
• 500 : souvent le signe d’un problème de
code à corrigez-le
• 503 : votre serveur tient-il la charge ?
Erreurs 4xx
• Liens internes erronés (trouvez-les dans
le crawl)
• Liens externes erronés (trouvez-les avec
Majestic/Ahrefs)
• Dans les deux cas : correction +
redirection 301 20
Codes réponse
Envoyez le bon signal
Combien de temps maintenir une
redirection 301 ?
Attention : les 301 peuvent gonfler
artificiellement le volume de crawl !
21
Le cas des 301
Permanent jusqu’à quand ?
A maintenir de manière permanente …
Comparez les indicateurs :
• Nombre d’URLs dans les logs
• Dans le crawl
• Dans Google Search Console
• Dans Analytics
• Sur « site:monsite.com »
Trop de pages dans les logs ?
• Des paramètres qui entraînent la duplication de contenu
?
• ...
Pas assez ?
• Vos liens internes sont-ils seo-friendly ?
• … 22
Volume de pages
Google crawle-t-il un nombre raisonnable de pages ?
Comparez les pages les plus crawlées
et celles qui vous importent le plus :
• Googlebot visite-t-il assez souvent vos
pages stratégiques ?
• Perd-t-il son temps sur des pages inutiles
?
Que faire en cas de problème ?
• Revoir le maillage interne pour booster
les bonnes pages
• Savoir supprimer des pages inutiles
23
Pages actives
S’intéresser aux bonnes pages
Post-audit, mettez en place une
analyse de vos logs en continu :
• Recette facilité lors des mises en
production
• Alerting en cas de problème technique
• Suivi du délai d’indexation des
nouvelles pages
• Changements de comportement de
Googlebot
• …
24
Step 3 : monitoring
Gardez le contrôle
Quelques outils
Serious Business
Avantages :
• Gratuit
• Simple à mettre en place
• A héberger soi-même
Inconvénients
• A héberger soi-même
• Simpliste
• Pas mis à jour
Watussi
Un bon début
Idéal pour quelques dizaines de pages !
http://box.watussi.fr/
Avantages :
• Sûrement l’interface la plus aboutie
• Associé à un crawler
• Service client à l’écoute
• En SaaS
Inconvénients
• Cher
• Parfois peu intuitif
Botify
Artillerie lourde
Si vous avez le budget, foncez !
https://www.botify.com/
Avantages :
• En beta gratuite
• Des fonctionnalités innovantes
• En SaaS
Inconvénients
• Peu de documentation
• Support reposant sur une seule personne
Spiderlog
Le petit nouveau
L’outsider que vous devriez tester !
https://spiderlog.serphacker.com/
Avantages :
• Parfait pour le monitoring
• Analyse crawl vs logs (bientôt)
• Service client à l’écoute
• En SaaS
Inconvénients
• Pas aussi complet qu’un Botify
http://kelo.gs/
Kelogs
#ROI
Le meilleur rapport Qualité/Prix du marché !
Avantages
• Sur-mesure
• Vous gardez vos données
• Une possibilité d’analyse inégalable
Inconvénients
• Coût de développement
• Coût de maintenance
• Nécessite une bonne connaissance du
sujet
30
Homemade
On n’est jamais aussi bien servi que par soi-même
Forcément le plus adapté à vos besoins !
Next steps
1. Crawlez votre site
2. Récupérez les logs
3. Faites une première analyse
4. Mettez en place un outil de
monitoring
32
Au boulot !
Homework
Ajoutez des infos dans vos logs
• Apache : voir ici
• Temps de chargement
• Host
Croisez vos données
• Analytics
• Ventes
• Inventaire
• …
33
Allez plus loin
Devenez un roi de la Data
www.1-clic.info
Merci de votre attention !
Bon appétit J
Mail
julien@1-clic.info
Blog
http://blog.1-clic.info/
Twitter
@diije

Mais conteúdo relacionado

Mais procurados

Google shopping campaigns presentation
Google shopping campaigns presentationGoogle shopping campaigns presentation
Google shopping campaigns presentation
Bogdan Ch
 
How To Plan And Build A Successful Content Marketing Strategy
How To Plan And Build A Successful Content Marketing StrategyHow To Plan And Build A Successful Content Marketing Strategy
How To Plan And Build A Successful Content Marketing Strategy
Michael Brenner
 

Mais procurados (20)

#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
 
Léa PICOSSON - SEO Garden Party Novembre 2022
Léa PICOSSON - SEO Garden Party Novembre 2022Léa PICOSSON - SEO Garden Party Novembre 2022
Léa PICOSSON - SEO Garden Party Novembre 2022
 
Cocon sémantique et Netlinking
Cocon sémantique et NetlinkingCocon sémantique et Netlinking
Cocon sémantique et Netlinking
 
Behemoth SEO: Search Strategy for Huge Websites
Behemoth SEO: Search Strategy for Huge WebsitesBehemoth SEO: Search Strategy for Huge Websites
Behemoth SEO: Search Strategy for Huge Websites
 
How to Scale and Grow your Enterprise Technical SEO Strategy
How to Scale and Grow your Enterprise Technical SEO StrategyHow to Scale and Grow your Enterprise Technical SEO Strategy
How to Scale and Grow your Enterprise Technical SEO Strategy
 
Building the content machine
Building the content machine Building the content machine
Building the content machine
 
Google shopping campaigns presentation
Google shopping campaigns presentationGoogle shopping campaigns presentation
Google shopping campaigns presentation
 
SEO - a brief introduction
SEO - a brief introductionSEO - a brief introduction
SEO - a brief introduction
 
Seo Marketing Plan Ppt
Seo Marketing Plan PptSeo Marketing Plan Ppt
Seo Marketing Plan Ppt
 
How To Plan And Build A Successful Content Marketing Strategy
How To Plan And Build A Successful Content Marketing StrategyHow To Plan And Build A Successful Content Marketing Strategy
How To Plan And Build A Successful Content Marketing Strategy
 
SEO Audit Workshop: Framework, Techniques And Tools
SEO Audit Workshop: Framework, Techniques And ToolsSEO Audit Workshop: Framework, Techniques And Tools
SEO Audit Workshop: Framework, Techniques And Tools
 
BrightonSEO October 2022 - Dan Taylor SEO - Indexing Ecommerce Websites
BrightonSEO October 2022 - Dan Taylor SEO - Indexing Ecommerce WebsitesBrightonSEO October 2022 - Dan Taylor SEO - Indexing Ecommerce Websites
BrightonSEO October 2022 - Dan Taylor SEO - Indexing Ecommerce Websites
 
SEO: Crawl Budget Optimierung & Onsite SEO
SEO: Crawl Budget Optimierung & Onsite SEOSEO: Crawl Budget Optimierung & Onsite SEO
SEO: Crawl Budget Optimierung & Onsite SEO
 
Analyse et comparaison des principaux outils SEO disponible sur le marché
Analyse et comparaison des principaux outils SEO disponible sur le marchéAnalyse et comparaison des principaux outils SEO disponible sur le marché
Analyse et comparaison des principaux outils SEO disponible sur le marché
 
IA et Netlinking : Quels usages concrets pour réussir vos campagnes ?
IA et Netlinking : Quels usages concrets pour réussir vos campagnes ?IA et Netlinking : Quels usages concrets pour réussir vos campagnes ?
IA et Netlinking : Quels usages concrets pour réussir vos campagnes ?
 
SEO strategy by Badar
SEO strategy by BadarSEO strategy by Badar
SEO strategy by Badar
 
Formation Google Analytics 4 -GA4
Formation Google Analytics 4 -GA4Formation Google Analytics 4 -GA4
Formation Google Analytics 4 -GA4
 
GDO - Google Discover Optimization - (Congreso Web 2019)
GDO - Google Discover Optimization - (Congreso Web 2019)GDO - Google Discover Optimization - (Congreso Web 2019)
GDO - Google Discover Optimization - (Congreso Web 2019)
 
Introduction to Search Engine Optimization
Introduction to Search Engine OptimizationIntroduction to Search Engine Optimization
Introduction to Search Engine Optimization
 
Brighton SEO: SEO + PPC Working Together
Brighton SEO: SEO + PPC Working TogetherBrighton SEO: SEO + PPC Working Together
Brighton SEO: SEO + PPC Working Together
 

Destaque

Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)
ifm electronic gmbh
 
Copte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_frCopte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_fr
Hermione220589
 
Système tégumentaire
Système tégumentaireSystème tégumentaire
Système tégumentaire
IsaDio0173
 
Nouvelle vs Prep
Nouvelle vs PrepNouvelle vs Prep
Nouvelle vs Prep
IsaDio0173
 
Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)
ifm electronic gmbh
 
Présentation green and connected territories lbmg worklabs
Présentation green and connected territories   lbmg worklabsPrésentation green and connected territories   lbmg worklabs
Présentation green and connected territories lbmg worklabs
LBMG Worklabs
 

Destaque (20)

Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016
 
Mesurer les performances du SEO grâce à des tableaux de bord
Mesurer les performances du SEO grâce à des tableaux de bordMesurer les performances du SEO grâce à des tableaux de bord
Mesurer les performances du SEO grâce à des tableaux de bord
 
Ecommerce Live : suivre efficacement ses performances SEO
Ecommerce Live : suivre efficacement ses performances SEOEcommerce Live : suivre efficacement ses performances SEO
Ecommerce Live : suivre efficacement ses performances SEO
 
Microprogramme UX HEC Montréal
Microprogramme UX HEC MontréalMicroprogramme UX HEC Montréal
Microprogramme UX HEC Montréal
 
Des RP vers l'Influencer Engagement
Des RP vers l'Influencer EngagementDes RP vers l'Influencer Engagement
Des RP vers l'Influencer Engagement
 
Shake15 augure
Shake15 augureShake15 augure
Shake15 augure
 
Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)
 
Copte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_frCopte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_fr
 
Système tégumentaire
Système tégumentaireSystème tégumentaire
Système tégumentaire
 
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
 
Verso le PR di domani : il ruolo dell’Influencer Marketing
Verso le PR di domani : il ruolo dell’Influencer MarketingVerso le PR di domani : il ruolo dell’Influencer Marketing
Verso le PR di domani : il ruolo dell’Influencer Marketing
 
Mml sublissime
Mml sublissimeMml sublissime
Mml sublissime
 
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
 
ValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
ValueClick mediaplex 2013 centraliser achat media, adserving, adtrackingValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
ValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
 
Teste
TesteTeste
Teste
 
Nouvelle vs Prep
Nouvelle vs PrepNouvelle vs Prep
Nouvelle vs Prep
 
Physical design vlsi circuits jan 2013
Physical design vlsi circuits jan 2013Physical design vlsi circuits jan 2013
Physical design vlsi circuits jan 2013
 
Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)
 
Présentation green and connected territories lbmg worklabs
Présentation green and connected territories   lbmg worklabsPrésentation green and connected territories   lbmg worklabs
Présentation green and connected territories lbmg worklabs
 
Magazine surface - De l'énergie verte a revendre - Alain Fortier
Magazine surface  - De l'énergie verte a revendre - Alain FortierMagazine surface  - De l'énergie verte a revendre - Alain Fortier
Magazine surface - De l'énergie verte a revendre - Alain Fortier
 

Semelhante a Analyse de logs SEO : pour qui, pour quoi, comment ?

Deck seo campus 2011 utiliser les logs serveurs
Deck seo campus 2011   utiliser les logs serveursDeck seo campus 2011   utiliser les logs serveurs
Deck seo campus 2011 utiliser les logs serveurs
Philippe YONNET
 

Semelhante a Analyse de logs SEO : pour qui, pour quoi, comment ? (20)

La vitesse d’un site web : un levier de croissance peu exploité
La vitesse d’un site web : un levier de croissance peu exploitéLa vitesse d’un site web : un levier de croissance peu exploité
La vitesse d’un site web : un levier de croissance peu exploité
 
Conference drupal 8 au Forum PHP 2013 à Paris
Conference drupal 8 au Forum PHP 2013 à ParisConference drupal 8 au Forum PHP 2013 à Paris
Conference drupal 8 au Forum PHP 2013 à Paris
 
Techniques d'accélération des pages web
Techniques d'accélération des pages webTechniques d'accélération des pages web
Techniques d'accélération des pages web
 
Comment choisir son cms
Comment choisir son cmsComment choisir son cms
Comment choisir son cms
 
Deck seo campus 2011 utiliser les logs serveurs
Deck seo campus 2011   utiliser les logs serveursDeck seo campus 2011   utiliser les logs serveurs
Deck seo campus 2011 utiliser les logs serveurs
 
CMS et Wordpress
CMS et WordpressCMS et Wordpress
CMS et Wordpress
 
Paris Web 2015 - Atelier désendettement Javascript legacy
Paris Web 2015 - Atelier désendettement Javascript legacyParis Web 2015 - Atelier désendettement Javascript legacy
Paris Web 2015 - Atelier désendettement Javascript legacy
 
Vitrine virtuelle
Vitrine virtuelleVitrine virtuelle
Vitrine virtuelle
 
WordPress sous stéroïdes : votre site Web vers les sommets !
WordPress sous stéroïdes : votre site Web vers les sommets !WordPress sous stéroïdes : votre site Web vers les sommets !
WordPress sous stéroïdes : votre site Web vers les sommets !
 
Référencement avec Joomla - SEO Camp
Référencement avec Joomla - SEO CampRéférencement avec Joomla - SEO Camp
Référencement avec Joomla - SEO Camp
 
Le suivi post référencement (SEO)
Le suivi post référencement (SEO)Le suivi post référencement (SEO)
Le suivi post référencement (SEO)
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015
 
Optimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressOptimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPress
 
Techniques d’accélération des pages Web
Techniques d’accélération des pages WebTechniques d’accélération des pages Web
Techniques d’accélération des pages Web
 
The DevOps Wonder @ PHPTour Lyon 2014
The DevOps Wonder @ PHPTour Lyon 2014The DevOps Wonder @ PHPTour Lyon 2014
The DevOps Wonder @ PHPTour Lyon 2014
 
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
 
Utiliser un crawler pour le seo
Utiliser un crawler pour le seoUtiliser un crawler pour le seo
Utiliser un crawler pour le seo
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013
 
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
 
Comment déveloper son entreprise grâce au web
Comment déveloper son entreprise grâce au webComment déveloper son entreprise grâce au web
Comment déveloper son entreprise grâce au web
 

Mais de Julien Deneuville

Mais de Julien Deneuville (7)

Monitoring SEO : dormez tranquille !
Monitoring SEO : dormez tranquille !Monitoring SEO : dormez tranquille !
Monitoring SEO : dormez tranquille !
 
En route vers le Data+SEO [SEO Camp'US 2019]
En route vers le Data+SEO [SEO Camp'US 2019]En route vers le Data+SEO [SEO Camp'US 2019]
En route vers le Data+SEO [SEO Camp'US 2019]
 
Meetup AFUP Reims: Le crawl pour les développeurs
Meetup AFUP Reims: Le crawl pour les développeursMeetup AFUP Reims: Le crawl pour les développeurs
Meetup AFUP Reims: Le crawl pour les développeurs
 
De la Data pour le SEO - QueDuWeb 2016
De la Data pour le SEO - QueDuWeb 2016De la Data pour le SEO - QueDuWeb 2016
De la Data pour le SEO - QueDuWeb 2016
 
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
 
Art Your Mind
Art Your MindArt Your Mind
Art Your Mind
 
Coca Cola : Stratégie SMM
Coca Cola : Stratégie SMMCoca Cola : Stratégie SMM
Coca Cola : Stratégie SMM
 

Analyse de logs SEO : pour qui, pour quoi, comment ?

  • 1. Analyse de logs Pour qui ? Pour quoi ? Comment ?
  • 2. Julien Deneuville • 27 ans • Monte des sites depuis 2004 • SEO pro depuis 2011 • Twitter : @diije • Blog : http://blog.1-clic.info/ • Musique • Vélo Qui suis-je ? Hello, World!
  • 3. L’analyse de logs : les grandes lignes Est-ce fait pour moi ? A quels KPI m’intéresser ? Outils et perspectives 3 Analyse de logs Sommaire
  • 4. Analyse de logs De quoi parle-t-on ?
  • 5. Client - Serveur 5 Quelques notions de réseau
  • 6. Client : • Envoie une requête au serveur • Attend la réponse • Affiche la réponse 6 Serveur : • Reçoit des requêtes • Effectue les traitements • Renvoie les résultats Client - Serveur Quelques notions de réseau • Navigateur web • Client mail • Spotify • … • Robot de moteur de recherche • Serveur web (Apache, Nginx, IIS, …) • Serveur mail • Application spécifique
  • 7. Client : • Envoie une requête au serveur • Attend la réponse • Affiche la réponse • Navigateur web • Client mail • Spotify • … • Robot de moteur de recherche 7 Serveur : • Reçoit des requêtes • Effectue les traitements • Renvoie les résultats • Serveur web (Apache, Nginx, IIS, …) • Serveur mail • Application spécifique Client - Serveur Quelques notions de réseau
  • 8. Les logs serveur Les serveurs web enregistrent toutes les demandes qu’ils reçoivent dans des fichiers texte : ce sont les logs serveur. Ils permettent notamment : • D’obtenir des statistiques de fréquentation d’un site • De débuguer un composant problématique • De détecter les attaques de hackers • … 8 Qu’est-ce que c’est quoi donc ?
  • 9. Rappels : • Googlebot ne déclenche pas les tags des outils de webanalytics • Les données de Google Search Console sont-elles fiables ? Avec les logs serveur on peut : • Voir les pages que Googlebot visite • Compléter Google Analytics et détecter les visites en provenance de Google • Trouver de nombreuses pistes d’amélioration 9 Et en SEO ? Pourquoi vouloir analyser les logs ?
  • 10. Pour qui ? Pour les sites à gros volume • Quelques centaines de milliers de pages Audit : une mine d’informations pour les optimisations • Crawl utile/inutile • Pages actives/inactives • Trous de crawl • … Monitoring : un outil d’alerte indispensable 10 Et mon site dans tout ça ? Pour tous les autres aussi : il n’y a pas que les « gros » qui ont des problèmes !
  • 12. Accéder à vos logs • Exemple pour un mutualisé OVH : http://logs.ovh.net/mon-domaine.tld • Récupérer les logs d’accès Un terminal • Intégré à Linux et Mac OS • Installez Cygwin sous Windows 12 Starter Kit De quoi ai-je besoin ?
  • 13. La ligne de commande Compter les hits de Googlebot • ~$ grep "Googlebot" access.log | wc –l Compter les hits de Googlebot par URL • ~$ grep "Googlebot" access.log | cut –d " " –f7 | sort | uniq –c Envoyer les résultats dans un fichier • ~$ grep "Googlebot" access.log | sort | uniq –c > resultats.txt 13 Quelques exemples simples Vous pouvez déjà faire 100% des analyses de logs dont vous avez besoin !
  • 14. Allez plus loin Un article de l’excellent Paul Courtois : http://blog.pole-conseils.com/maitrisez-lanalyse-de-logs-les-5-commandes- indispensables-pour-devenir-autonome/ La rolls de l’analyse de logs en console : awk chez Jean-Benoît Moingt http://www.watussi.fr/lanalyse-des-logs-serveur-une-mine-dinformation-pour- le-seo 14 Liens utiles
  • 15. Quels KPI ? Un peu de méthode
  • 16. Le crawl : le compagnon indispensable de l’analyse de logs Des outils : • Logiciels : Xenu, Screaming Frog • En SaaS : Botify, Oncrawl … • Pour les geeks : Scrapy, Mnogosearch, Nutch ... 16 Step 1 : crawler Tâtez le terrain
  • 17. Step 1 : crawler Quels indicateurs ? • Nombre de pages • Codes réponse • Profondeur de l’arborescence • Titres dupliqués • Maillage interne • Temps de chargement • … En savoir plus sur le sujet ? • Mode d’emploi de Xenu chez Daniel Roch : http://www.seomix.fr/xenu/ 17 Tâtez le terrain
  • 18. Crawlers Crawlez souvent • En recette, en prod • Après chaque mise en production • Périodiquement pour vous assurer que tout va bien Ne crawlez pas toujours tout votre site • Ca peut être long • Rarement possible d’analyser de nombreux rapports • Selon le site, les 4 ou 5 premiers niveaux sont suffisants Conservez vos données • Pour avoir un historique • Pour comparer les crawls entre eux 18 Tips & tricks
  • 19. Step 2 : analyse de logs 19 Vers l’infini et au-delà !
  • 20. Googlebot hait les erreurs. Erreurs 5xx • 500 : souvent le signe d’un problème de code à corrigez-le • 503 : votre serveur tient-il la charge ? Erreurs 4xx • Liens internes erronés (trouvez-les dans le crawl) • Liens externes erronés (trouvez-les avec Majestic/Ahrefs) • Dans les deux cas : correction + redirection 301 20 Codes réponse Envoyez le bon signal
  • 21. Combien de temps maintenir une redirection 301 ? Attention : les 301 peuvent gonfler artificiellement le volume de crawl ! 21 Le cas des 301 Permanent jusqu’à quand ? A maintenir de manière permanente …
  • 22. Comparez les indicateurs : • Nombre d’URLs dans les logs • Dans le crawl • Dans Google Search Console • Dans Analytics • Sur « site:monsite.com » Trop de pages dans les logs ? • Des paramètres qui entraînent la duplication de contenu ? • ... Pas assez ? • Vos liens internes sont-ils seo-friendly ? • … 22 Volume de pages Google crawle-t-il un nombre raisonnable de pages ?
  • 23. Comparez les pages les plus crawlées et celles qui vous importent le plus : • Googlebot visite-t-il assez souvent vos pages stratégiques ? • Perd-t-il son temps sur des pages inutiles ? Que faire en cas de problème ? • Revoir le maillage interne pour booster les bonnes pages • Savoir supprimer des pages inutiles 23 Pages actives S’intéresser aux bonnes pages
  • 24. Post-audit, mettez en place une analyse de vos logs en continu : • Recette facilité lors des mises en production • Alerting en cas de problème technique • Suivi du délai d’indexation des nouvelles pages • Changements de comportement de Googlebot • … 24 Step 3 : monitoring Gardez le contrôle
  • 26. Avantages : • Gratuit • Simple à mettre en place • A héberger soi-même Inconvénients • A héberger soi-même • Simpliste • Pas mis à jour Watussi Un bon début Idéal pour quelques dizaines de pages ! http://box.watussi.fr/
  • 27. Avantages : • Sûrement l’interface la plus aboutie • Associé à un crawler • Service client à l’écoute • En SaaS Inconvénients • Cher • Parfois peu intuitif Botify Artillerie lourde Si vous avez le budget, foncez ! https://www.botify.com/
  • 28. Avantages : • En beta gratuite • Des fonctionnalités innovantes • En SaaS Inconvénients • Peu de documentation • Support reposant sur une seule personne Spiderlog Le petit nouveau L’outsider que vous devriez tester ! https://spiderlog.serphacker.com/
  • 29. Avantages : • Parfait pour le monitoring • Analyse crawl vs logs (bientôt) • Service client à l’écoute • En SaaS Inconvénients • Pas aussi complet qu’un Botify http://kelo.gs/ Kelogs #ROI Le meilleur rapport Qualité/Prix du marché !
  • 30. Avantages • Sur-mesure • Vous gardez vos données • Une possibilité d’analyse inégalable Inconvénients • Coût de développement • Coût de maintenance • Nécessite une bonne connaissance du sujet 30 Homemade On n’est jamais aussi bien servi que par soi-même Forcément le plus adapté à vos besoins !
  • 32. 1. Crawlez votre site 2. Récupérez les logs 3. Faites une première analyse 4. Mettez en place un outil de monitoring 32 Au boulot ! Homework
  • 33. Ajoutez des infos dans vos logs • Apache : voir ici • Temps de chargement • Host Croisez vos données • Analytics • Ventes • Inventaire • … 33 Allez plus loin Devenez un roi de la Data
  • 34. www.1-clic.info Merci de votre attention ! Bon appétit J Mail julien@1-clic.info Blog http://blog.1-clic.info/ Twitter @diije