5. @razbithume
Scraper point and click
• Import.io
• Kimonolabs
• Web scraper.io
Gratuits
Facile d’utilisation
personnalisable
6. @razbithume
Excel et google spreadsheet
• Excel + seo tools for excel
• Google Spreadsheet
Outils à disposition
Peuvent devenir des scraper
dépannage
7. @razbithume
Excel VS Google spreadsheet
• Installation de l’add on SEO
Tools for Excel
• IP personnelle
• Pas de limite (sauf captchas)
• La fonction
– xpathonurl
• Pas d’installation
supplémentaire
• IP de google (parfois
bloquée car UA ne
correspond pas à GG bot :
GoogleDocs; apps-
spreadsheets;
+http://docs.google.com)
• Pas de limite (sauf captchas)
• La fonction
– importxml
10. @razbithume
Le résultat
• /html/body/div[3]/div[3]/div[4]/h2[1]/span[1]
• Je prends la 1ere balise span, dans le 1er h2, dans
la 4e div, dans la 3e div, dans la 4e div, dans le
body, dans le html
• Chemin absolu… un seul élément
• Apprendre quelques notions de xpath pour des
requetes plus propres
11. @razbithume
Notions de xpath
• // = tous les
=>//h2 = tous les H2
• //div/h2 => tous les h2 dans une div
• //div[@class=‘top’]/h2
– Tous les h2 dans une div qui a une class = top
12. @razbithume
Excel et le scrap
• SEO tools
– Scrapers preprogrammés
– Fonctions déjà présentes (title, meta description,
pagerank)
– Xpathonurl pour récupérer ce qu’on souhaite
– Exemple: scraper de Cedric Guerin
14. @razbithume
Infos complémentaires
• SEO Tools for excel : http://seotoolsforexcel.com/download/
• Cedric Guerin et sa série d’articles : http://cedricguerin.fr/scraper-
avec-excel/
• Pour les footprints : http://www.ninjalinker.com/footprint/
• Pour pousser dans l’utilisation de google spreasheet :
http://www.yapasdequoi.com/astuces/3044-creer-des-backlinks-
via-dans-google-docs.html
• Pour plein d’infos et des tools sympas : http://www.scripts-seo.com
• Blog SEO et analytics : http://www.canyouseome.com