SlideShare uma empresa Scribd logo
1 de 11
Baixar para ler offline
Détecter les bots
(Et s’en débarrasser…)

Kevin Lion - http://www.inmediaveritas.com
Qu’est-ce qu’un bot ?
● “Robot” parcourant le Web
● Plusieurs buts :
○ Indexer/Scraper le web (GoogleBot)
○ Attaque distribuée (Botnet)
○ Spammer (Spambot)
○ Autres (Site de rencontre, triche, etc.)
Détecter un scraper
● But du bot : récupérer du contenu de
façon plus ou moins légale
● Méthode du bot : parcourir toutes les
pages du site web
● Repérer un bot :
○ Headers (UA, Accept-Language)
○ Charge les fichiers externes ?
○ Navigateur (JS ? Lang ? Screen ?)
○ Comportement ?
Se débarrasser d’un scraper
●
●
●
●

Pas d’UA ? Ou UA étrange ?
Il ne charge pas l’image “test_bot.png” ?
JS non activé ? Langue non française ?
Il parcourt plus de 10 pages par minutes
? Il charge les pages dans un ordre
étrange ?

-> Vous le bannissez (iptables, coté serveur,
trou noir, etc.)
Détecter un DDoS
● But du bot : faire tomber un site via un
DDoS (Distributed Denial-of-Service)
● Méthode du bot : charger une page
lourde de très nombreuses fois
● Repérer un bot :
○ La même IP charge la même page
plusieurs fois
○ Les IPs sont russes ou chinoises
○ Les connections restent ouvertes
Se débarrasser d’un DDoS
● Luter contre le pic de trafic :
○ Redirection vers un trou noir
○ Mettre en place un CDN
● Luter contre la charge serveur :
○ Vérifier son code (!)
○ Installer et configurer Iptables
○ Limiter les connections SYN et UDP
Détecter un spammer
● But du bot : publier des messages sur
votre site/forum/blog
● Méthode du bot : remplit les formulaires
de publication et les soumets
● Repérer un bot :
○ Les messages contiennent des
urls et des mots clés étranges
○ Il n’a pas de referrer
Se débarrasser d’un spammer
● Mettre en place un CAPTCHA intelligent
○ Qui ne puisse pas être envoyé sur les
decaptcher (deathbycaptcha.com)
○ En français, afin que les boites
offshores ne puisse pas le décoder
● Mettre tous ces liens en nofollow
● Utiliser un service externe qui filtre pour
vous (Akismet, Mollom, Defensio)
Autres solutions diverses
● Comportement du bot :
○ 0 seconde par page
○ Pas de referrer
○ 1 connexion par jour depuis 30 jours..
● Vérifier l’IP (get_hostname)
● Vérifier tous les points par subnet
● Project HoneyPot
Questions ?
kevin.lion@inmediaveritas.com
http://www.inmediaveritas.com
@inmediaveritas

Mais conteúdo relacionado

Destaque

Les CHATBOTS façonnent-ils le web de demain ?
Les CHATBOTS façonnent-ils le web de demain ?Les CHATBOTS façonnent-ils le web de demain ?
Les CHATBOTS façonnent-ils le web de demain ?Antony GLAZIOU
 
Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016
Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016
Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016NUI Day
 
Zoom sur la réalité mixte et HoloLens - NUIDay 2016
Zoom sur la réalité mixte et HoloLens - NUIDay 2016Zoom sur la réalité mixte et HoloLens - NUIDay 2016
Zoom sur la réalité mixte et HoloLens - NUIDay 2016NUI Day
 
Technologies cognitives au service des expériences utilisateurs - NUIDay 2016
Technologies cognitives au service des expériences utilisateurs - NUIDay 2016Technologies cognitives au service des expériences utilisateurs - NUIDay 2016
Technologies cognitives au service des expériences utilisateurs - NUIDay 2016NUI Day
 
Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016
Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016
Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016NUI Day
 
Vision prospective de la robotique : usages et technologies - NUIDay 2016
Vision prospective de la robotique : usages et technologies - NUIDay 2016Vision prospective de la robotique : usages et technologies - NUIDay 2016
Vision prospective de la robotique : usages et technologies - NUIDay 2016NUI Day
 
Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015NUI Day
 
Innovation ouverte et mouvement maker - NUI Day 2015
Innovation ouverte et mouvement maker - NUI Day 2015Innovation ouverte et mouvement maker - NUI Day 2015
Innovation ouverte et mouvement maker - NUI Day 2015NUI Day
 
Expériences intégrées avec l'IoT - NUI Day 2015
Expériences intégrées avec l'IoT - NUI Day 2015Expériences intégrées avec l'IoT - NUI Day 2015
Expériences intégrées avec l'IoT - NUI Day 2015NUI Day
 
chatbot and messenger as a platform
chatbot and messenger as a platformchatbot and messenger as a platform
chatbot and messenger as a platformDaisuke Minamide
 
Introduction to Chatbots
Introduction to ChatbotsIntroduction to Chatbots
Introduction to ChatbotsDaden Limited
 
AI Agent and Chatbot Trends For Enterprises
AI Agent and Chatbot Trends For EnterprisesAI Agent and Chatbot Trends For Enterprises
AI Agent and Chatbot Trends For EnterprisesTeewee Ang
 
Résultats sondages étudiants 2015
Résultats sondages étudiants 2015Résultats sondages étudiants 2015
Résultats sondages étudiants 2015javeldoz
 
Rédaction de tests unitaires avec fakes
Rédaction de tests unitaires avec fakesRédaction de tests unitaires avec fakes
Rédaction de tests unitaires avec fakesMSDEVMTL
 
Cherukatha
CherukathaCherukatha
CherukathaVeena Vs
 

Destaque (20)

Les CHATBOTS façonnent-ils le web de demain ?
Les CHATBOTS façonnent-ils le web de demain ?Les CHATBOTS façonnent-ils le web de demain ?
Les CHATBOTS façonnent-ils le web de demain ?
 
Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016
Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016
Les pratiques de créativité en entreprise, comment et pourquoi - NUIDay 2016
 
Zoom sur la réalité mixte et HoloLens - NUIDay 2016
Zoom sur la réalité mixte et HoloLens - NUIDay 2016Zoom sur la réalité mixte et HoloLens - NUIDay 2016
Zoom sur la réalité mixte et HoloLens - NUIDay 2016
 
UMTS/WCDMA Call Flows for Handovers
UMTS/WCDMA Call Flows for HandoversUMTS/WCDMA Call Flows for Handovers
UMTS/WCDMA Call Flows for Handovers
 
Technologies cognitives au service des expériences utilisateurs - NUIDay 2016
Technologies cognitives au service des expériences utilisateurs - NUIDay 2016Technologies cognitives au service des expériences utilisateurs - NUIDay 2016
Technologies cognitives au service des expériences utilisateurs - NUIDay 2016
 
Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016
Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016
Réalité virtuelle, augmentée et mixte : Panorama et usages - NUIDay 2016
 
Vision prospective de la robotique : usages et technologies - NUIDay 2016
Vision prospective de la robotique : usages et technologies - NUIDay 2016Vision prospective de la robotique : usages et technologies - NUIDay 2016
Vision prospective de la robotique : usages et technologies - NUIDay 2016
 
Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015
 
Innovation ouverte et mouvement maker - NUI Day 2015
Innovation ouverte et mouvement maker - NUI Day 2015Innovation ouverte et mouvement maker - NUI Day 2015
Innovation ouverte et mouvement maker - NUI Day 2015
 
Expériences intégrées avec l'IoT - NUI Day 2015
Expériences intégrées avec l'IoT - NUI Day 2015Expériences intégrées avec l'IoT - NUI Day 2015
Expériences intégrées avec l'IoT - NUI Day 2015
 
chatbot and messenger as a platform
chatbot and messenger as a platformchatbot and messenger as a platform
chatbot and messenger as a platform
 
BILAN SATISFACTION ET12
BILAN SATISFACTION ET12BILAN SATISFACTION ET12
BILAN SATISFACTION ET12
 
Introduction to Chatbots
Introduction to ChatbotsIntroduction to Chatbots
Introduction to Chatbots
 
Chatbot ppt
Chatbot pptChatbot ppt
Chatbot ppt
 
AI Agent and Chatbot Trends For Enterprises
AI Agent and Chatbot Trends For EnterprisesAI Agent and Chatbot Trends For Enterprises
AI Agent and Chatbot Trends For Enterprises
 
Résultats sondages étudiants 2015
Résultats sondages étudiants 2015Résultats sondages étudiants 2015
Résultats sondages étudiants 2015
 
Croquis 1 mte3 013
Croquis 1 mte3 013Croquis 1 mte3 013
Croquis 1 mte3 013
 
Rédaction de tests unitaires avec fakes
Rédaction de tests unitaires avec fakesRédaction de tests unitaires avec fakes
Rédaction de tests unitaires avec fakes
 
Prueba I
Prueba IPrueba I
Prueba I
 
Cherukatha
CherukathaCherukatha
Cherukatha
 

Semelhante a Detecter les bots

Colloque cyber 2010 les botnets
Colloque cyber 2010   les botnetsColloque cyber 2010   les botnets
Colloque cyber 2010 les botnetsmichelcusin
 
Guide d’Hygiène numérique version 2016
Guide d’Hygiène numérique version 2016Guide d’Hygiène numérique version 2016
Guide d’Hygiène numérique version 2016Jérôme aka "Genma" Kun
 
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)GUSS
 
Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?Stéphane Traumat
 
[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...
[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...
[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...Clément OUDOT
 
BLACKHAT-PBN Alan Cladx – CEO Investoweb
BLACKHAT-PBN   Alan Cladx – CEO InvestowebBLACKHAT-PBN   Alan Cladx – CEO Investoweb
BLACKHAT-PBN Alan Cladx – CEO InvestowebTuni' SEO
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Philippe YONNET
 
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...Marc Akoley
 
Analyse de logs SEO : pour qui, pour quoi, comment ?
Analyse de logs SEO : pour qui, pour quoi, comment ?Analyse de logs SEO : pour qui, pour quoi, comment ?
Analyse de logs SEO : pour qui, pour quoi, comment ?Julien Deneuville
 
RMLL 2014 - Site statique avec Templer, Bootstrap et Git
RMLL 2014 - Site statique avec Templer, Bootstrap et GitRMLL 2014 - Site statique avec Templer, Bootstrap et Git
RMLL 2014 - Site statique avec Templer, Bootstrap et GitClément OUDOT
 

Semelhante a Detecter les bots (13)

Colloque cyber 2010 les botnets
Colloque cyber 2010   les botnetsColloque cyber 2010   les botnets
Colloque cyber 2010 les botnets
 
Ubuntu Party - Tor et le TorBrowser
Ubuntu Party - Tor et le TorBrowserUbuntu Party - Tor et le TorBrowser
Ubuntu Party - Tor et le TorBrowser
 
Guide d’Hygiène numérique version 2016
Guide d’Hygiène numérique version 2016Guide d’Hygiène numérique version 2016
Guide d’Hygiène numérique version 2016
 
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
Bots & Cognitive Intelligence (Meetup GUSS & AZUG FR)
 
Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?
 
[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...
[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...
[JDLL 2018] Templer, Git, Bootstrap, PHP : des outils libres pour concevoir l...
 
Vie privee et les outils mozilla
Vie privee et les outils mozillaVie privee et les outils mozilla
Vie privee et les outils mozilla
 
BLACKHAT-PBN Alan Cladx – CEO Investoweb
BLACKHAT-PBN   Alan Cladx – CEO InvestowebBLACKHAT-PBN   Alan Cladx – CEO Investoweb
BLACKHAT-PBN Alan Cladx – CEO Investoweb
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015
 
A tous les niveaux la securite
A tous les niveaux la securiteA tous les niveaux la securite
A tous les niveaux la securite
 
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
Analyse de Logs et SEO : Comment utiliser les logs pour optimiser son site po...
 
Analyse de logs SEO : pour qui, pour quoi, comment ?
Analyse de logs SEO : pour qui, pour quoi, comment ?Analyse de logs SEO : pour qui, pour quoi, comment ?
Analyse de logs SEO : pour qui, pour quoi, comment ?
 
RMLL 2014 - Site statique avec Templer, Bootstrap et Git
RMLL 2014 - Site statique avec Templer, Bootstrap et GitRMLL 2014 - Site statique avec Templer, Bootstrap et Git
RMLL 2014 - Site statique avec Templer, Bootstrap et Git
 

Detecter les bots

  • 1. Détecter les bots (Et s’en débarrasser…) Kevin Lion - http://www.inmediaveritas.com
  • 2. Qu’est-ce qu’un bot ? ● “Robot” parcourant le Web ● Plusieurs buts : ○ Indexer/Scraper le web (GoogleBot) ○ Attaque distribuée (Botnet) ○ Spammer (Spambot) ○ Autres (Site de rencontre, triche, etc.)
  • 3. Détecter un scraper ● But du bot : récupérer du contenu de façon plus ou moins légale ● Méthode du bot : parcourir toutes les pages du site web ● Repérer un bot : ○ Headers (UA, Accept-Language) ○ Charge les fichiers externes ? ○ Navigateur (JS ? Lang ? Screen ?) ○ Comportement ?
  • 4. Se débarrasser d’un scraper ● ● ● ● Pas d’UA ? Ou UA étrange ? Il ne charge pas l’image “test_bot.png” ? JS non activé ? Langue non française ? Il parcourt plus de 10 pages par minutes ? Il charge les pages dans un ordre étrange ? -> Vous le bannissez (iptables, coté serveur, trou noir, etc.)
  • 5. Détecter un DDoS ● But du bot : faire tomber un site via un DDoS (Distributed Denial-of-Service) ● Méthode du bot : charger une page lourde de très nombreuses fois ● Repérer un bot : ○ La même IP charge la même page plusieurs fois ○ Les IPs sont russes ou chinoises ○ Les connections restent ouvertes
  • 6. Se débarrasser d’un DDoS ● Luter contre le pic de trafic : ○ Redirection vers un trou noir ○ Mettre en place un CDN ● Luter contre la charge serveur : ○ Vérifier son code (!) ○ Installer et configurer Iptables ○ Limiter les connections SYN et UDP
  • 7. Détecter un spammer ● But du bot : publier des messages sur votre site/forum/blog ● Méthode du bot : remplit les formulaires de publication et les soumets ● Repérer un bot : ○ Les messages contiennent des urls et des mots clés étranges ○ Il n’a pas de referrer
  • 8. Se débarrasser d’un spammer ● Mettre en place un CAPTCHA intelligent ○ Qui ne puisse pas être envoyé sur les decaptcher (deathbycaptcha.com) ○ En français, afin que les boites offshores ne puisse pas le décoder ● Mettre tous ces liens en nofollow ● Utiliser un service externe qui filtre pour vous (Akismet, Mollom, Defensio)
  • 9. Autres solutions diverses ● Comportement du bot : ○ 0 seconde par page ○ Pas de referrer ○ 1 connexion par jour depuis 30 jours.. ● Vérifier l’IP (get_hostname) ● Vérifier tous les points par subnet ● Project HoneyPot