Slides présentées lors du petit déjeuner du 28 janvier 2016 à Lille
L'algorithme de Google a beaucoup changé en 2015 : les "quality updates" se sont succédées, un nouveau type de Panda est apparu, et la compatibilité mobile est devenu un critère de classement sur mobile... De plus, Google commence à introduire les produits d'un outil reposant sur l'intelligence artificielle dans son algorithme. Qu'est-ce que cela signifie pour l'avenir ? Faut-il changer ses méthodes de référencement ?
Intervenant : Philippe Yonnet, Directeur Général - Search-Foresight
Migration les pièges a éviter - petit déjeuner 15-11-2018 Nantes
En 2016 : Faire du SEO face à une intelligence artificielle
1. UNE RÉVOLUTION SILENCIEUSE DANS LES ALGORITHMES DE GOOGLE
LE SEO FACE A UNE INTELLIGENCE
ARTIFICIELLE
- 1 -
PETIT DEJEUNER SEO
SEARCH FORESIGHT
11EME ÉDITION
LILLE le 28 janvier 2016
9h-12h
2. / Et l’IA est maintenant au cœur de son algorithme
2
Google se met SERIEUSEMENT à l’IA
3. / Les programmes utilisant de l’IA ne sont pas
forcément… intelligents au sens commun
- 3 -
« Intelligence Artificielle » est un faux ami
Définition de l’IA :
Au sens large, le domaine de
l’intelligence artificielle regroupe toutes
les techniques essayant de simuler les
capacités du cerveau humain dans un
programme informatique
Aujourd’hui, deux de ces capacités
ont engendré des applications
particulièrement prolifiques, au point
que souvent, les informaticiens
confondent « IA » et ces domaines
de l’informatique
• Capacité de perception : réseaux de
neurones, deep learning et toutes les
variantes
• Capacité d’apprentissage automatique
Un programme basé sur de l’IA n’est
pas un programme qui
« comprend » au sens commun
4. - 4 -
Utiliser de l’IA dans un outil de recherche
est une vieille idée
Un exemple spectaculaire et ancien : YANDEX
Son architecture Matrixnet est basée sur de l’apprentissage
automatique
6. - 6 -
Créer des filtres grâce à de
l’apprentissage automatique
Classifieurs : spam, ou non spam !
De gros progrès ont été obtenus au niveau performance :
SVM : support vector machines
Trouver la « formule » qui va prendre les mêmes décisions qu’un humain se
résume à un problème de géométrie mis en équations
7. - 7 -
Et pour la machine, le travail de
classification devient simple
8. / la clé du mystère dans une interview de wired
- 8 -
Panda et l’apprentissage automatique
http://www.wired.com/2011/03/the-panda-that-hates-farms/all/
Wired.com: But how do you implement that algorithmically?
Cutts: I think you look for signals that recreate that same intuition, that same
experience that you have as an engineer and that users have. Whenever we look at
the most blocked sites, it did match our intuition and experience, but the key is, you
also have your experience of the sorts of sites that are going to be adding value for
users versus not adding value for users. And we actually came up with a classifier to
say, okay, IRS or Wikipedia or New York Times is over on this side, and the low-quality
sites are over on this side. And you can really see mathematical reasons …
Singhal: You can imagine in a hyperspace a bunch of points, some points are red,
some points are green, and in others there’s some mixture. Your job is to find a plane
which says that most things on this side of the place are red, and most of the things on
that side of the plane are the opposite of red.
Since the search engineers could not compute a signal for “would you trust this site
with your credit card” they had to look for other statistical measurements that would
correspond highly with the answers provided in the Quality Raters Survey.
Cela ne vous rappelle rien ?
9. - 9 -
Intégrer du machine learning dans l’algo?
Nous ne sommes pas les seuls à l’avoir compris : Le process décrit par Moz
10. - 10 -
Plus fort :
les réseaux de neurones dans l’algo
Les approches « classiques » ont atteint leurs limites
L’approche prometteuse : le « deep learning »
11. / 2012 : Google brain
- 11 -
Google maîtrise le deep learning
Google brain est capable de reconnaître un chat dans l’image en bas à droite !
2015 : Google Deepmind bat le champion d’Europe de Go
12. - 12 -
L’analyse des textes permet d’associer
des termes à des vecteurs
13. / Grâce aux vecteurs obtenus, on obtient des termes
proches par opérations simples entre vecteurs
- 13 -
Et… tada !
14. / en place depuis début 2015
- 14 -
Application chez google : Rankbrain
En calculant une moyenne pour les vecteurs liés aux mots clés, on peut calculer
le vecteur d’une combinaison de mots clé : un syntagme, une phrase
16. / Premier niveau : expansion de requêtes
- 16 -
Word2vec est utilisé 2 fois dans l’algo
Si une requête rare est tapée, le requêteur essaie d’identifier une requête proche qui
elle est connue et offrira des résultats de meilleure qualité:
Exploitation de l’historique des sessions de requêtes sur la requête connue
Reconnaissance de l’intention derrière la requête connue
17. / Deuxième niveau : calcul de similarité
- 17 -
Word2vec est utilisé 2 fois dans l’algo
La similarité avec la requête peut être calculée aussi bien qu’un cosinus de Salton.
Il semble que l’approche permette d’augmenter le rappel sans dégrader la précision
Les résultats sont améliorés par un score supplémentaire similaire dans son mode de
calcul au pagerank.
18. - 18 -
Encore une fois, adieu les mots clés
Indexation des concepts
Vecteurs Word2vec
Illustration : Brafton.com
19. - 19 -
Quelles conséquences pour le SEO ?
Les différentes couches de l’algorithme coexistent, les résultats sont obtenus en
combinant les approches
Les optimisations « à l’ancienne » n’ont pas complètement perdu leur intérêt à
date : l’algo classique reste dominant
Mais : les cas où une page remonte en tête du classement sur une requête alors
qu’elle semble ne pas être optimisée pour cette requête augmentent en
fréquence
Il faut donc se préparer à un nouveau paradigme de recherche, où pour bien se
classer, une page doit être avant tout une bonne réponse à la requête de
l’internaute, et même, un résultat en phase avec l’intention cachée derrière la
requête de l’internaute.
20. - 20 -
Pour en savoir plus
https://code.google.com/archive/p/word2vec/
https://scholar.google.com/citations?user=oBu8kMMAAAAJ
http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its-
lucrative-web-search-over-to-ai-machines
http://research.google.com/pubs/GregCorrado.html