SlideShare uma empresa Scribd logo
1 de 3
Baixar para ler offline
Cow-boys contre chemin de fer ou que savez-vous vraiment de lʼhistoire de lʼinformatique ?




Chapitre 15 — Les moteurs de recherche




Les moteurs de recherche ont représenté un service critique du Web dans la mesure où ils
fournissent lʼinterface principale du Web. On peut même dire quʼils ont joué (et jouent en-
core pour les vagues de nouveaux utilisateurs) le rôle de "point de départ" dans lʼutilisation
du Web et de lʼInternet pour les utilisateurs non-techniciens (lʼimmense majorité désor-
mais). Grâce à ce type de service, lʼinternaute peut en effet trouver des sites Web qui lʼin-
téressent sans avoir à connaître au préalable leur adresse (URL) voire même leur existen-
ce !

Les moteurs de recherches sont devenus une pièce critique dans lʼéconomie du Web —
surtout lorsque lʼon cherche à promouvoir son site. Car pour tous les sites Web de petite
ou moyenne taille, être référencé par les moteurs de recherche est un passage obligé
pour se faire connaître. Dʼoù une pléthore de termes techniques lié au sujet : SEO (Search
Engine Optimization : comment optimiser son site Web pour être en tête des résultats re-
tournés), SEM (Search Engine Marketing  : comment être visible sur les moteurs de re-
cherche, que ce soit bar le biais du SEO ou en achetant des encarts publicitaires), CTR
(Click-Through Rate : pourcentage dʼinternautes qui cliquent sur lʼencart publicitaire), etc.

Le principe du Web étant basé sur les hyperliens entre différentes pages, la notion de mo-
teur de recherche est venue naturellement. Un site Web peut en effet facilement faire of-
fice de moteur de recherche pour dʼautres sites Web, alors quʼun site FTP ne peut pas
faire facilement office de moteur de recherche pour dʼautres sites FTP. Le Web a ainsi vite
remplacé Gopher, un service de recherche de document sur Internet populaire avant la
montée du Web. Le fait que Gopher était moins souple que les moteurs de recherche Web
(il exigeait que les documents suivent un format donné), moins facile dʼutilisation quʼun
navigateur Web et que certains serveurs Gophers ont commencé à être payant a fait que
le service est tombé en désuétude rapidement après avoir été à la mode -brièvement-
dans les années quatre-vingt-dix. Comme souvent dans des nouveaux marchés, on a tout
dʼabord assisté à une explosion des moteurs de recherche Web, avant de voir un tasse-
ment, les moteurs les plus populaires triomphant au dépend des plus petits.

Les débuts des moteurs de recherche sur le Web : Yahoo contre AltaVista

Les premiers moteurs de recherche sont apparus très vite. Dès 1993 on a eu Aliweb,
W3Catalog ou JumpStation alors que le Web était encore très "jeune". En 1994 ont suivi
de nombreux autres moteurs, certains restants encore connus aujourdʼhui : Yahoo (com-
pagnie fondée en 1995), Architext (renommé Excite), Lycos, WebCrawler, etc. Ces com-
pagnies furent créées pour de nombreuses raisons et pas forcément pour indexer le Web.
Excite a commencé en 1994 par six étudiants de Stanford sous le nom dʼArchitext et avait
pour but de rechercher dans les bases de données des entreprises. Vinod Koshla (cofon-
dateur de Sun), capital-risqueur de Kleiner Perkins Caufield & Byers, était derrière Excite
et cʼest lui qui suggéra aux fondateurs dʼindexer plutôt le Web. Très vite deux moteurs de
recherche se sont imposés : Yahoo dʼun côté et AltaVista de lʼautre.


                                                        Page 176 - Troisième partie : lʼère du réseau
Cow-boys contre chemin de fer ou que savez-vous vraiment de lʼhistoire de lʼinformatique ?

Yahoo a commencé en février 1994 par deux étudiants de Stanford (encore), David Filo et
Jerry Yang. Selon la version officielle, le site (alors appelé "David & Jerryʼs Guide to the
World Wide Web") a commencé comme un moyen de répertorier les sites Web qui les in-
téressaient. Lorsque le site a pris de lʼampleur, ils ont dû créer des catégories. Lorsque les
catégories devinrent trop grosses, elles durent être divisées entre sous-catégories et ainsi
de suite. Le concept de Yahoo est né comme cela. Mais un autre élément de Yahoo qui
nʼest pas relaté par la version officielle est que le moteur a réellement commencé avant
même que Filo et Wang nʼutilisent le Web. Dans son livre The Search, John Battelle a in-
terviewé Jerry Yang et David Filo qui ont reconnu, à lʼépoque, être prêts à tout pour ne pas
travailler sur leur thèse (la spécialité de Yang et Filo nʼétait pas lʼinformatique mais le génie
électrique). Lʼancêtre de Yahoo fut créé avant que le Web ne se répande, et était un pro-
gramme qui indexait automatiquement des informations de sites de basket-ball et ce afin
de gagner des matchs de fantasy baseball (ce jeu, très populaire aux Etats-Unis, permet
aux joueurs de gérer une équipe de baseball virtuelle basé sur les performances de véri-
tables joueurs).

En 1995, les deux étudiants décidèrent de renommer leur site en Yahoo pour Yet Another
Hierarchic Officious Oracle. En fait ils décidèrent tout dʼabord que le nom devait commen-
cer par YA, suivant une tradition en informatique dʼutiliser des noms en "Yet Another". En
parcourant le dictionnaire à la lettre Y, le terme Yahoo résonna immédiatement (en anglais,
Yahoo veut à la fois dire "Youpi" et "Barjot"). Pour le reste, la page de garde de Yahoo,
avec son logo rouge et ses catégories principales est restée célèbre pendant des années.

De lʼautre côté, AltaVista, un service lancé par Digital Equipment Corporation (DEC), a pris
une approche diamétralement opposée. Yahoo référençait manuellement les sites Web,
alors quʼAltaVista effectuait une indexation automatique. Autant le référencement du Web
était une fin en soi pour les fondateurs de Yahoo, autant cʼétait un moyen pour Digital. Al-
taVista fut créé comme vitrine technologique de la compagnie, le service utilisant des
puissants serveurs à base de lʼAlpha, le tout nouveau processeur 64-bit de la compagnie.
Lʼorigine de lʼidée est contestée, mais ce fut Louis Monier, un français travaillant pour Digi-
tal au laboratoire de Palo Alto, qui coda la première version. Ce fut également Monier qui
réussira à convaincre la direction de DEC de dévoiler AltaVista au grand public (pour la
direction, le seul but était de vendre des serveurs) en leur promettant une publicité fabu-
leuse pour la compagnie. Et, effectivement, Alta Vista fut rapidement très populaire mais il
est difficile dʼestimer lʼimpact réel pour DEC car, comme dʼhabitude avec tout ce qui est
radicalement nouveau et hors de sa culture dʼorigine, DEC a été trop timide dans lʼexploi-
tation marketing de la popularité soudaine dʼAltaVista.

AltaVista a tout de suite eu une culture très technique et peut être considéré sur de nom-
breux points comme le précurseur de Google. Tout comme Google, son premier chalenge
a été dʼindexer le Web de manière efficace là où les moteurs de recherche de lʼépoque
avaient de nombreuses carences : mauvaise interface graphique, langage de requête peu
puissant et/ou pas assez de pages indexées. AltaVista sʼest appuyé sur une puissante ar-
chitecture matérielle (une douzaine de serveurs DEC Alpha) pour fournir un service qui
était bien plus complet que ce qui existait déjà. La où Yahoo se basait sur un tri effectué
par des humains, AltaVista a proposé une recherche par mot-clé. Enfin, AltaVista a dès le
début proposé une interface minimaliste -ce que Google a réinventé à ses débuts. En pa-
rallèle, de nombreux autres services ont tenté de sʼaccaparer leur part du gâteau : Excite,
Lycos, Ask Jeeves (renommé depuis Ask.com). La plupart se basant sur des mots-clés.
Certains, comme Ask Jeeves, se sont basés sur le langage naturel avec plus ou moins de
succès. Mais aucun de ces services nʼa réellement réussi à écorner le succès des deux
géants du moment.

Du moteur de recherche au portail (1996-2000)

Avec la bulle Internet un nouveau mot à la mode est né : le portail. À lʼépoque de la soi-di-
sant "nouvelle économie", le mot dʼordre était dʼattirer le plus de trafic possible sur son site
Web. Chercher à monétiser ledit trafic nʼétait pas à lʼordre du jour. Lʼopinion communé-
ment admise de lʼépoque était que cela viendrait naturellement, même si à lʼépoque per-
sonne ne voyait comment. Les principales valeurs de lʼépoque ont donc tourné autour des

Page 177 - Troisième partie : lʼère du réseau
Cow-boys contre chemin de fer ou que savez-vous vraiment de lʼhistoire de lʼinformatique ?

mesures qui évaluaient le trafic : nombre de hits, nombre de visites, de visiteurs uniques
par mois, etc. À lʼépoque, même les publicités étaient payées en terme de hits, cʼest-à-dire
de nombre de fois où elles étaient visualisées (de $5 à $20 pour 1000 affichages suivant
que le public est ciblé ou non). Ce modèle était calé sur le modèle publicitaire traditionnel
où la seconde de publicité télévisée est par exemple facturée proportionnellement à lʼau-
dience. Mais il suivait également la mentalité de lʼépoque : on recherche la quantité de vi-
siteurs plus que la qualité.

Dans ces conditions, la notion de portail Web est rapidement devenue le Graal de la bulle
Internet. Tim Koogle, PDG de Yahoo de 1995 à 2001, a défini le portail comme étant le
point de passage obligé du Web. La course au portail a tout naturellement attiré beaucoup
de monde. De nombreuses compagnies ont tenté de diriger leurs clients ou utilisateurs
vers leur propre portail dans lʼespoir de devenir le portail le plus important. AOL, le plus
gros fournisseur dʼaccès Internet de son temps, sʼest appuyé sur ses clients. Netscape,
fort de son navigateur à succès, a fait de même. Yahoo sʼest rapidement "réinventé" en
portail Web.

Avec la course au portail on a assisté au déclin de la qualité de nombreux moteurs de re-
cherche. Yahoo a été sur ce point un exemple caractéristique, mais AltaVista est égale-
ment tombé dans ce piège. Car avec le concept du portail, le moteur de recherche nʼoc-
cupe plus quʼune petite fraction du service. En effet, lʼidée est de limiter au maximum le
besoin de surfer le Web en proposant au sein dʼune seule et même page le plus dʼinforma-
tion possible. Les portails génériques (ainsi que de nombreux portails spécialisés) ont
donc commencé à afficher des informations telles que lʼactualité, la météo ou le cours de
la bourse. Les portails ont en plus cherché à intégrer les services les plus utilisés par les
internautes. Yahoo a ainsi développé de nombreux services Web. Yahoo Mail bien sûr,
mais Yahoo Instant Messaging (messagerie instantanée), Yahoo Personals (site de ren-
contres en ligne), Yahoo Maps, Yahoo Movies, Yahoo Finance et de nombreux autres ser-
vices.

Le concept du portail était en fait une évolution naturelle pour une compagnie comme Ya-
hoo. Car dans les deux cas lʼidée est quʼune poignée de gens décident quels types dʼin-
formations devraient être sur la première page que lʼinternaute voit en lançant son naviga-
teur Web. À ses débuts, Yahoo affichait sur sa page de garde les catégories de sites Web
quʼil jugeait principales. En devenant un portail Web, la compagnie affiche les éléments du
Web quʼelle juge primordiales. Mais cʼétait sans compter lʼexplosion du Web et de ses uti-
lisations. Le fait que quelques dirigeants décident dʼun type de page unique que tous les
internautes devraient voir nʼa pas tenu longtemps. Essayer de garder lʼutilisateur le plus
longtemps sur son site Web est contraire à lʼesprit du Web -les millions de sites Web indé-
pendants existent justement pour cette raison. Le phénomène de fidélisation à une mar-
que nʼa pas fonctionné comme désiré. Du fait de la nature "éclatée" du Web, les internau-
tes nʼont pas adopté des services simplement pour leur marque comme le prévoyaient et
lʼespéraient les promoteurs des portails. Google Maps par exemple, a supplanté Mapquest
et Yahoo Maps non pas parce quʼil était estampillé Google mais parce quʼil apportait vrai-
ment quelque chose de plus.

Pire, le portail a créé un encombrement des pages de recherche Web. Très peu de gens
sont intéressés par tous les éléments affichés. Les éléments qui nʼintéressent pas un in-
ternaute ne font quʼaugmenter le fouillis de la page. Lʼéclatement de la bulle a fait empirer
les choses : les sites Web ayant plus de pression pour être rentables ont donc fait appel à
de la publicité souvent agressive. Si AltaVista a depuis abandonné le concept de portail et
est revenu à un look minimaliste concentré sur le moteur de recherche (eh oui, AltaVista
existe encore : après être passé par de nombreuses vicissitudes, le service fait désormais
partie dʼOverture), les pages de garde de Yahoo ou AOL sont restées tellement encom-
brées quʼelles en sont inconfortables. Certains services de Yahoo (comme Yahoo Movies)
possèdent deux barres de recherche : une pour chercher les films, et une pour chercher le
Web, amenant beaucoup dʼutilisateurs à confondre les deux.

       === La difficulté de la diversification
       De nombreuses compagnies ont été critiquées pour sʼêtre trop diversifiées et ainsi "sʼêtre éloignée


                                                             Page 178 - Troisième partie : lʼère du réseau

Mais conteúdo relacionado

Destaque

Partners plan de campagne 360 + idée créative
Partners plan de campagne 360 + idée créativePartners plan de campagne 360 + idée créative
Partners plan de campagne 360 + idée créative
Laurent Ledoux
 
Trabajo Practico Info
Trabajo Practico InfoTrabajo Practico Info
Trabajo Practico Info
annttho
 
PresentacióN1
PresentacióN1PresentacióN1
PresentacióN1
deguis
 
The Beautiful Bosra city (Tourisme en Syrie)
The Beautiful Bosra city (Tourisme en Syrie)The Beautiful Bosra city (Tourisme en Syrie)
The Beautiful Bosra city (Tourisme en Syrie)
Mohammad Alsharif
 
Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...
Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...
Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...
Bibliothèque de Genève
 
Guia de aprendizaje didactico hidrografia
Guia de aprendizaje didactico  hidrografiaGuia de aprendizaje didactico  hidrografia
Guia de aprendizaje didactico hidrografia
Patricio Jaramillo
 

Destaque (20)

Partners plan de campagne 360 + idée créative
Partners plan de campagne 360 + idée créativePartners plan de campagne 360 + idée créative
Partners plan de campagne 360 + idée créative
 
Construire une équipe commerciale virale
Construire une équipe commerciale viraleConstruire une équipe commerciale virale
Construire une équipe commerciale virale
 
Portafolios Electrónicos
Portafolios ElectrónicosPortafolios Electrónicos
Portafolios Electrónicos
 
Grammaire
GrammaireGrammaire
Grammaire
 
Peinture sur corps
Peinture sur corpsPeinture sur corps
Peinture sur corps
 
Ritmes 2n
Ritmes 2nRitmes 2n
Ritmes 2n
 
Aprender Con AlegríA!!
Aprender Con AlegríA!!Aprender Con AlegríA!!
Aprender Con AlegríA!!
 
El met de ny
El met de nyEl met de ny
El met de ny
 
Guide instagram
Guide instagramGuide instagram
Guide instagram
 
Trabajo sesion ii
Trabajo sesion iiTrabajo sesion ii
Trabajo sesion ii
 
Calentamiento Global
Calentamiento GlobalCalentamiento Global
Calentamiento Global
 
Trabajo Practico Info
Trabajo Practico InfoTrabajo Practico Info
Trabajo Practico Info
 
PresentacióN1
PresentacióN1PresentacióN1
PresentacióN1
 
Un an dans la peau d’une équipe Lean Startup chez OCTO
Un an dans la peau d’une équipe Lean Startup chez OCTOUn an dans la peau d’une équipe Lean Startup chez OCTO
Un an dans la peau d’une équipe Lean Startup chez OCTO
 
Grand corps malade - Je viens de là
Grand corps malade - Je viens de làGrand corps malade - Je viens de là
Grand corps malade - Je viens de là
 
The Beautiful Bosra city (Tourisme en Syrie)
The Beautiful Bosra city (Tourisme en Syrie)The Beautiful Bosra city (Tourisme en Syrie)
The Beautiful Bosra city (Tourisme en Syrie)
 
Manipulacion mediatica 10 mandamientos
Manipulacion mediatica 10 mandamientosManipulacion mediatica 10 mandamientos
Manipulacion mediatica 10 mandamientos
 
Working Party on Statistics (WP-Stat) Task Team on MNCH (French)
Working Party on Statistics (WP-Stat) Task Team on MNCH (French)Working Party on Statistics (WP-Stat) Task Team on MNCH (French)
Working Party on Statistics (WP-Stat) Task Team on MNCH (French)
 
Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...
Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...
Imprimer à Genève à la fin du XVIe siècle : l’exemple de Jacob Stoer (1542-16...
 
Guia de aprendizaje didactico hidrografia
Guia de aprendizaje didactico  hidrografiaGuia de aprendizaje didactico  hidrografia
Guia de aprendizaje didactico hidrografia
 

Semelhante a Chap15 extrait

Veille sur : Web 2.0, Web 3.0, Social Media et Real Time Web
Veille sur : Web 2.0, Web 3.0, Social Media et Real Time WebVeille sur : Web 2.0, Web 3.0, Social Media et Real Time Web
Veille sur : Web 2.0, Web 3.0, Social Media et Real Time Web
maclic
 
Les Tendances Du Web2009
Les Tendances Du Web2009Les Tendances Du Web2009
Les Tendances Du Web2009
François GOUBE
 

Semelhante a Chap15 extrait (20)

Veille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veilleVeille 4 - I Choquet - organiser la veille
Veille 4 - I Choquet - organiser la veille
 
Wurfing8
Wurfing8Wurfing8
Wurfing8
 
L'espace Internet, cartographie et repérage
L'espace Internet, cartographie et repérageL'espace Internet, cartographie et repérage
L'espace Internet, cartographie et repérage
 
L’actualité High-Tech de la semaine : Shazam, Yelp, Coursera, Pebble, Lyft
L’actualité High-Tech de la semaine : Shazam, Yelp, Coursera, Pebble, LyftL’actualité High-Tech de la semaine : Shazam, Yelp, Coursera, Pebble, Lyft
L’actualité High-Tech de la semaine : Shazam, Yelp, Coursera, Pebble, Lyft
 
L’actualité High-Tech de la semaine : Willow Garage, Nextdoor, On Deck Capita...
L’actualité High-Tech de la semaine : Willow Garage, Nextdoor, On Deck Capita...L’actualité High-Tech de la semaine : Willow Garage, Nextdoor, On Deck Capita...
L’actualité High-Tech de la semaine : Willow Garage, Nextdoor, On Deck Capita...
 
Fondamentaux du journalisme web 2014 - partie 1
Fondamentaux du journalisme web 2014 - partie 1Fondamentaux du journalisme web 2014 - partie 1
Fondamentaux du journalisme web 2014 - partie 1
 
L’actualité High-Tech de la semaine : Airmobs du MIT Media Lab, Foursquare, L...
L’actualité High-Tech de la semaine : Airmobs du MIT Media Lab, Foursquare, L...L’actualité High-Tech de la semaine : Airmobs du MIT Media Lab, Foursquare, L...
L’actualité High-Tech de la semaine : Airmobs du MIT Media Lab, Foursquare, L...
 
Le web 3.0 ie rie 25 apr 2008
Le web 3.0 ie rie 25 apr 2008Le web 3.0 ie rie 25 apr 2008
Le web 3.0 ie rie 25 apr 2008
 
Turbulences n46
Turbulences n46Turbulences n46
Turbulences n46
 
Veille sur : Web 2.0, Web 3.0, Social Media et Real Time Web
Veille sur : Web 2.0, Web 3.0, Social Media et Real Time WebVeille sur : Web 2.0, Web 3.0, Social Media et Real Time Web
Veille sur : Web 2.0, Web 3.0, Social Media et Real Time Web
 
Les Tendances Du Web
Les Tendances Du WebLes Tendances Du Web
Les Tendances Du Web
 
Les Tendances Du Web2009
Les Tendances Du Web2009Les Tendances Du Web2009
Les Tendances Du Web2009
 
Outils Web 2.0 pour les militants et ONG
Outils Web 2.0 pour les militants et ONGOutils Web 2.0 pour les militants et ONG
Outils Web 2.0 pour les militants et ONG
 
Outils de promotion et d'animation d'un site web
Outils de promotion et d'animation d'un site webOutils de promotion et d'animation d'un site web
Outils de promotion et d'animation d'un site web
 
Outils d'animation et de promotion d'un site web
Outils d'animation et de promotion d'un site webOutils d'animation et de promotion d'un site web
Outils d'animation et de promotion d'un site web
 
Chap14 extrait
Chap14 extraitChap14 extrait
Chap14 extrait
 
L’actualité High-Tech de la semaine : Anyperk, Box et Seedcamp, Twitch, Paypa...
L’actualité High-Tech de la semaine : Anyperk, Box et Seedcamp, Twitch, Paypa...L’actualité High-Tech de la semaine : Anyperk, Box et Seedcamp, Twitch, Paypa...
L’actualité High-Tech de la semaine : Anyperk, Box et Seedcamp, Twitch, Paypa...
 
Comprendre Web 2.0
Comprendre Web 2.0Comprendre Web 2.0
Comprendre Web 2.0
 
L’actualité High-Tech de la semaine : Apple et Windows Phone, Dwolla, LexMach...
L’actualité High-Tech de la semaine : Apple et Windows Phone, Dwolla, LexMach...L’actualité High-Tech de la semaine : Apple et Windows Phone, Dwolla, LexMach...
L’actualité High-Tech de la semaine : Apple et Windows Phone, Dwolla, LexMach...
 
L’actualité High-Tech de la semaine : Paypal, DogPatch Labs, Silvercar, Surve...
L’actualité High-Tech de la semaine : Paypal, DogPatch Labs, Silvercar, Surve...L’actualité High-Tech de la semaine : Paypal, DogPatch Labs, Silvercar, Surve...
L’actualité High-Tech de la semaine : Paypal, DogPatch Labs, Silvercar, Surve...
 

Mais de Alain Lefebvre

Histoire de l'informatique
Histoire de l'informatiqueHistoire de l'informatique
Histoire de l'informatique
Alain Lefebvre
 

Mais de Alain Lefebvre (18)

Chap18 extrait
Chap18 extraitChap18 extrait
Chap18 extrait
 
Chap17 extrait
Chap17 extraitChap17 extrait
Chap17 extrait
 
Chap16 extrait
Chap16 extraitChap16 extrait
Chap16 extrait
 
Chap13 extrait
Chap13 extraitChap13 extrait
Chap13 extrait
 
Chap12 extrait
Chap12 extraitChap12 extrait
Chap12 extrait
 
Chap11 extrait
Chap11 extraitChap11 extrait
Chap11 extrait
 
Chap10 extrait
Chap10 extraitChap10 extrait
Chap10 extrait
 
Chap9 extrait
Chap9 extraitChap9 extrait
Chap9 extrait
 
Chap8 extrait
Chap8 extraitChap8 extrait
Chap8 extrait
 
Chap7 extrait
Chap7 extraitChap7 extrait
Chap7 extrait
 
Chap6 extrait
Chap6 extraitChap6 extrait
Chap6 extrait
 
Chap5 extrait
Chap5 extraitChap5 extrait
Chap5 extrait
 
Chap4 extrait
Chap4 extraitChap4 extrait
Chap4 extrait
 
Chap3 extrait
Chap3 extraitChap3 extrait
Chap3 extrait
 
Chap1 extrait
Chap1 extraitChap1 extrait
Chap1 extrait
 
Chap2 extrait
Chap2 extraitChap2 extrait
Chap2 extrait
 
Conclusions extrait
Conclusions extraitConclusions extrait
Conclusions extrait
 
Histoire de l'informatique
Histoire de l'informatiqueHistoire de l'informatique
Histoire de l'informatique
 

Chap15 extrait

  • 1. Cow-boys contre chemin de fer ou que savez-vous vraiment de lʼhistoire de lʼinformatique ? Chapitre 15 — Les moteurs de recherche Les moteurs de recherche ont représenté un service critique du Web dans la mesure où ils fournissent lʼinterface principale du Web. On peut même dire quʼils ont joué (et jouent en- core pour les vagues de nouveaux utilisateurs) le rôle de "point de départ" dans lʼutilisation du Web et de lʼInternet pour les utilisateurs non-techniciens (lʼimmense majorité désor- mais). Grâce à ce type de service, lʼinternaute peut en effet trouver des sites Web qui lʼin- téressent sans avoir à connaître au préalable leur adresse (URL) voire même leur existen- ce ! Les moteurs de recherches sont devenus une pièce critique dans lʼéconomie du Web — surtout lorsque lʼon cherche à promouvoir son site. Car pour tous les sites Web de petite ou moyenne taille, être référencé par les moteurs de recherche est un passage obligé pour se faire connaître. Dʼoù une pléthore de termes techniques lié au sujet : SEO (Search Engine Optimization : comment optimiser son site Web pour être en tête des résultats re- tournés), SEM (Search Engine Marketing  : comment être visible sur les moteurs de re- cherche, que ce soit bar le biais du SEO ou en achetant des encarts publicitaires), CTR (Click-Through Rate : pourcentage dʼinternautes qui cliquent sur lʼencart publicitaire), etc. Le principe du Web étant basé sur les hyperliens entre différentes pages, la notion de mo- teur de recherche est venue naturellement. Un site Web peut en effet facilement faire of- fice de moteur de recherche pour dʼautres sites Web, alors quʼun site FTP ne peut pas faire facilement office de moteur de recherche pour dʼautres sites FTP. Le Web a ainsi vite remplacé Gopher, un service de recherche de document sur Internet populaire avant la montée du Web. Le fait que Gopher était moins souple que les moteurs de recherche Web (il exigeait que les documents suivent un format donné), moins facile dʼutilisation quʼun navigateur Web et que certains serveurs Gophers ont commencé à être payant a fait que le service est tombé en désuétude rapidement après avoir été à la mode -brièvement- dans les années quatre-vingt-dix. Comme souvent dans des nouveaux marchés, on a tout dʼabord assisté à une explosion des moteurs de recherche Web, avant de voir un tasse- ment, les moteurs les plus populaires triomphant au dépend des plus petits. Les débuts des moteurs de recherche sur le Web : Yahoo contre AltaVista Les premiers moteurs de recherche sont apparus très vite. Dès 1993 on a eu Aliweb, W3Catalog ou JumpStation alors que le Web était encore très "jeune". En 1994 ont suivi de nombreux autres moteurs, certains restants encore connus aujourdʼhui : Yahoo (com- pagnie fondée en 1995), Architext (renommé Excite), Lycos, WebCrawler, etc. Ces com- pagnies furent créées pour de nombreuses raisons et pas forcément pour indexer le Web. Excite a commencé en 1994 par six étudiants de Stanford sous le nom dʼArchitext et avait pour but de rechercher dans les bases de données des entreprises. Vinod Koshla (cofon- dateur de Sun), capital-risqueur de Kleiner Perkins Caufield & Byers, était derrière Excite et cʼest lui qui suggéra aux fondateurs dʼindexer plutôt le Web. Très vite deux moteurs de recherche se sont imposés : Yahoo dʼun côté et AltaVista de lʼautre. Page 176 - Troisième partie : lʼère du réseau
  • 2. Cow-boys contre chemin de fer ou que savez-vous vraiment de lʼhistoire de lʼinformatique ? Yahoo a commencé en février 1994 par deux étudiants de Stanford (encore), David Filo et Jerry Yang. Selon la version officielle, le site (alors appelé "David & Jerryʼs Guide to the World Wide Web") a commencé comme un moyen de répertorier les sites Web qui les in- téressaient. Lorsque le site a pris de lʼampleur, ils ont dû créer des catégories. Lorsque les catégories devinrent trop grosses, elles durent être divisées entre sous-catégories et ainsi de suite. Le concept de Yahoo est né comme cela. Mais un autre élément de Yahoo qui nʼest pas relaté par la version officielle est que le moteur a réellement commencé avant même que Filo et Wang nʼutilisent le Web. Dans son livre The Search, John Battelle a in- terviewé Jerry Yang et David Filo qui ont reconnu, à lʼépoque, être prêts à tout pour ne pas travailler sur leur thèse (la spécialité de Yang et Filo nʼétait pas lʼinformatique mais le génie électrique). Lʼancêtre de Yahoo fut créé avant que le Web ne se répande, et était un pro- gramme qui indexait automatiquement des informations de sites de basket-ball et ce afin de gagner des matchs de fantasy baseball (ce jeu, très populaire aux Etats-Unis, permet aux joueurs de gérer une équipe de baseball virtuelle basé sur les performances de véri- tables joueurs). En 1995, les deux étudiants décidèrent de renommer leur site en Yahoo pour Yet Another Hierarchic Officious Oracle. En fait ils décidèrent tout dʼabord que le nom devait commen- cer par YA, suivant une tradition en informatique dʼutiliser des noms en "Yet Another". En parcourant le dictionnaire à la lettre Y, le terme Yahoo résonna immédiatement (en anglais, Yahoo veut à la fois dire "Youpi" et "Barjot"). Pour le reste, la page de garde de Yahoo, avec son logo rouge et ses catégories principales est restée célèbre pendant des années. De lʼautre côté, AltaVista, un service lancé par Digital Equipment Corporation (DEC), a pris une approche diamétralement opposée. Yahoo référençait manuellement les sites Web, alors quʼAltaVista effectuait une indexation automatique. Autant le référencement du Web était une fin en soi pour les fondateurs de Yahoo, autant cʼétait un moyen pour Digital. Al- taVista fut créé comme vitrine technologique de la compagnie, le service utilisant des puissants serveurs à base de lʼAlpha, le tout nouveau processeur 64-bit de la compagnie. Lʼorigine de lʼidée est contestée, mais ce fut Louis Monier, un français travaillant pour Digi- tal au laboratoire de Palo Alto, qui coda la première version. Ce fut également Monier qui réussira à convaincre la direction de DEC de dévoiler AltaVista au grand public (pour la direction, le seul but était de vendre des serveurs) en leur promettant une publicité fabu- leuse pour la compagnie. Et, effectivement, Alta Vista fut rapidement très populaire mais il est difficile dʼestimer lʼimpact réel pour DEC car, comme dʼhabitude avec tout ce qui est radicalement nouveau et hors de sa culture dʼorigine, DEC a été trop timide dans lʼexploi- tation marketing de la popularité soudaine dʼAltaVista. AltaVista a tout de suite eu une culture très technique et peut être considéré sur de nom- breux points comme le précurseur de Google. Tout comme Google, son premier chalenge a été dʼindexer le Web de manière efficace là où les moteurs de recherche de lʼépoque avaient de nombreuses carences : mauvaise interface graphique, langage de requête peu puissant et/ou pas assez de pages indexées. AltaVista sʼest appuyé sur une puissante ar- chitecture matérielle (une douzaine de serveurs DEC Alpha) pour fournir un service qui était bien plus complet que ce qui existait déjà. La où Yahoo se basait sur un tri effectué par des humains, AltaVista a proposé une recherche par mot-clé. Enfin, AltaVista a dès le début proposé une interface minimaliste -ce que Google a réinventé à ses débuts. En pa- rallèle, de nombreux autres services ont tenté de sʼaccaparer leur part du gâteau : Excite, Lycos, Ask Jeeves (renommé depuis Ask.com). La plupart se basant sur des mots-clés. Certains, comme Ask Jeeves, se sont basés sur le langage naturel avec plus ou moins de succès. Mais aucun de ces services nʼa réellement réussi à écorner le succès des deux géants du moment. Du moteur de recherche au portail (1996-2000) Avec la bulle Internet un nouveau mot à la mode est né : le portail. À lʼépoque de la soi-di- sant "nouvelle économie", le mot dʼordre était dʼattirer le plus de trafic possible sur son site Web. Chercher à monétiser ledit trafic nʼétait pas à lʼordre du jour. Lʼopinion communé- ment admise de lʼépoque était que cela viendrait naturellement, même si à lʼépoque per- sonne ne voyait comment. Les principales valeurs de lʼépoque ont donc tourné autour des Page 177 - Troisième partie : lʼère du réseau
  • 3. Cow-boys contre chemin de fer ou que savez-vous vraiment de lʼhistoire de lʼinformatique ? mesures qui évaluaient le trafic : nombre de hits, nombre de visites, de visiteurs uniques par mois, etc. À lʼépoque, même les publicités étaient payées en terme de hits, cʼest-à-dire de nombre de fois où elles étaient visualisées (de $5 à $20 pour 1000 affichages suivant que le public est ciblé ou non). Ce modèle était calé sur le modèle publicitaire traditionnel où la seconde de publicité télévisée est par exemple facturée proportionnellement à lʼau- dience. Mais il suivait également la mentalité de lʼépoque : on recherche la quantité de vi- siteurs plus que la qualité. Dans ces conditions, la notion de portail Web est rapidement devenue le Graal de la bulle Internet. Tim Koogle, PDG de Yahoo de 1995 à 2001, a défini le portail comme étant le point de passage obligé du Web. La course au portail a tout naturellement attiré beaucoup de monde. De nombreuses compagnies ont tenté de diriger leurs clients ou utilisateurs vers leur propre portail dans lʼespoir de devenir le portail le plus important. AOL, le plus gros fournisseur dʼaccès Internet de son temps, sʼest appuyé sur ses clients. Netscape, fort de son navigateur à succès, a fait de même. Yahoo sʼest rapidement "réinventé" en portail Web. Avec la course au portail on a assisté au déclin de la qualité de nombreux moteurs de re- cherche. Yahoo a été sur ce point un exemple caractéristique, mais AltaVista est égale- ment tombé dans ce piège. Car avec le concept du portail, le moteur de recherche nʼoc- cupe plus quʼune petite fraction du service. En effet, lʼidée est de limiter au maximum le besoin de surfer le Web en proposant au sein dʼune seule et même page le plus dʼinforma- tion possible. Les portails génériques (ainsi que de nombreux portails spécialisés) ont donc commencé à afficher des informations telles que lʼactualité, la météo ou le cours de la bourse. Les portails ont en plus cherché à intégrer les services les plus utilisés par les internautes. Yahoo a ainsi développé de nombreux services Web. Yahoo Mail bien sûr, mais Yahoo Instant Messaging (messagerie instantanée), Yahoo Personals (site de ren- contres en ligne), Yahoo Maps, Yahoo Movies, Yahoo Finance et de nombreux autres ser- vices. Le concept du portail était en fait une évolution naturelle pour une compagnie comme Ya- hoo. Car dans les deux cas lʼidée est quʼune poignée de gens décident quels types dʼin- formations devraient être sur la première page que lʼinternaute voit en lançant son naviga- teur Web. À ses débuts, Yahoo affichait sur sa page de garde les catégories de sites Web quʼil jugeait principales. En devenant un portail Web, la compagnie affiche les éléments du Web quʼelle juge primordiales. Mais cʼétait sans compter lʼexplosion du Web et de ses uti- lisations. Le fait que quelques dirigeants décident dʼun type de page unique que tous les internautes devraient voir nʼa pas tenu longtemps. Essayer de garder lʼutilisateur le plus longtemps sur son site Web est contraire à lʼesprit du Web -les millions de sites Web indé- pendants existent justement pour cette raison. Le phénomène de fidélisation à une mar- que nʼa pas fonctionné comme désiré. Du fait de la nature "éclatée" du Web, les internau- tes nʼont pas adopté des services simplement pour leur marque comme le prévoyaient et lʼespéraient les promoteurs des portails. Google Maps par exemple, a supplanté Mapquest et Yahoo Maps non pas parce quʼil était estampillé Google mais parce quʼil apportait vrai- ment quelque chose de plus. Pire, le portail a créé un encombrement des pages de recherche Web. Très peu de gens sont intéressés par tous les éléments affichés. Les éléments qui nʼintéressent pas un in- ternaute ne font quʼaugmenter le fouillis de la page. Lʼéclatement de la bulle a fait empirer les choses : les sites Web ayant plus de pression pour être rentables ont donc fait appel à de la publicité souvent agressive. Si AltaVista a depuis abandonné le concept de portail et est revenu à un look minimaliste concentré sur le moteur de recherche (eh oui, AltaVista existe encore : après être passé par de nombreuses vicissitudes, le service fait désormais partie dʼOverture), les pages de garde de Yahoo ou AOL sont restées tellement encom- brées quʼelles en sont inconfortables. Certains services de Yahoo (comme Yahoo Movies) possèdent deux barres de recherche : une pour chercher les films, et une pour chercher le Web, amenant beaucoup dʼutilisateurs à confondre les deux. === La difficulté de la diversification De nombreuses compagnies ont été critiquées pour sʼêtre trop diversifiées et ainsi "sʼêtre éloignée Page 178 - Troisième partie : lʼère du réseau