O slideshow foi denunciado.
Seu SlideShare está sendo baixado. ×

Du bon usage de Google : la recherche d’informations sur le web

Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio

Confira estes a seguir

1 de 43 Anúncio

Du bon usage de Google : la recherche d’informations sur le web

Baixar para ler offline

- Présentation des différents types d’outils de recherche du Web (annuaires et répertoires thématiques, moteurs, métamoteurs, web 2.0 et outils sociaux)
- Couverture des sources explorées
- Notions sur l’indexation humaine et/ou automatisée
- Notion sur les opérateurs de recherche (opérateurs booléens, règles d’interrogation)
- Principes de la recherche avancée
- Les particularités du web (statique, dynamique, sémantique, invisible ou profond)

- Présentation des différents types d’outils de recherche du Web (annuaires et répertoires thématiques, moteurs, métamoteurs, web 2.0 et outils sociaux)
- Couverture des sources explorées
- Notions sur l’indexation humaine et/ou automatisée
- Notion sur les opérateurs de recherche (opérateurs booléens, règles d’interrogation)
- Principes de la recherche avancée
- Les particularités du web (statique, dynamique, sémantique, invisible ou profond)

Anúncio
Anúncio

Mais Conteúdo rRelacionado

Diapositivos para si (20)

Quem viu também gostou (20)

Anúncio

Semelhante a Du bon usage de Google : la recherche d’informations sur le web (20)

Mais de Julien Sicot (20)

Anúncio

Mais recentes (20)

Du bon usage de Google : la recherche d’informations sur le web

  1. 1. Du bon usage de Google Vers une meilleure utilisation des outils de recherche pour le Web
  2. 2. Plan de la formation <ul><li>Le Word Wide Web : évolution, avantages & limites </li></ul><ul><li>Des outils de recherche nombreux et complexes </li></ul><ul><li>Quelques éléments de méthodologie de recherche </li></ul><ul><li>Annuaires et portails </li></ul><ul><li>La « folksonomie », vers des annuaires Web 2.0 ? </li></ul><ul><li>Moteurs de recherche </li></ul><ul><li>Métamoteurs </li></ul><ul><li>Autres outils </li></ul>Bibliothèque Michel Serres : 4 mars 2008
  3. 3. Le Web révolutionne notre utilisation de l’information Bibliothèque Michel Serres : 4 mars 2008 <ul><li>Du Web 1.0… </li></ul><ul><ul><li>Le Word Wide Web (www) = une composante d’Internet </li></ul></ul><ul><ul><li>Changement de support de l’information </li></ul></ul><ul><ul><li>Dématérialisation de l’information, multiplication des flux </li></ul></ul><ul><ul><li>Lecture hypertexte, notion d’hypermédia </li></ul></ul><ul><li>… au Web 2.0 </li></ul><ul><ul><li>Auto-publication (blogs, wikis…) : aujourd’hui tout le monde peut devenir producteur d’informations sur le Web </li></ul></ul>
  4. 4. Quelle évolution pour le web ? Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres : 4 mars 2008
  5. 5. Le Web, un espace documentaire ? <ul><li>Une des 1 ères utilisations = outil de communication du savoir scientifique </li></ul><ul><li>Aujourd’hui explosion documentaire : 7,3 millions de pages nouvelles chaque jour </li></ul><ul><li>Un espace de production et de diffusion de l’information </li></ul><ul><li>Démocratisation de l’accès à l’information </li></ul><ul><li>Utopie de la mémoire collective , de l’encyclopédie universelle (cf Wikipédia) </li></ul>Bibliothèque Michel Serres : 4 mars 2008
  6. 6. Les limites et les dangers du Web <ul><li>Les risques d’ « infobésité » : impossibilité de cerner l’étendue du web </li></ul><ul><ul><li>Comment filtrer et exploiter la surabondance des résultats ? </li></ul></ul><ul><li>L’ « info-pollution » : on y trouve le pire comme le meilleur </li></ul><ul><ul><li>D’où la question de la validité et de la fiabilité de l’information </li></ul></ul><ul><li>L’ « info-zapping » : l’instabilité, le renouvellement continu </li></ul><ul><li>La gratuité VS une sphère commerciale (publicités, achat de mots-clés, liens sponsorisés, positionnement payant) </li></ul>Bibliothèque Michel Serres : 4 mars 2008
  7. 7. C’est aussi le web invisible « the deep web » <ul><li>Selon une étude de BrightPlanet (juillet 2001) : le Web invisible est 500 fois plus vaste que le Web indexé par les moteurs de recherche </li></ul><ul><ul><li>Or ces ressources, en plus d'être volumineuses, sont souvent de très bonne qualité ! </li></ul></ul><ul><li>Les causes : </li></ul><ul><ul><li>Les pages générées dynamiquement (formulaires de recherche, bases de données) </li></ul></ul><ul><ul><li>Les sites nécessitant une authentification, avec un accès payant </li></ul></ul><ul><ul><li>Certains formats de données (Flash, Javascript) </li></ul></ul><ul><ul><li>Les pages interdites de référencement </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  8. 8. Des outils de recherche nombreux et complexes (1/3) <ul><li>Impossibilité de tous les connaître, de tous les maîtriser </li></ul><ul><li>Le danger : céder à la facilité devant la simplicité apparente </li></ul><ul><li>75% des internautes passent ¾ de leur temps à chercher </li></ul><ul><li>Une nécessité : connaître la typologie des outils existant pour mieux les appréhender </li></ul><ul><ul><li>Voir la page de JP Lardy «  Tous les outils en une page  » http:// urfist . univ -lyon1. fr / risi /outils. htm </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  9. 9. Des outils de recherche nombreux et complexes (2/3) <ul><li>1 ère distinction : quel corpus ? </li></ul><ul><ul><li>Les outils propres au Web (interrogeant l’ensemble ou une partie du web) </li></ul></ul><ul><ul><ul><li>Ceux qui possèdent leur propre base, index et interface de recherche (moteurs de recherche, annuaires) </li></ul></ul></ul><ul><ul><ul><li>Ceux qui possèdent un module d’interrogation exploitant les bases d’autres outils (métamoteurs) </li></ul></ul></ul><ul><ul><li>Les outils disponibles via le Web (bases de données spécialisées, catalogues de bibliothèque…) </li></ul></ul><ul><li>2 e distinction : quelle indexation ? </li></ul><ul><ul><li>Les outils humains (annuaires, signets…) </li></ul></ul><ul><ul><li>Les outils automatiques (moteurs de recherche, métamoteurs…) </li></ul></ul><ul><li>3 e distinction : quelle couverture ? </li></ul><ul><ul><li>Les outils généralistes ( Google , Yahoo ! , Exalead …) </li></ul></ul><ul><ul><li>Les outils spécialisés ( Google Scholar , Scirus , In-Extenso …) </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  10. 10. <ul><li>4 e distinction : les modalités de recherche de ces outils sur le Web </li></ul><ul><ul><li>La recherche par critères sur le plein texte (mono ou multicritères, ex : moteurs de recherche) </li></ul></ul><ul><ul><li>La navigation par arborescence ou hypertexte : l’utilisateur répond à des propositions (ex : annuaires) </li></ul></ul><ul><ul><li>La recherche basée sur une logique statistique / linguistique : prise en compte du sens et du contexte des termes de la requête </li></ul></ul><ul><ul><li>La recherche par associations de mots, d’objets (grâce aux ontologies, index, thésaurus) </li></ul></ul><ul><ul><li>La recherche par citations : part de l’hypothèse que si un document cite un autre document, alors implicitement il existe un lien entre les deux (ex : Pagerank de Google + Google Scholar) </li></ul></ul><ul><ul><li>La « sérendipité » : reproduit les mécanismes de la découverte scientifique, basés sur le hasard, l’intuition et l’association d’idées </li></ul></ul><ul><li> Aujourd’hui : hybridation des outils de recherche, mixité des fonctionnalités </li></ul>Bibliothèque Michel Serres : 4 mars 2008 Des outils de recherche nombreux et complexes (3/3)
  11. 11. <ul><li>Construire une véritable stratégie de recherche : </li></ul><ul><ul><li>Choisir les mots-clés et les expressions de recherche appropriés : </li></ul></ul><ul><ul><ul><li>S'aider de dictionnaires, encyclopédies ou thésaurus </li></ul></ul></ul><ul><ul><ul><li>Trouver les synonymes, faire attention à la polysémie </li></ul></ul></ul><ul><ul><ul><li>Traduire les termes en plusieurs langues </li></ul></ul></ul><ul><ul><li>Construire ses requêtes , utiliser les opérateurs booléens et les parenthèses pour combiner les mots-clés </li></ul></ul><ul><ul><li>Multiplier et confronter les sources , ne pas s’arrêter à un outil ! </li></ul></ul><ul><ul><li>Toujours consulter l’aide et utiliser le mode « recherche avancée» des outils </li></ul></ul><ul><ul><li>Restreindre ou élargir sa recherche , en utilisant de nouveaux termes qui sont apparus dans les premiers résultats de recherche </li></ul></ul><ul><ul><li>Vérifier et contrôler la véracité des sources : privilégier les sources officielles </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008 Quelques éléments de méthodologie de recherche (1/3)
  12. 12. <ul><li>Les opérateurs booléens, de proximité… </li></ul><ul><ul><li>Opérateur par défaut : opérateur booléen utilisé implicitement dans la recherche. Il peut varier selon l’outil (bien consulter l’aide) </li></ul></ul><ul><ul><li>ET/AND : les deux mots saisis apparaissent dans les résultats </li></ul></ul><ul><ul><li>OU/OR : l’un des deux mots ou les deux apparaissent dans les résultats </li></ul></ul><ul><ul><li>SAUF/NOT : le terme saisi ne doit pas apparaître </li></ul></ul><ul><ul><li>NEAR : les deux termes doivent apparaître l’un près de l’autre </li></ul></ul><ul><ul><li>Les guillemets : la recherche s’effectue sur l’expression exacte saisie entre guillemets </li></ul></ul><ul><ul><li>Troncatures et joker *, ?, $, ou + : la troncature finale « * » peut remplacer la fin d’un mot. Le caractère joker « ? » sert à remplacer un caractère et un seul au sein d’un mot (varie selon l’outil) </li></ul></ul><ul><ul><li>Consulter le comparatif des règles d’interrogation des moteurs Google, Yahoo et Exalead : http:// bibli . ec -lyon. fr /documents/comparatif_moteurs_recherche. pdf </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008 Quelques éléments de méthodologie de recherche (2/3)
  13. 13. Quelques éléments de méthodologie de recherche (3/3) <ul><li>Trois notions à retenir quant aux résultats de la recherche : </li></ul><ul><ul><li>Pertinence : «   adéquation entre une question posée et les réponses fournies lors de la recherche d'information ». </li></ul></ul><ul><ul><li>Le silence : « se définit par une perte d'information ; cette notion fait référence aux documents pertinents qui n’ont pas été retrouvés pendant le processus de recherche ». </li></ul></ul><ul><ul><li>Le bruit : «   ensemble de documents non pertinents trouvés en réponse à une question, lors d’une recherche d’information ». </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  14. 14. Annuaires et portails <ul><li>Spécialisés, thématiques ou généralistes : Sciseek (sciences), DMOZ l’Open Directory (généraliste, utilisé par Google) , Intute (ressources académiques)… </li></ul><ul><li>Indexation des sites faite par des professionnels selon une classification validée </li></ul><ul><li>Recherche par arborescence, navigation dans des catégories </li></ul><ul><li>Avantages : limitation du bruit, choix des informations, classement raisonné par catégories et sous-catégories. Recherche dans le web invisible. Outils qualitatifs. </li></ul><ul><li>Inconvénients : silence, moins d'exhaustivité et mise à jour moins rapide </li></ul><ul><li> A utiliser pour explorer un sujet , trouver des sites ressources dans un domaine ou des sites similaires. </li></ul>Bibliothèque Michel Serres : 4 mars 2008
  15. 15. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  16. 16. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  17. 17. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  18. 18. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  19. 19. « La folksonomie », vers des annuaires 2.0 ? (1/2) <ul><li>Folksonomie : combinaison des termes « folks » (usagers) et « taxinomie » (règle de classification) </li></ul><ul><li>Système s’appuyant sur les réseaux sociaux et l’intelligence collective , permettant aux utilisateurs (non initiés à l’indexation) de donner des indications de contenu aux ressources (sites web, signets, blogs, références bibliographiques…) qu’ils rencontrent, sous la forme de tags (mot-clés) </li></ul><ul><li>Esprit collaboratif , notion de partage , ouverture d’esprit, simplicité d’utilisation… </li></ul><ul><li>Exemples: </li></ul><ul><li>Signets partagés (social bookmarking) : del. icio .us , digg </li></ul><ul><li>Références bibliographiques partagées : Connotea , Citeulike </li></ul><ul><ul><li> Cf Atelier libre du 29/04/08 </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  20. 20. « La folksonomie », vers des annuaires 2.0 ? (2/2) <ul><li>Avantages : </li></ul><ul><ul><li>Permet un classement des ressources mais aussi une navigation et un accès à d'autres informations via les tags (par ex dans les blogs) </li></ul></ul><ul><ul><li>Fonctions innovantes de tri ou de classement et de visualisation : nuages de tags </li></ul></ul><ul><ul><li>Les tags sont plus précis et répondent mieux au vocabulaire et aux attentes des utilisateurs </li></ul></ul><ul><ul><li>Permet de parcourir des sources faisant partie du web invisible </li></ul></ul><ul><li>Inconvénients : </li></ul><ul><ul><li>Mots-clés détournés ou « Folks Bombing » </li></ul></ul><ul><ul><li>Problèmes de validité, de cohérence (doublons) et de pérennisation </li></ul></ul><ul><li> A utiliser pour : </li></ul><ul><ul><li>Un accès rapide à l’information </li></ul></ul><ul><ul><li>Pour mettre en place une veille en utilisant la technique de « tracking » (repérage de termes (tags) précis) qui consiste à suivre les ressources annotées avec un mot-clé (tag) précis </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  21. 21. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  22. 22. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  23. 23. Moteurs de recherche : le marché (1/4) <ul><li>Malgré une situation d’oligopole dans les usages ( Google , Yahoo , Live Search ) de nombreux moteurs de recherche existent : Exalead (fr), Ask , Lexxe (interrogation en langage naturel), Searchmash (moteur Web 2.0 de Google)… </li></ul><ul><li>Chacun d’eux offre des fonctionnalités différentes </li></ul><ul><li>Une adresse à retenir : http:// search . docinfos . com / </li></ul><ul><ul><li> comparatif des grands moteurs de recherche : Google, Live, Yahoo, Exalead, Ask, Seekport </li></ul></ul><ul><li>Succès de Google = interface épurée + taille de l’index + Pageranking </li></ul>Bibliothèque Michel Serres : 4 mars 2008
  24. 24. Moteurs de recherche : le marché (2/4) Source: http:// www . xitimonitor . com / fr - fr / barometre -des-moteurs/ barometre -des-moteurs-novembre-2007/index-1-1-6-113. html Bibliothèque Michel Serres : 4 mars 2008
  25. 25. Moteurs de recherche : fonctionnement (3/4) <ul><li>L'exploration ou crawl : </li></ul><ul><ul><li>le Web est systématiquement exploré par un robot (crawler, spider) qui suit tous les hyperliens et repère les ressources jugées intéressantes </li></ul></ul><ul><li>L'indexation : </li></ul><ul><ul><li>consiste à extraire et à enregistrer dans une base (sous la forme d’un gigantesque index) les mots considérés comme significatifs de chaque ressource repérée </li></ul></ul><ul><ul><li>permet au moteur de retrouver rapidement où se situe un terme significatif donné. Les termes non significatifs s'appellent des mots vides de sens (« de », « le »…) </li></ul></ul><ul><li>La recherche : </li></ul><ul><ul><li>correspond à la partie requête du moteur , restitue les résultats. Un algorithme est appliqué afin de présenter les résultats des recherches par ordre de pertinence </li></ul></ul><ul><li>L'algorithme tient généralement compte du contexte du mot-clé (titre, paragraphe, hyperlien...) et de la ressource elle-même (ressources liées, popularité du site...) </li></ul>Bibliothèque Michel Serres : 4 mars 2008
  26. 26. Moteurs de recherche (4/4) <ul><li>Inconvénients : </li></ul><ul><ul><li>Sélection automatique de l’information </li></ul></ul><ul><ul><li>Hétérogénéité des sources, des formats </li></ul></ul><ul><ul><li>Bruit documentaire , pertinence variable, publicités </li></ul></ul><ul><ul><li>Fonctionnalités variables selon les moteurs (utiliser les supports/aides) </li></ul></ul><ul><li>Avantages : </li></ul><ul><ul><li>Richesse de l’interrogation, recherche en texte intégral </li></ul></ul><ul><ul><li>Plus d' exhaustivité , mise à jour plus rapide </li></ul></ul><ul><ul><li>Rapidité , immédiateté </li></ul></ul><ul><li> A utiliser pour : </li></ul><ul><ul><li>Une première approche </li></ul></ul><ul><ul><li>Effectuer des recherches complexes (requêtes construites) </li></ul></ul><ul><ul><li>Repérer des sites récents </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  27. 27. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  28. 28. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  29. 29. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  30. 30. Métamoteurs de recherche (1/2) <ul><li>Permettent d’effectuer une requête dans plusieurs moteurs de recherche à la fois </li></ul><ul><li>Ils sont de deux types: </li></ul><ul><ul><li>Ceux qui intègrent et fusionnent les résultats obtenus , éliminent les doublons et classent les résultats par ordre de pertinence ou par catégorie </li></ul></ul><ul><ul><ul><li>Ex : Ixquick </li></ul></ul></ul><ul><ul><li>Ceux qui donnent les résultats en listes séparées selon le moteur interrogé </li></ul></ul><ul><ul><ul><li>Ex : GoshMe (spécialisé dans la recherche sur le web invisible) </li></ul></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  31. 31. Métamoteurs de recherche (2/2) <ul><li>Valeur ajoutée : ajouts de fonctionnalités innovantes (affichage et tri des résultats, sélection en amont…) </li></ul><ul><ul><li>KartOO fournit une représentation cartographique des résultats de la recherche </li></ul></ul><ul><li>Avantages : gain de temps et élargissement du champ de recherche </li></ul><ul><li>Inconvénients : pas de syntaxe commune, impossible d’utiliser les fonctionnalités avancées des moteurs de recherche </li></ul><ul><li> A utiliser pour : </li></ul><ul><ul><li>Débroussailler rapidement un sujet </li></ul></ul><ul><ul><li>Repérer les outils qui répondent le mieux à un sujet </li></ul></ul>Bibliothèque Michel Serres : 4 mars 2008
  32. 32. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  33. 33. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  34. 34. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  35. 35. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  36. 36. Et bien d’autres outils… Bibliothèque Michel Serres : 4 mars 2008
  37. 37. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  38. 38. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  39. 39. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  40. 40. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  41. 41. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  42. 42. Remplacer ce texte-ci par le votre si vous souhaitez utiliser la police Arial. Bibliothèque Michel Serres :: 12 décembre 2007
  43. 43. Pour aller plus loin <ul><li>Andrieu O. Abondance, &quot;Le&quot; site sur l'actualité des annuaires et des moteurs de recherche, http:// www .abondance. com / </li></ul><ul><li>Doc’Info. SearchEngines Matrix, comparer les fonctionnalités des différents moteurs de recherche. http:// search . docinfos . com / </li></ul><ul><li>Doc’INSA. Sentiers d'Accès et des Pistes de Recherche d'Informations Scientifiques et Techniques sur Internet , (maj 2007) http:// docinsa . insa -lyon. fr /sapristi/ </li></ul><ul><li>Formist, Ressources Electroniques Pour les Etudiants, la Recherche et l’Enseignement (maj 2007) http:// repere . enssib . fr </li></ul><ul><li>Lardy J.P. Recherche d'Information sur l'Internet , Urfist de Lyon, (maj 2002) http:// urfist . univ -lyon1. fr / risi /risi. htm </li></ul><ul><li>Serres, A. Panorama de la recherche d'information sur Internet , Urfist de Bretagne et Pays de Loire, (maj 2004) http:// www . uhb . fr / urfist /Supports/ EvolRechinfo /Rechinfo2_cadre. htm </li></ul><ul><li>Serres, A. Recherche d’information sur Internet : où en sommes-nous, où allons-nous ? SavoirCDI, juin 2004 http:// savoirscdi . cndp . fr / CulturePro /actualisation/Serres/Serres. htm </li></ul>Bibliothèque Michel Serres : 4 mars 2008

Notas do Editor

×