1. Module 2 Recherche efficace dans le Web L’@telier Espace Culture Multimédia. Médiathèque de Lorient Initiation à Internet 1 @telier – 2009
2. La recherche sur Internet Objectifs de la présentation : Découvrir les bases de la recherche sur Internet Utiliser les moteurs de recherche 2 @telier – 2009
3. Pourquoi Soit on connaît l’adresse d’un site que l’on peut avoir trouvée dans un magazine, et on la tape directement dans la barre d'adresse du navigateur, soit on accède au site en question par l'intermédiaire d'un lien trouvé sur un autre site, en général au contenu proche on fait appel à un outil de recherche 3 @telier – 2009
4. Définition : le moteur de recherche Selon le Journal Officiel Moteur de recherche : système d'exploitation de banque de données, et, par extension, serveur spécialisé permettant d'accéder sur la toile à des ressources (pages, sites, etc.) à partir de mots clés. 4 @telier – 2009
5. Annuaire ou moteur de recherche Un annuaire, répertoire Internet est un site Web proposant une liste classée de sites web. Le classement se fait typiquement dans une arborescence de catégories, censée couvrir tout ou partie des centres d’intérêt des visiteurs. Chaque catégorie contient : des sous-catégories concernant des aspects plus pointus d’un sujet donné et des liens agrémentés d’une description. Ces liens sont des URL pointant vers les ressources relatives à la catégorie dans laquelle elles ont été classées. 5 @telier – 2009
6. Moteur de recherche De façon complémentaire aux annuaires, les moteurs de recherche effectuent, un travail approfondi pour répertorier les pages à l'intérieur de ces sites. Un moteur de recherche sur le Web est constitué de "robots", spiders, crawlers ou agents qui parcourent les sites à intervalles réguliers et de façon automatique pour découvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrés sur chaque page atteinte. Chaque page identifiée est alors indexée dans une base de données. 6 @telier – 2009
7. Le principe en est simple : le service indexe au préalable, c'est-à-dire stocke et traite sur ses propres disques durs, un certain nombre de pages web. Cette indexation s'effectue en texte intégral, tous les mots contenus dans toutes les pages référencées devenant alors des index potentiels de recherche 7 @telier – 2009
8. Utiliser un moteur de recherche Un moteur de recherche est un « robot » qui indexe les pages Web en fonction de leur titre, de certains mots-clés ou de leur contenu complet, sans intelligence particulière. Il nous faut apprendre à effectuer des recherches efficaces afin de tirer le maximum de résultats pertinents et d'éviter les réponses redondantes ou peu concluantes. Le défi principal, lors de l'utilisation d'un moteur de recherche, repose sur le choix des mots-clés et de leur disposition. 8 @telier – 2009
9. Un outil ou des outils de recherche Il existe des centaines de moteurs qui collectent, regroupent et présentent l’information de différentes manières. Par exemple, « Google » range les résultats d’une recherche en fonction de l’importance et de la pertinence des sites trouvés; « Yahoo! » possède un répertoire qui permet des recherches par thèmes; « Kartoo » classe les différents sites trouvés à l’intérieur de catégories sélectionnées à partir de mots ou de phrases contenus dans les résultats de leur recherche. Un moteur peut donc être mieux adapté qu’un autre à tel ou tel type de recherche. 9 @telier – 2009
14. @telier – 2009 14 Bing, le nouveau moteur de recherche de Microsoft
15. Comment ça marche ? Les descriptions des pages et les mot-clés contenus dans ces pages, quand elles sont présentes, ne sont pas visibles par l'internaute. Ce sont des informations cachés, introduites dans le code HTML de la page par l'auteur de la page, et uniquement destinées pour leur indexation par les moteurs de recherches. Dans l'exemple qui suit, on retrouve le titre, les mot-clés (Keywords), et la description d’une page d'accueil du site 15 @telier – 2009
16. Codes sources d’un page : le moteur collecte les mots-clés permettant son indexation Déportation et camps </title> <!-- #EndEditable --> <meta NAME="Description" CONTENT="Mémoire Net est consacré à la mémoire locale lié à la 2eme guerre mondiale, à la Résistance et à la déportation dans le Rhône sur les cantons de Mornant et Givors. Témoignages d'Anciens Combattants et Déportés."> <meta name="keywords" content="Résistance, déportation, déportés, deportes, deportation, resistance, mémoire, locale, patrimoine, cmap, extermination,1939 -1944 -1945,Mémoire, terezin, lidice, lyon, rhône-alpes,Givors, Résistance, resistance, deportes, maquis, résistants, camps, mauthausen, auschwitz, ravensbruxk, extermination, antisémitisme, guerre, combat, mornant, givors, bombardements,Déportation, Auschwitz, Terezin, Forces Françaises Libres, FFI, maquis, maquisards, résistants, déportés, antisémitisme, juifs, mauthausen, buchenwald, auschwitz, ravensbrück, spahis, France, mémoire, déportation, Resistance, Memoire, Deportation, Déportation, éducation, histoire,2ème guerre, Concours scolaire, camps, extermination, guerre, XX eme sicle, Mémoire Net, memoire net, Mornant, Rhône, concours résistance, maquis, extermination, pologne, allemand, guerre, xx siècle, memoire, locale, patrimoine, camp, résistance, déportation, france"> <meta NAME="Robots" CONTENT="index, follow, all, NOARCHIVE"> <meta NAME="Author" CONTENT="Evelyne Py"> <meta NAME="Identifier-URL" CONTENT="http://www.memoire-net.org"> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> <link rel="stylesheet" href="stylemem.css" type="text/css"> <style> BODY 16 @telier – 2009
17. L'utilisateur dans la pratique saisit des mots clés Le moteur va rechercher les occurrences de ces mots dans les pages sources et affiche ensuite celles qui lui semblent les plus pertinentes (selon un algorithme de classement qui lui est propre). 17 @telier – 2009
18. Donc, quel outil pour quelle recherche ? Les portails généralistes ou thématiques ...quand la recherche est ciblée sur un domaine : Exemples : pour la Bretagne : breizhoo sur les questions administratives : service-public.fr pour le cinéma : Internet Movie Database en anglais 18 @telier – 2009
19. Quel outil pour quelle recherche ? On peut aussi trouver des informations sur les Encyclopédies gratuites et les dictionnaires : l'encyclopédie coopérative Wikipedia le quid 19 @telier – 2009
20. Quel outil pour quelle recherche ? Les annuaires et moteurs de recherche Le site de référence est « abondance » dans la description des principaux annuaires et moteurs de recherche ( http://www.abondance.com/) Exemples d’annuaires : breizhoo ,nomade , babygo (pour les enfants ) 20 @telier – 2009
21. Quel outil pour quelle recherche ? les moteurs : l'indexation est automatique, les moteurs parcourent les pages du web régulièrement => google, google scholar, exalead les métamoteurs utilisent plusieurs moteurs de recherche => kartoo ,clusty , webcrawler, ixquick pour en savoir plus : allez sur la page du site intelligence center (http://c.asselin.free.fr/french/metamoteurs.htm ) 21 @telier – 2009
22. Quel outil pour quelle recherche ? Globalement quand on veut explorer un sujet il vaut mieux utiliser les thèmes et sous-thèmes d'un annuaire, utiliser les encyclopédies... et les rayons des bibliothèques quand on a une question très précise on peut utiliser les moteurs de recherche ou les métamoteurs (en rédigeant bien sa requête). 22 @telier – 2009
24. Règles de saisie : formuler un ensemble de mots précis Les moteur de recherches ne reconnaissent pas le langage naturel. Ils fonctionnent par mots clés => comparer mediatheque lorient et lorient mediatheque dans un moteur de recherche ( selon la position du terme l’axe de recherche est différent ) la casse (minuscule majuscule) pour certains outils il n'y a pas de différence et pour d'autres non => tapez ibm ou IBM (sur google, exalead) 24 @telier – 2009
25.
26. Une recherche avancée Les opérateurs booléens : ET AND : les sites contiennent les deux termes OU OR : les sites contiennent l'un ou l'autre des termes SAUF AND NOT : les sites contiennent le premier terme et pas le 2ème PRES NEAR : les sites contenant les termes rapprochés Les moteurs proposent des modules de recherche avancé : pour google : c'est une page accessible ici pour exalead il faut ouvrir une petite fenêtre 26 @telier – 2009
27. Signes mathématiques et recherche d'une expression Vous pouvez utiliser le signe + dans une requête pour indiquer que vous souhaitez faire figurer le mot clé dans la recherche. De même, utilisez le signe -pour exclure un terme de la recherche. On utilise les guillemets "..."pour rechercher une expression. 27 @telier – 2009
29. Choisir parmi les résultats Filtrer ses résultats avec google : se limiter aux pages francophones, aux pages France : cocher le point qui convient filtrer les résultats : aller sur google préférences : "la fonction SafeSearch interdit m'affichage dans les résultats de pages Web à contenu sexuellement explicite". 29 @telier – 2009
30. Choisir parmi les résultats Sur la liste, les noms de domaine d'un site se termine par un .fr un .com. Ces extensions peuvent donner des indications géographiques : .fr : site français .ca : site canadien .be : site belge .ch : site suisse de domaine d'activité (mais ce n'est pas une règle exacte) .com : commercial, communication .org : associatif, à but non lucratif .edu : éducation 30 @telier – 2009
32. Cas pratique Vous cherchez des informations sur Charlotte Gainsbourg mais pas sur son père Serge Gainsbourg. Tapez Gainsbourg AND NOT Serge. Vous aurez tous les sites dans lesquels apparaît le mot Gainsbourg mais pas ceux qui parlent de Serge. 32 @telier – 2009
36. Conseil No 1 Utilisez de six à huit mots-clés, de préférence des noms. La plupart des internautes n’utilisent qu’un ou deux mots, trop peu pour une recherche efficace. Évitez les verbes et utilisez des adjectifs ou autres mots s’ils contribuent à mieux définir un nom. Par exemple, tapez « fromage feta » plutôt que simplement « fromage ». 36 @telier – 2009
37. Conseil No 2 Réunissez plusieurs mots-clés à l’intérieur de guillemets pour en faire une phrase, comme « système solaire ». La plupart des moteurs de recherche traiteront l’expression au complet et non chaque mot séparément, système et solaire. 37 @telier – 2009
38. « entre guillemets » Moteurs de recherche Puis « Moteurs de recherche » ( c’est-à-dire : l’expression entre guillemets ) *** Y a-t-il une différence dans les résultats? 38 @telier – 2009
39. Conseil No 3 La plupart des moteurs de recherche ne font pas la distinction entre majuscules et minuscules. Pour les recherches générales, il est toutefois préférable d'utiliser des lettres minuscules. Tous les moteurs de recherche ne traitent pas les signes de ponctuation de la même façon. 39 @telier – 2009
40. Conseil No 4 « and » ou « + » entre deux mots-clés signifient : « Je veux seulement les documents qui contiennent ces deux mots ou tous les mots. » « or » entre deux mots-clés signifie : « Je veux les documents qui contiennent l’un de ces deux mots, peu importe lequel. » « not » ou « - » signifient : « Je veux les documents qui contiennent le premier mot, à condition qu’ils ne contiennent pas le second. » Exemple : « adolescents and not sexe ». L’expression « and not » ne s’applique qu’au mot ou à la phrase qui suit immédiatement. 40 @telier – 2009
41. Conseil No 5 Une fois l’information trouvée, vérifiez son exactitude en consultant au moins trois autres sites indépendants qui devraient la confirmer. On appelle cela la méthode du triangle. 41 @telier – 2009
43. Autres petits détails Éliminez tous les pronoms (elle, quel), que les moteurs de recherche considèrent redondants. Retenez 6 à 8 mots (maximum recommandé). En moyenne, la plupart des utilisateurs soumettent 1,5 mot, ce qui n'est pas suffisant. Essayez d'éviter les verbes d'action et n'utilisez des adjectifs que s'ils aident à définir l'objet de votre recherche (comme dans planète bleue). 43 @telier – 2009
44. define Dans une recherche avec Google, l’utilisation de define: placé juste avant un mot ordonne de rechercher les sites contenant une définition du mot, ainsi que l’adresse du lien Internet où se trouve cette définition. 44 @telier – 2009
45. filetype Moteurs de recherche filetype:ppt Moteurs de recherche filetype:pdf Moteurs de recherche filetype:doc L’utilisation de l’opérateur filetype:suivi d’un type de format limite les résultats aux adresses Internet contenant un document dans le format précisé 45 @telier – 2009
48. fonction calculatrice intégrée 2 * 5 - 4 28 * 5 / 10 + 2 Si vous souhaitez utiliser la fonction calculatrice intégrée de Google, il vous suffit d’entrer la formule que vous désirez exécuter dans le champ de recherche, appuyer sur la touche Entrée ou cliquer sur le bouton Recherche Google. La calculatrice peut exécuter des formules mathématiques en arithmétique simple (5+2*2 ou 2^20) ou plus compliquées (e^(i pi)+1) 48 @telier – 2009
50. Les Alertes Google sont envoyées par courrier électronique quand des articles publiés en ligne correspondent aux sujets que vous indiquez. http://www.google.fr/alerts 50 @telier – 2009
58. Mais, aucun des moteurs (ni même des annuaires) necouvre la totalité du web, mais beaucoup offrent des indexes très larges. Bonne recherche! 54 @telier – 2009
59. Petits exercices Exercice sur google, trouvez le titre de la chanson qui contient les paroles Chérie je t'aime, chérie je t'adore , comparer les premiers résultats avec : chateau de versailles et "chateau de versailles" New York et "New York" 55 @telier – 2009
60.
61. Exemples pratiques (2) 3e essai : Jean-François Millet => nombre de pages trouvées ? 4e essai Angelus => nombre de pages trouvées ? 5e essai Angelus Millet => nombre de pages trouvées ? Autre approche : peinture angelus Millet ************* "Googliser quelqu'un" écrire votre nom avec et sansles« » sur google, exalead , est-ce bien vous dans les réponses ? 57 @telier – 2009