SlideShare uma empresa Scribd logo
1 de 31
Krijgen we ooit de beschikking over slimme zoektechnologie? Suzan Verberne  Information Foraging Lab, Radboud University Nijmegen Congres Kennis in Praktijk, 17 juni 2010 – WTC Rotterdam
Zoeken met Google
Zoeken met Google
Zoeken met Google
Hoe werkt Google? Index Relevantie-formule zoekvraag
De relevantie-formule van Google gebruikt: Het aantal voorkomens van de woorden uit de zoekvraag in de webpagina. Positie van de zoekwoorden in de webpagina (titel, URL): “Noord/Zuidlijn – HOME” Woorden die minder vaak in de index voorkomen wegen zwaarder dan woorden die heel vaak voorkomen: ‘de’ vs. ‘noord-zuidlijn’ Populariteit van de webpagina (aantal links, aantal kliks): wikipedia.org, amsterdam.nl, nrc.nl Hoe werkt Google?
Hoe werkt Google?
Meer specifieke informatie: Hoe gaat de noord-zuidlijn lopen? Wanneer is begonnen met de aanleg ervan? Verbanden, analyses en sentimenten: Wie was betrokken bij de besluitvorming rond de noord-zuidlijn? Welke partijen waren voor en welke waren tegen? Wat waren de argumenten voor en tegen? Hoe hebben de media gereageerd? Beperkingen van Google
Beperkingen van Google
Beperkingen van Google
Verschillende typen van zoeken
Zoeken met een volledige vraag: “wanneer is de aanleg van de noord-zuidlijn begonnen?” Zoekvraag is specifiek, antwoord is exact. Type antwoord dat de gebruiker verwacht, is expliciet in de vraag aangegeven: wanneer  jaartal/datum waar  plaats Het systeem gebruikt taalkundige intelligentie om het antwoord te vinden. Question Answering
Question Answering Index Ranking-formule zoekvraag Antwoordtype Lijst van mogelijke antwoorden Antwoorden extraheren Documenten oktober 1999 9 oktober 2002 april 2003
Voorbeeld: Joost (Nederlands) http://www.let.rug.nl/~tiedeman/joost/ “In welk jaar won Feyenoord de Europacup?” “Wat is de hoofdstad van Spanje?” “Hoe hoog is de Euromast?” Question Answering
Joost
Joost
Joost
Voorbeeld: Lexxe (Engels) http://www.lexxe.com/ “how tall is the euromast?” “who is the mayor of rotterdam?” “when was the north south line in amsterdam constructed?” Question Answering
Lexxe
Lexxe
Lexxe
Onderzoekend, interactief Toepassingen voor specifieke domeinen: biomedisch, patenten Kost de gebruiker veel tijd en moeite Maar: de precisie van het resultaat kan heel exact bepaald worden. Text Mining
Drie onderdelen: Zoeken: in een grote database worden documenten gevonden die over het gezochte onderwerp gaan. Analyseren: (delen van) de gevonden documenten worden door het systeem gecategoriseerd en geanalyseerd op relevante informatie.  Presentatie: gestructureerde teksten worden aan de gebruiker gepresenteerd. Specifieke informatie die gevraagd is wordt apart getoond. Text Mining
Voorbeeld: PHASAR http://twoquid.cs.ru.nl/phasar/applet.html ‘aspirin’ ‘aspirin ?’ ‘aspirin causes ?’ ‘aspirin causes ? damage’ ‘aspirin causes mucosal damage’ Text Mining
PHASAR
PHASAR
PHASAR
PHASAR
PHASAR
Krijgen we ooit de beschikking over slimme zoektechnologie? Ja, door wetenschappers wordt voor veel soorten zoekproblemen technologie ontwikkeld. Die wetenschappers zijn afhankelijk van externe financiering en gebruikers die aangeven wat ze willen en wat ze nodig hebben om deze technologie echt commercieel bruikbaar te maken. Conclusies
Bedankt!

Mais conteúdo relacionado

Semelhante a Krijgen we ooit de beschikking over slimme zoektechnologie?

semantischzoeken-2013.ppt
semantischzoeken-2013.pptsemantischzoeken-2013.ppt
semantischzoeken-2013.pptvoginip
 
Nieuwe concepten in de wereld van zoektechnologie
Nieuwe concepten in de wereld van zoektechnologieNieuwe concepten in de wereld van zoektechnologie
Nieuwe concepten in de wereld van zoektechnologieErik Oltmans
 
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Eric Sieverts
 
Sheetsworkshopinternetbeginners
SheetsworkshopinternetbeginnersSheetsworkshopinternetbeginners
SheetsworkshopinternetbeginnersBJ@COM
 
Sheetsworkshopinternetvervolg
SheetsworkshopinternetvervolgSheetsworkshopinternetvervolg
SheetsworkshopinternetvervolgBJ@COM
 
AwesomRUs: CHI report 1
AwesomRUs: CHI report 1AwesomRUs: CHI report 1
AwesomRUs: CHI report 1guest3ff464b
 
Workshop literatuur zoeken - Pedagogisch Technische Hogeschool
Workshop literatuur zoeken - Pedagogisch Technische HogeschoolWorkshop literatuur zoeken - Pedagogisch Technische Hogeschool
Workshop literatuur zoeken - Pedagogisch Technische HogeschoolJeroen van Beijnen
 
Semantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstestSemantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstestvoginip
 
40 jaar informatiegebruik
40 jaar informatiegebruik40 jaar informatiegebruik
40 jaar informatiegebruikEric Sieverts
 
Internet services voor stamboomonderzoekers
Internet services voor stamboomonderzoekersInternet services voor stamboomonderzoekers
Internet services voor stamboomonderzoekersBob Coret
 
Presentatie Dirk Roorda E4DS (onderzoeker)
Presentatie Dirk Roorda E4DS (onderzoeker)Presentatie Dirk Roorda E4DS (onderzoeker)
Presentatie Dirk Roorda E4DS (onderzoeker)Rene van Horik
 
Onderweg Naar Enschede 2.0 25 Aug 2009
Onderweg Naar Enschede 2.0 25 Aug 2009Onderweg Naar Enschede 2.0 25 Aug 2009
Onderweg Naar Enschede 2.0 25 Aug 2009Present Media
 
Sw4 cursusoverzicht
Sw4 cursusoverzichtSw4 cursusoverzicht
Sw4 cursusoverzichtokeee
 
Sw cursusoverzicht
Sw cursusoverzichtSw cursusoverzicht
Sw cursusoverzichtokeee
 

Semelhante a Krijgen we ooit de beschikking over slimme zoektechnologie? (20)

semantischzoeken-2013.ppt
semantischzoeken-2013.pptsemantischzoeken-2013.ppt
semantischzoeken-2013.ppt
 
Nieuwe concepten in de wereld van zoektechnologie
Nieuwe concepten in de wereld van zoektechnologieNieuwe concepten in de wereld van zoektechnologie
Nieuwe concepten in de wereld van zoektechnologie
 
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
 
Find the Expert
Find the ExpertFind the Expert
Find the Expert
 
Full presentation LOD Masterclass ESI HHS PZH Kadaster
Full presentation LOD Masterclass ESI HHS PZH KadasterFull presentation LOD Masterclass ESI HHS PZH Kadaster
Full presentation LOD Masterclass ESI HHS PZH Kadaster
 
Find the Expert
Find the ExpertFind the Expert
Find the Expert
 
Sheetsworkshopinternetbeginners
SheetsworkshopinternetbeginnersSheetsworkshopinternetbeginners
Sheetsworkshopinternetbeginners
 
Les 3 future newsmedia
Les 3   future newsmediaLes 3   future newsmedia
Les 3 future newsmedia
 
Sheetsworkshopinternetvervolg
SheetsworkshopinternetvervolgSheetsworkshopinternetvervolg
Sheetsworkshopinternetvervolg
 
AwesomRUs: CHI report 1
AwesomRUs: CHI report 1AwesomRUs: CHI report 1
AwesomRUs: CHI report 1
 
Workshop literatuur zoeken - Pedagogisch Technische Hogeschool
Workshop literatuur zoeken - Pedagogisch Technische HogeschoolWorkshop literatuur zoeken - Pedagogisch Technische Hogeschool
Workshop literatuur zoeken - Pedagogisch Technische Hogeschool
 
Semantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstestSemantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstest
 
Utrecht
UtrechtUtrecht
Utrecht
 
40 jaar informatiegebruik
40 jaar informatiegebruik40 jaar informatiegebruik
40 jaar informatiegebruik
 
Roeland Kok over SEO
Roeland Kok over SEORoeland Kok over SEO
Roeland Kok over SEO
 
Internet services voor stamboomonderzoekers
Internet services voor stamboomonderzoekersInternet services voor stamboomonderzoekers
Internet services voor stamboomonderzoekers
 
Presentatie Dirk Roorda E4DS (onderzoeker)
Presentatie Dirk Roorda E4DS (onderzoeker)Presentatie Dirk Roorda E4DS (onderzoeker)
Presentatie Dirk Roorda E4DS (onderzoeker)
 
Onderweg Naar Enschede 2.0 25 Aug 2009
Onderweg Naar Enschede 2.0 25 Aug 2009Onderweg Naar Enschede 2.0 25 Aug 2009
Onderweg Naar Enschede 2.0 25 Aug 2009
 
Sw4 cursusoverzicht
Sw4 cursusoverzichtSw4 cursusoverzicht
Sw4 cursusoverzicht
 
Sw cursusoverzicht
Sw cursusoverzichtSw cursusoverzicht
Sw cursusoverzicht
 

Mais de Leiden University

‘Big models’: the success and pitfalls of Transformer models in natural langu...
‘Big models’: the success and pitfalls of Transformer models in natural langu...‘Big models’: the success and pitfalls of Transformer models in natural langu...
‘Big models’: the success and pitfalls of Transformer models in natural langu...Leiden University
 
Text mining for health knowledge discovery
Text mining for health knowledge discoveryText mining for health knowledge discovery
Text mining for health knowledge discoveryLeiden University
 
Text Mining for Lexicography
Text Mining for LexicographyText Mining for Lexicography
Text Mining for LexicographyLeiden University
 
'Het nieuwe zoeken' voor informatieprofessionals
'Het nieuwe zoeken' voor informatieprofessionals'Het nieuwe zoeken' voor informatieprofessionals
'Het nieuwe zoeken' voor informatieprofessionalsLeiden University
 
Automatische classificatie van teksten
Automatische classificatie van tekstenAutomatische classificatie van teksten
Automatische classificatie van tekstenLeiden University
 
Summarizing discussion threads
Summarizing discussion threadsSummarizing discussion threads
Summarizing discussion threadsLeiden University
 
Automatische classificatie van teksten
Automatische classificatie van tekstenAutomatische classificatie van teksten
Automatische classificatie van tekstenLeiden University
 
Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?
Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?
Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?Leiden University
 
RemBench: A Digital Workbench for Rembrandt Research
RemBench: A Digital Workbench for Rembrandt ResearchRemBench: A Digital Workbench for Rembrandt Research
RemBench: A Digital Workbench for Rembrandt ResearchLeiden University
 
Collecting a dataset of information behaviour in context
Collecting a dataset of information behaviour in contextCollecting a dataset of information behaviour in context
Collecting a dataset of information behaviour in contextLeiden University
 
Search engines for the humanities that go beyond Google
Search engines for the humanities that go beyond GoogleSearch engines for the humanities that go beyond Google
Search engines for the humanities that go beyond GoogleLeiden University
 

Mais de Leiden University (14)

‘Big models’: the success and pitfalls of Transformer models in natural langu...
‘Big models’: the success and pitfalls of Transformer models in natural langu...‘Big models’: the success and pitfalls of Transformer models in natural langu...
‘Big models’: the success and pitfalls of Transformer models in natural langu...
 
Text mining for health knowledge discovery
Text mining for health knowledge discoveryText mining for health knowledge discovery
Text mining for health knowledge discovery
 
Text Mining for Lexicography
Text Mining for LexicographyText Mining for Lexicography
Text Mining for Lexicography
 
'Het nieuwe zoeken' voor informatieprofessionals
'Het nieuwe zoeken' voor informatieprofessionals'Het nieuwe zoeken' voor informatieprofessionals
'Het nieuwe zoeken' voor informatieprofessionals
 
kanker.nl & Data Science
kanker.nl & Data Sciencekanker.nl & Data Science
kanker.nl & Data Science
 
Automatische classificatie van teksten
Automatische classificatie van tekstenAutomatische classificatie van teksten
Automatische classificatie van teksten
 
Tutorial on word2vec
Tutorial on word2vecTutorial on word2vec
Tutorial on word2vec
 
Computationeel denken
Computationeel denkenComputationeel denken
Computationeel denken
 
Summarizing discussion threads
Summarizing discussion threadsSummarizing discussion threads
Summarizing discussion threads
 
Automatische classificatie van teksten
Automatische classificatie van tekstenAutomatische classificatie van teksten
Automatische classificatie van teksten
 
Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?
Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?
Leer je digitale klanten kennen: hoe zoeken ze en wat vinden ze?
 
RemBench: A Digital Workbench for Rembrandt Research
RemBench: A Digital Workbench for Rembrandt ResearchRemBench: A Digital Workbench for Rembrandt Research
RemBench: A Digital Workbench for Rembrandt Research
 
Collecting a dataset of information behaviour in context
Collecting a dataset of information behaviour in contextCollecting a dataset of information behaviour in context
Collecting a dataset of information behaviour in context
 
Search engines for the humanities that go beyond Google
Search engines for the humanities that go beyond GoogleSearch engines for the humanities that go beyond Google
Search engines for the humanities that go beyond Google
 

Krijgen we ooit de beschikking over slimme zoektechnologie?

  • 1. Krijgen we ooit de beschikking over slimme zoektechnologie? Suzan Verberne Information Foraging Lab, Radboud University Nijmegen Congres Kennis in Praktijk, 17 juni 2010 – WTC Rotterdam
  • 5. Hoe werkt Google? Index Relevantie-formule zoekvraag
  • 6. De relevantie-formule van Google gebruikt: Het aantal voorkomens van de woorden uit de zoekvraag in de webpagina. Positie van de zoekwoorden in de webpagina (titel, URL): “Noord/Zuidlijn – HOME” Woorden die minder vaak in de index voorkomen wegen zwaarder dan woorden die heel vaak voorkomen: ‘de’ vs. ‘noord-zuidlijn’ Populariteit van de webpagina (aantal links, aantal kliks): wikipedia.org, amsterdam.nl, nrc.nl Hoe werkt Google?
  • 8. Meer specifieke informatie: Hoe gaat de noord-zuidlijn lopen? Wanneer is begonnen met de aanleg ervan? Verbanden, analyses en sentimenten: Wie was betrokken bij de besluitvorming rond de noord-zuidlijn? Welke partijen waren voor en welke waren tegen? Wat waren de argumenten voor en tegen? Hoe hebben de media gereageerd? Beperkingen van Google
  • 12. Zoeken met een volledige vraag: “wanneer is de aanleg van de noord-zuidlijn begonnen?” Zoekvraag is specifiek, antwoord is exact. Type antwoord dat de gebruiker verwacht, is expliciet in de vraag aangegeven: wanneer  jaartal/datum waar  plaats Het systeem gebruikt taalkundige intelligentie om het antwoord te vinden. Question Answering
  • 13. Question Answering Index Ranking-formule zoekvraag Antwoordtype Lijst van mogelijke antwoorden Antwoorden extraheren Documenten oktober 1999 9 oktober 2002 april 2003
  • 14. Voorbeeld: Joost (Nederlands) http://www.let.rug.nl/~tiedeman/joost/ “In welk jaar won Feyenoord de Europacup?” “Wat is de hoofdstad van Spanje?” “Hoe hoog is de Euromast?” Question Answering
  • 15. Joost
  • 16. Joost
  • 17. Joost
  • 18. Voorbeeld: Lexxe (Engels) http://www.lexxe.com/ “how tall is the euromast?” “who is the mayor of rotterdam?” “when was the north south line in amsterdam constructed?” Question Answering
  • 19. Lexxe
  • 20. Lexxe
  • 21. Lexxe
  • 22. Onderzoekend, interactief Toepassingen voor specifieke domeinen: biomedisch, patenten Kost de gebruiker veel tijd en moeite Maar: de precisie van het resultaat kan heel exact bepaald worden. Text Mining
  • 23. Drie onderdelen: Zoeken: in een grote database worden documenten gevonden die over het gezochte onderwerp gaan. Analyseren: (delen van) de gevonden documenten worden door het systeem gecategoriseerd en geanalyseerd op relevante informatie. Presentatie: gestructureerde teksten worden aan de gebruiker gepresenteerd. Specifieke informatie die gevraagd is wordt apart getoond. Text Mining
  • 24. Voorbeeld: PHASAR http://twoquid.cs.ru.nl/phasar/applet.html ‘aspirin’ ‘aspirin ?’ ‘aspirin causes ?’ ‘aspirin causes ? damage’ ‘aspirin causes mucosal damage’ Text Mining
  • 30. Krijgen we ooit de beschikking over slimme zoektechnologie? Ja, door wetenschappers wordt voor veel soorten zoekproblemen technologie ontwikkeld. Die wetenschappers zijn afhankelijk van externe financiering en gebruikers die aangeven wat ze willen en wat ze nodig hebben om deze technologie echt commercieel bruikbaar te maken. Conclusies