2. PROGRAMMA
Wie ben ik
Wat verwachten we van een zoekmachine?
Andere oplossingen
Wat biedt Solr?
Drupal integratie
Demo
Taal: belangrijk!
Extend de basis
3. WIE BEN IK?
Jur de Vries
Developer bij en mede-oprichter van Triquanta
Mede-organisator Drupal Tech Talk
Gespecialiseerd in Solr samen met Drupal
Sites gebaseerd op Solr
Nationale ombudsman
Maastrichtnet
Gemeentemuseum: zoekmachine MuS
Migraties, custom modules, koppelingen etc.
4. WAT VERWACHTEN WE (JULLIE) VAN
EEN ZOEKMACHINE
Veel (alles) wat google biedt:
Autocomplete
Spellings suggesties
Goede relevantie
Ranges (afgelopen jaar)
Snelheid!
Facets
Stemming
...
6. GOOGLE
Google site search
Betaald (vanaf $100,-- per jaar)
Makkelijk op te zetten
Google technology!
Google Search Appliance
Betaald (hoeveel??)
Indexeert bijna alles
Google technology! (Dat kent de bezoeker!)
Mooie gele doos :-)
9. Stel je wilt een auto voor boodschappen...
Caterpillar maakt goede trucks...
10. Maar maken ze ook goede boodschappen auto's?
Kleine boodschappen???
11. NADELEN GOOGLE
Wat voor groot werkt, werkt niet altijd voor klein
Geoptimaliseerd voor het hele web!
Duur
Weinig instelmogelijkheden
Wat gebeurt er onder de motorkap???
We waren toch Open Source?
13. OP LUCENE GEBASEERDE OPLOSSINGEN
Lucene is de zoekmachine waarop Solr draait!
Apache Nutch
Google-achtig: webpagina's
Niet geschikt voor ons doel
Elastic search
Gelijkwaardig aan Solr
16. WAT IS SOLR?
Gebaseerd op Lucene
Apache LuceneTM is a high-performance, full-featured text search engine library written
entirely in Java. It is a technology suitable for nearly any application that requires full-
text search, especially cross-platform.
Draait in java servlet container, bijvoorbeeld tomcat of jetty.
Rest interface
17. WAT KAN SOLR
Snel zoeken
Near realtime indexing
Result highlighting
Facets
Spellings suggestions (did you mean?)
Autocomplete
Search in files (met Apache Tika)
Stemming
Geospatial search
More like this
Relevantie tweaking!
21. DRUPAL SOLR INTERACTIE
Drupal zend entities naar Solr
Solr indexeert entity (node)
Drupal doet zoekvraag naar Solr via GET
Solr zend resultaten terug naar Drupal (json, xml, php)
Drupal parsed resultaten en geeft weer
22. INSTALLATIE
Download solr (4) van http://lucene.apache.org/solr/ (NIET DE SOURCE)
Download de apachesolr module (of search api met search api solr)
Pak solr uit
Kopieer de configuratie bestanden vanuit de apachsolr module naar:
Enable de module
25. TAAL
Wat was stemming ook alweer?
In welke taal gebeurt dit???
En wat doen we met woorden als de, het en een??
We moeten de configuratie van Solr aanpassen!
26. Schrik niet, valt mee!
Slechts 2 regels...
Schema.xml
MAAR WORDT BIJNA ALTIJD
VERGETEN!!!
30. RELEVANTIE 2
Solr biedt meer mogelijkheden tot relevantie tweaking:
Specifieke documenten bovenaan
Boost functions
Boost queries
Specifieke ranking parameters
Met kennis van Solr relatief simpel aan te passen
31. EXTEND SOLR MET
ANDER CONTRIBS
Documenten doorzoeken: Apache Solr Attachments
Door meerdere site zoeken: Apache Solr Multisite search
Geospatial search: Apache Solr Location
Autocomplete: Apache Solr Autocomplete