5. Vragen voor jullie
• Wie heeft Lucene wel eens gebruikt?
• SOLR?
Wednesday 6 November 13
6. Vragen voor jullie
• Wie heeft Lucene wel eens gebruikt?
• SOLR?
• Compass?
Wednesday 6 November 13
7. Vragen voor jullie
• Wie heeft Lucene wel eens gebruikt?
• SOLR?
• Compass?
• elasticsearch?
Wednesday 6 November 13
8. Vragen voor jullie
• Wie heeft Lucene wel eens gebruikt?
• SOLR?
• Compass?
• elasticsearch?
• waar komen de servernamen vandaan?
Wednesday 6 November 13
9. Wat is elasticsearch?
• full text search engine obv Lucene
• REST-api
• Distributed / High availability
• Document oriënted (nested maps)
Wednesday 6 November 13
12. BPO-register
• vinden van koopvaardijschepen met historie
• Hibernate Envers, Spring en Twitter
Bootstrap
• begonnen met Hibernate Search, vervangen
door elasticsearch
• géén clustering gebruikt
Wednesday 6 November 13
23. Analyzers
• index analyzer
• search analyzer
• _all is aparte analyzer (ipv per key)
• Inquisitor-plugin (demo)
Wednesday 6 November 13
24. Diakrieten
• instellen bij beide analyzers
• encoding van Spring
• encoding van EC2
• stackoverflow.com/questions/12016318/
Wednesday 6 November 13
25. Wildcard
• apart opgeven in query
• suffix-wildcard is ok
• prefix is traaaaag
• boosting werkt niet meer (in onderzoek)
• “rewrite” : “scoring_boolean”
Wednesday 6 November 13
29. Stop words
• a, an, and, are, as, at, be, but, by, for, if, in,
into, is, it, no, not, of, on, or, such, that, the,
their, then, there, these,they, this, to, was,
will, with
Wednesday 6 November 13
31. Sorteren
• “Can’t sort on string types with more than
one value per doc, or more than one token
per field”
• Voeg veld <veldnaam>.untouched toe
• http://bit.ly/wFd8CZ
Wednesday 6 November 13
34. Unit-test
• refresh na een update
• draai unit-test op andere poort/clusternaam
• codevoorbeeld
Wednesday 6 November 13
35. Sharding en scoring
• Default is score per shard bereken
• Cluster scores die dicht bij elkaar liggen en
ga dan sorteren
• dfs query then fetch (http://bit.ly/1cBRxMv)
Wednesday 6 November 13
36. Conclusie
• Snel aan de slag
• Even zoeken naar de goede documentatie
• Scoring snappen snel waardevol
Wednesday 6 November 13
39. elasticsearch in
de praktijk
Jeroen van Wilgenburg
www.jpoint.nl
@jvwilge
vanwilgenburg.wordpress.com
photo by ny156uk on Flickr
Wednesday 6 November 13