O documento descreve a implementação de um sistema de busca avançada para resumos de currículos (CVs) no site Stack Overflow Careers. O sistema usa tags para indexar os CVs no Elasticsearch e permite buscas complexas através da linguagem CQL, melhorando significativamente a velocidade e relevância das buscas por candidatos.
1. EXTRAÇÃO DE INFORMAÇÃO NO
STACKOVERFLOW CAREERS
Roberta Arcoverde / @rla4
.Net Architects Days 2014
2. /WHOIS ROBERTA
recifense
cientista da computação, UFPE, 2008
mestre em informática, PUC-Rio, 2012
participante do DNA desde 2008
developer, Radix, 2010-2014
full-stack web developer, Stack Exchange, 2014
1a mulher palestrando no DNAD :O :O :O
3. começou em 2008
3MM usuários registrados
50MM visitantes únicos por mês
2000-3000 hits por segundo
top 50 sites mais acessados do mundo*
*segundo o Alexa. sei lá se é verdade. deve ser.
9. TAG ENGINE FOR THE RESCUE!
Perguntas no StackOverflow são associadas a tags
Mesma ideia aplicada ao Careers, mas ao invés de perguntas e
respostas, taggeamos CVs!
10. NEM SÓ DE TAG VIVE O CANDIDATO
1. Como buscar por OSS? E por empregador?
2. Mike and also Michael?
3. Google and not Google?
4. Por que este candidato foi retornado na minha busca?
19. CQL
Boolean queries
(c# or java) and not manager
Operadores específicos
education:(Stanford, MIT, Xavier's School for Gifted Yougsters)
Include/exclude
ex:students,remote
24. CQL
(c# or java) and
employer:microsoft
TERM QUERY
"query":"((c# OR java)
AND
experienceName:microsoft)"
exclude:student
"must":["term": {
"isStudent": { "value":
"false" }} ]