SlideShare uma empresa Scribd logo
1 de 14
Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com
cosicas que sí deberías saber ya buscador ligero y rápido fácil de integrar en rails gracias a thinking sphinx permite búsquedas por texto libre permite usar comodines permite buscar y ordenar por atributos permite usar grupos y facetas permite buscar por geoposición
cosicas que voy a contar (por encima) ciclo de indexado / ciclo de búsqueda spa / spi / sph / spd / spm / spp búsquedas extendidas, pesos y ordenaciones  excerpts charsets, stemmers, stopwords, excepciones  deltas / index merge / indexar en tiempo real indexando ficheros (texto y xml) performance: extern / hitless/ distribuir el índice modificando thinking sphinx
indexado / búsqueda sql_query_pre sql_query sql_query_post sql_query_post_index sql_ranged_throttle sql_query_info
ficheros spa:  attributes spd:  doc ID <=> word ID sph:  headers  spi:  word <=> word ID spk:  kill list spm:  MVA spp:  hits sps:  string attributes
extended search OR | val AND & val NOT !val  -val field @name val relaxed @@relaxed field pos @name[p] val multifield @(n1,n2) val all fields @* val phrase “hello world” proximity “end world”~5 near val1 NEAR/3 val2 quorum “val val2 val3”/2 exact form =val before val1 << val2 field start ^val field end val$ sentence val SENTENCE val2 paragraph val PARAGRAPH val2
sorting SPH_SORT_RELEVANCE SPH_SORT_ATTR_DESC / SPH_SORT_ATTR_ASC SPH_SORT_TIME_SEGMENTS SPH_SORT_EXTENDED (@id, @weight, @random) SPH_SORT_EXPR  &quot;@weight + ( user_karma + ln(pageviews) )*0.1&quot;
excerpts
words words words charsets stemmers stopwords wordforms exceptions
Delta, MERGE,  Real Time INDEX deltas  index merge  indexar en tiempo real
XML & TEXfILES sql_file_field xmlpipe2
Performance extern storage (attributes) hitless words (positions) distributed indexes
Thinking Sphinx thinking sphinx vendor/riddle riddle gem
Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com

Mais conteúdo relacionado

Destaque

Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1
Irfan Aiman
 
4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus
pablomendez_01
 
Presentation1 rootabaga stories original
Presentation1 rootabaga stories originalPresentation1 rootabaga stories original
Presentation1 rootabaga stories original
kylea11
 
项目二 完成稿
项目二  完成稿项目二  完成稿
项目二 完成稿
shangziying
 
Act Embutidos Y Grasas
Act Embutidos Y GrasasAct Embutidos Y Grasas
Act Embutidos Y Grasas
ciudadania0910
 

Destaque (20)

Test grafik kvadratne funkcije
Test   grafik kvadratne funkcijeTest   grafik kvadratne funkcije
Test grafik kvadratne funkcije
 
Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1Sang matahari yang_baik_hati_1
Sang matahari yang_baik_hati_1
 
Rebe Ciudadania
Rebe CiudadaniaRebe Ciudadania
Rebe Ciudadania
 
Blog by s_f
Blog by s_fBlog by s_f
Blog by s_f
 
Vult 2011
Vult 2011Vult 2011
Vult 2011
 
Menjadi pemenang
Menjadi pemenangMenjadi pemenang
Menjadi pemenang
 
4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus4 instalacion y ejecucion de un antivirus
4 instalacion y ejecucion de un antivirus
 
Presentation1 rootabaga stories original
Presentation1 rootabaga stories originalPresentation1 rootabaga stories original
Presentation1 rootabaga stories original
 
项目二 完成稿
项目二  完成稿项目二  完成稿
项目二 完成稿
 
Tadevosyan anush
Tadevosyan anushTadevosyan anush
Tadevosyan anush
 
Aproximaciones culturales del TDAH Uziel Morales Amaya
Aproximaciones culturales del TDAH  Uziel Morales AmayaAproximaciones culturales del TDAH  Uziel Morales Amaya
Aproximaciones culturales del TDAH Uziel Morales Amaya
 
Ripensare la scuola
Ripensare la scuolaRipensare la scuola
Ripensare la scuola
 
Barcino
BarcinoBarcino
Barcino
 
Dinks
DinksDinks
Dinks
 
Act Embutidos Y Grasas
Act Embutidos Y GrasasAct Embutidos Y Grasas
Act Embutidos Y Grasas
 
Presentacion melisa
Presentacion melisaPresentacion melisa
Presentacion melisa
 
Comunicar ondas1
Comunicar ondas1Comunicar ondas1
Comunicar ondas1
 
Maicol ruiz franco cruzi escalera y preguntas 11[1]
Maicol ruiz franco cruzi escalera y preguntas 11[1]Maicol ruiz franco cruzi escalera y preguntas 11[1]
Maicol ruiz franco cruzi escalera y preguntas 11[1]
 
16º EDTED
16º EDTED16º EDTED
16º EDTED
 
Canvi climàtic
Canvi climàticCanvi climàtic
Canvi climàtic
 

Semelhante a cosicas de sphinx que lo mismo no sabías

Servicios Rest con Jersey
Servicios Rest con Jersey Servicios Rest con Jersey
Servicios Rest con Jersey
Vortexbird
 
Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02
Antonio Meléndez
 
Java script teoria
Java script teoriaJava script teoria
Java script teoria
ssxdan
 
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
Oscar V
 
informacion sobre blog datos y sql
informacion sobre blog datos y sqlinformacion sobre blog datos y sql
informacion sobre blog datos y sql
danie12angie
 
PresentacióN 4
PresentacióN 4PresentacióN 4
PresentacióN 4
pokerpc
 

Semelhante a cosicas de sphinx que lo mismo no sabías (20)

Tutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtimeTutorial en Apache Spark - Clasificando tweets en realtime
Tutorial en Apache Spark - Clasificando tweets en realtime
 
Scala en proyectos de vinculación Ancap-UR - 2013-03
Scala en proyectos de vinculación Ancap-UR - 2013-03Scala en proyectos de vinculación Ancap-UR - 2013-03
Scala en proyectos de vinculación Ancap-UR - 2013-03
 
Servicios Rest con Jersey
Servicios Rest con Jersey Servicios Rest con Jersey
Servicios Rest con Jersey
 
Compilacion Perl
Compilacion PerlCompilacion Perl
Compilacion Perl
 
Java script operaciones
Java script operacionesJava script operaciones
Java script operaciones
 
SQL(DQL).pdf
SQL(DQL).pdfSQL(DQL).pdf
SQL(DQL).pdf
 
Tutorial de php
Tutorial de phpTutorial de php
Tutorial de php
 
Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02Formacinapachesolr tv3-150130071830-conversion-gate02
Formacinapachesolr tv3-150130071830-conversion-gate02
 
Formación apache Solr
Formación apache SolrFormación apache Solr
Formación apache Solr
 
Javascript Básico
Javascript BásicoJavascript Básico
Javascript Básico
 
Java script teoria
Java script teoriaJava script teoria
Java script teoria
 
Java 7- Java Day Guatemala
Java 7- Java Day GuatemalaJava 7- Java Day Guatemala
Java 7- Java Day Guatemala
 
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
OCP, JSE 6 Programmer (1z0-851) - Guia practica 3 de 7(ap-is)
 
Script
ScriptScript
Script
 
Curso php y_mysql
Curso php y_mysqlCurso php y_mysql
Curso php y_mysql
 
Kelly
KellyKelly
Kelly
 
Comandos de Raptor, Java y C# Sharp
Comandos de Raptor, Java y C# SharpComandos de Raptor, Java y C# Sharp
Comandos de Raptor, Java y C# Sharp
 
informacion sobre blog datos y sql
informacion sobre blog datos y sqlinformacion sobre blog datos y sql
informacion sobre blog datos y sql
 
PresentacióN 4
PresentacióN 4PresentacióN 4
PresentacióN 4
 
Cagando Datos con APEX_DATA_PARSER
Cagando Datos con APEX_DATA_PARSERCagando Datos con APEX_DATA_PARSER
Cagando Datos con APEX_DATA_PARSER
 

Mais de javier ramirez

Mais de javier ramirez (20)

¿Se puede vivir del open source? T3chfest
¿Se puede vivir del open source? T3chfest¿Se puede vivir del open source? T3chfest
¿Se puede vivir del open source? T3chfest
 
QuestDB: The building blocks of a fast open-source time-series database
QuestDB: The building blocks of a fast open-source time-series databaseQuestDB: The building blocks of a fast open-source time-series database
QuestDB: The building blocks of a fast open-source time-series database
 
Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...
Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...
Como creamos QuestDB Cloud, un SaaS basado en Kubernetes alrededor de QuestDB...
 
Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...
Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...
Ingesting Over Four Million Rows Per Second With QuestDB Timeseries Database ...
 
Deduplicating and analysing time-series data with Apache Beam and QuestDB
Deduplicating and analysing time-series data with Apache Beam and QuestDBDeduplicating and analysing time-series data with Apache Beam and QuestDB
Deduplicating and analysing time-series data with Apache Beam and QuestDB
 
Your Database Cannot Do this (well)
Your Database Cannot Do this (well)Your Database Cannot Do this (well)
Your Database Cannot Do this (well)
 
Your Timestamps Deserve Better than a Generic Database
Your Timestamps Deserve Better than a Generic DatabaseYour Timestamps Deserve Better than a Generic Database
Your Timestamps Deserve Better than a Generic Database
 
Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...
Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...
Cómo se diseña una base de datos que pueda ingerir más de cuatro millones de ...
 
QuestDB-Community-Call-20220728
QuestDB-Community-Call-20220728QuestDB-Community-Call-20220728
QuestDB-Community-Call-20220728
 
Processing and analysing streaming data with Python. Pycon Italy 2022
Processing and analysing streaming  data with Python. Pycon Italy 2022Processing and analysing streaming  data with Python. Pycon Italy 2022
Processing and analysing streaming data with Python. Pycon Italy 2022
 
QuestDB: ingesting a million time series per second on a single instance. Big...
QuestDB: ingesting a million time series per second on a single instance. Big...QuestDB: ingesting a million time series per second on a single instance. Big...
QuestDB: ingesting a million time series per second on a single instance. Big...
 
Servicios e infraestructura de AWS y la próxima región en Aragón
Servicios e infraestructura de AWS y la próxima región en AragónServicios e infraestructura de AWS y la próxima región en Aragón
Servicios e infraestructura de AWS y la próxima región en Aragón
 
Primeros pasos en desarrollo serverless
Primeros pasos en desarrollo serverlessPrimeros pasos en desarrollo serverless
Primeros pasos en desarrollo serverless
 
How AWS is reinventing the cloud
How AWS is reinventing the cloudHow AWS is reinventing the cloud
How AWS is reinventing the cloud
 
Analitica de datos en tiempo real con Apache Flink y Apache BEAM
Analitica de datos en tiempo real con Apache Flink y Apache BEAMAnalitica de datos en tiempo real con Apache Flink y Apache BEAM
Analitica de datos en tiempo real con Apache Flink y Apache BEAM
 
Getting started with streaming analytics
Getting started with streaming analyticsGetting started with streaming analytics
Getting started with streaming analytics
 
Getting started with streaming analytics: Setting up a pipeline
Getting started with streaming analytics: Setting up a pipelineGetting started with streaming analytics: Setting up a pipeline
Getting started with streaming analytics: Setting up a pipeline
 
Getting started with streaming analytics: Deep Dive
Getting started with streaming analytics: Deep DiveGetting started with streaming analytics: Deep Dive
Getting started with streaming analytics: Deep Dive
 
Getting started with streaming analytics: streaming basics (1 of 3)
Getting started with streaming analytics: streaming basics (1 of 3)Getting started with streaming analytics: streaming basics (1 of 3)
Getting started with streaming analytics: streaming basics (1 of 3)
 
Monitorización de seguridad y detección de amenazas con AWS
Monitorización de seguridad y detección de amenazas con AWSMonitorización de seguridad y detección de amenazas con AWS
Monitorización de seguridad y detección de amenazas con AWS
 

Último

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (10)

Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 

cosicas de sphinx que lo mismo no sabías

  • 1. Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com
  • 2. cosicas que sí deberías saber ya buscador ligero y rápido fácil de integrar en rails gracias a thinking sphinx permite búsquedas por texto libre permite usar comodines permite buscar y ordenar por atributos permite usar grupos y facetas permite buscar por geoposición
  • 3. cosicas que voy a contar (por encima) ciclo de indexado / ciclo de búsqueda spa / spi / sph / spd / spm / spp búsquedas extendidas, pesos y ordenaciones excerpts charsets, stemmers, stopwords, excepciones deltas / index merge / indexar en tiempo real indexando ficheros (texto y xml) performance: extern / hitless/ distribuir el índice modificando thinking sphinx
  • 4. indexado / búsqueda sql_query_pre sql_query sql_query_post sql_query_post_index sql_ranged_throttle sql_query_info
  • 5. ficheros spa: attributes spd: doc ID <=> word ID sph: headers spi: word <=> word ID spk: kill list spm: MVA spp: hits sps: string attributes
  • 6. extended search OR | val AND & val NOT !val -val field @name val relaxed @@relaxed field pos @name[p] val multifield @(n1,n2) val all fields @* val phrase “hello world” proximity “end world”~5 near val1 NEAR/3 val2 quorum “val val2 val3”/2 exact form =val before val1 << val2 field start ^val field end val$ sentence val SENTENCE val2 paragraph val PARAGRAPH val2
  • 7. sorting SPH_SORT_RELEVANCE SPH_SORT_ATTR_DESC / SPH_SORT_ATTR_ASC SPH_SORT_TIME_SEGMENTS SPH_SORT_EXTENDED (@id, @weight, @random) SPH_SORT_EXPR &quot;@weight + ( user_karma + ln(pageviews) )*0.1&quot;
  • 9. words words words charsets stemmers stopwords wordforms exceptions
  • 10. Delta, MERGE, Real Time INDEX deltas index merge indexar en tiempo real
  • 11. XML & TEXfILES sql_file_field xmlpipe2
  • 12. Performance extern storage (attributes) hitless words (positions) distributed indexes
  • 13. Thinking Sphinx thinking sphinx vendor/riddle riddle gem
  • 14. Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com