2. Motores de búsqueda Recuperando información Ignacio Perez - Ingeniero en IndexTank [email_address] http://blog.indextank.com
3. Introducción Dentro de la disciplina de recuperación de la información (IR), full-text search es una de las tareas más aplicadas en lo que es desarrollo web. Con el crecimiento de las capacidades técnicas, encontrar información no estructurada dentro de un corpus de datos extenso se ha convertido en una necesidad para un número cada vez mayor de actores. Los motores de búsqueda textual ya no son sólo un requisito de los buscadores web. Las nuevas tendencias en internet implican contenido generado a muy alta velocidad (muchas veces por los mismos usuarios) dentro de una misma aplicación: YouTube, Wikipedia, Twitter, Facebook, Wordpress, Digg. Full-Text Search
7. Buscar en un corpus Primer approach: Regular expression (automáta finito sin pila) aplicado a todo el corpus (GREP). Problema de performance: O(n) donde n es el tamaño del corpus Full-Text Search