1. Cap 2: Aplicaci´n Pr´ctica
o a
Tutores: Luis Antonio Chamba Eras
Edison Leonardo Coronel Romero
Carrera de Ingenier´ en Sistemas
ıa
Universidad Nacional de Loja
Octubre 2012
1 / 18
2. B´squeda de Texto - Antecedentes
u
• Un problema habitual en la Web y otros repositorios de texto
es el siguiente:
2 / 18
3. B´squeda de Texto - Antecedentes
u
• Un problema habitual en la Web y otros repositorios de texto
es el siguiente:
• ”Dado un conjunto de palabras, determinar todos los documen-
tos que contengan una de dicha palabras (o todas)”.
3 / 18
4. B´squeda de Texto - Antecedentes
u
• Un problema habitual en la Web y otros repositorios de texto
es el siguiente:
• ”Dado un conjunto de palabras, determinar todos los documen-
tos que contengan una de dicha palabras (o todas)”.
• Un motor de b´squeda, utiliza una tecnolog´ concreta conocida
u ıa
como ”´ ındices invertidos”, en la que para cada palabra que
aparece en la Web existen 100000000 de palabras diferentes, se
almacena una lista de todos los lugares donde aparecen dicha
palabra, servidores mantienen disponibles la informaci´n.
o
4 / 18
5. B´squeda de Texto - Antecedentes
u
• Un problema habitual en la Web y otros repositorios de texto
es el siguiente:
• ”Dado un conjunto de palabras, determinar todos los documen-
tos que contengan una de dicha palabras (o todas)”.
• Un motor de b´squeda, utiliza una tecnolog´ concreta conocida
u ıa
como ”´ ındices invertidos”, en la que para cada palabra que
aparece en la Web existen 100000000 de palabras diferentes, se
almacena una lista de todos los lugares donde aparecen dicha
palabra, servidores mantienen disponibles la informaci´n.
o
• Las t´cnicas de ´
e ındices invertidos no emplean aut´matas finitos,
o
los agentes de b´squeda invierten mucho tiempo en el proceso.
u
5 / 18
6. B´squeda de Texto - Antecedentes
u
• Un problema habitual en la Web y otros repositorios de texto
es el siguiente:
• ”Dado un conjunto de palabras, determinar todos los documen-
tos que contengan una de dicha palabras (o todas)”.
• Un motor de b´squeda, utiliza una tecnolog´ concreta conocida
u ıa
como ”´ ındices invertidos”, en la que para cada palabra que
aparece en la Web existen 100000000 de palabras diferentes, se
almacena una lista de todos los lugares donde aparecen dicha
palabra, servidores mantienen disponibles la informaci´n.
o
• Las t´cnicas de ´
e ındices invertidos no emplean aut´matas finitos,
o
los agentes de b´squeda invierten mucho tiempo en el proceso.
u
• Existen t´cnicas de b´squeda que utilizan aut´matas, para ello
e u o
se necesita cumplir las siguientes caracter´
ısticas:
6 / 18
7. B´squeda de Texto - Antecedentes
u
• El repositorio cambia r´pidamente:noticias al d´ rastreadores
a ıa,
Web.
7 / 18
8. B´squeda de Texto - Antecedentes
u
• El repositorio cambia r´pidamente:noticias al d´ rastreadores
a ıa,
Web.
• Documentos no clasificados, p´ginas sobre la marcha en res-
a
puesta a consultas.
8 / 18
9. B´squeda de Texto - Antecedentes
u
• El repositorio cambia r´pidamente:noticias al d´ rastreadores
a ıa,
Web.
• Documentos no clasificados, p´ginas sobre la marcha en res-
a
puesta a consultas.
9 / 18
10. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Conjunto de palabras denominadas ”palabras clave ”, deseamos
encontrar las apariciones de cualquiera de estas palabras, lo m´s
a
util es dise˜ar un AFND que indique mediante un estado de
´ n
aceptaci´n que se ha encontrado una de las ”palabras clave”,
o
el texto de un documento se introduce car´cter por car´cter en
a a
el AFND que permitir´ reconocer las apariciones de las palabras
a
claves en el texto.
10 / 18
11. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Conjunto de palabras denominadas ”palabras clave ”, deseamos
encontrar las apariciones de cualquiera de estas palabras, lo m´s
a
util es dise˜ar un AFND que indique mediante un estado de
´ n
aceptaci´n que se ha encontrado una de las ”palabras clave”,
o
el texto de un documento se introduce car´cter por car´cter en
a a
el AFND que permitir´ reconocer las apariciones de las palabras
a
claves en el texto.
• Estado inicial con una transici´n a s´ mismo para cada uno de los
o ı
s´
ımbolos de entrada, por ejemplo el alfabeto ASCII, ´ste estado
e
inicial representa una conjetura de que no se ha detectado una
palabra clave, incluso aunque hayamos encontrado algunas de
las letras de una de esas palabras.
11 / 18
12. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Conjunto de palabras denominadas ”palabras clave ”, deseamos
encontrar las apariciones de cualquiera de estas palabras, lo m´s
a
util es dise˜ar un AFND que indique mediante un estado de
´ n
aceptaci´n que se ha encontrado una de las ”palabras clave”,
o
el texto de un documento se introduce car´cter por car´cter en
a a
el AFND que permitir´ reconocer las apariciones de las palabras
a
claves en el texto.
• Estado inicial con una transici´n a s´ mismo para cada uno de los
o ı
s´
ımbolos de entrada, por ejemplo el alfabeto ASCII, ´ste estado
e
inicial representa una conjetura de que no se ha detectado una
palabra clave, incluso aunque hayamos encontrado algunas de
las letras de una de esas palabras.
• Para cada palabra a1a2...ak hay k estados, q1,q2,...,qk.
12 / 18
13. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Existe una transici´n desde el estado inicial a q1 para a1, una
o
transici´n desde q1 a q2 para a2..., el estado qk es un estado
o
de aceptaci´n que indica que se ha encontrado la palabra clave
o
a1a2...ak.
13 / 18
14. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Existe una transici´n desde el estado inicial a q1 para a1, una
o
transici´n desde q1 a q2 para a2..., el estado qk es un estado
o
de aceptaci´n que indica que se ha encontrado la palabra clave
o
a1a2...ak.
• Google.
14 / 18
15. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Existe una transici´n desde el estado inicial a q1 para a1, una
o
transici´n desde q1 a q2 para a2..., el estado qk es un estado
o
de aceptaci´n que indica que se ha encontrado la palabra clave
o
a1a2...ak.
• Google.
• Amazon.
15 / 18
16. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Existe una transici´n desde el estado inicial a q1 para a1, una
o
transici´n desde q1 a q2 para a2..., el estado qk es un estado
o
de aceptaci´n que indica que se ha encontrado la palabra clave
o
a1a2...ak.
• Google.
• Amazon.
• AFND.
16 / 18
17. B´squeda de Texto - Aut´matas Finitos No Deterministas
u o
• Existe una transici´n desde el estado inicial a q1 para a1, una
o
transici´n desde q1 a q2 para a2..., el estado qk es un estado
o
de aceptaci´n que indica que se ha encontrado la palabra clave
o
a1a2...ak.
• Google.
• Amazon.
• AFND.
• AFD.
17 / 18
18. Bibliograf´
ıa
[1] John E. Hopcroft, Rajeev Motwani y Jeffrey D. Ullman
Teor´ de Aut´matas, lenguajes y computaci´n
ıa o o
Pearson, 2008.
18 / 18