Este documento describe diferentes métodos de navegación y búsqueda en Internet y la World Wide Web. Explica la diferencia entre navegar aleatoriamente y realizar búsquedas estratégicas, y proporciona detalles sobre herramientas de búsqueda como motores de búsqueda, megabuscadores y directorios. También cubre conceptos como operadores lógicos booleanos y recomendaciones para lograr búsquedas efectivas.
Navegación y búsqueda en Internet: guía concisa sobre herramientas y estrategias
1. INTERNET Y EL”WORLD WIDE WEB”:Navegación y Búsqueda Preparado por: Prof. Edgar Lopategui Corsino http://www.saludmed.com/Informat/Internet/Busqueda.html
2. Navegación Representa un método aleatorio para efectuar búsquedas en la internet. No se posee un plan estratégico específico, simplemente se comienza a realizar clics a diversos menús o enlaces que lleva a varias páginas Web. Se entrar y camina por el ciberespacio de la Internet/Web al examinar (curiosar, hojear, "browse") este mundo virtual.
3. Datos Preliminares Las predicciones de NUA apuntan a un problema de exceso de información y menos efectividad en los mecanismos de búsqueda Se estima en cerca de 320 millones de páginas en el WWW (NEC Research Institute) Existen sobre 1,800 diferentes tipos de mecanismos de búsqueda Los mecanismos de búsqueda solo abarcan un porciento de la totalidad de los datos en el Web
4. Algunas Observaciones La internet/WWW no posee toda la información del mundo No siempre se encuentra lo que se desea Algunos resultados de búsquedas no son útliles La búsqueda puede ser imprecisa e inconsistente Es imprescindible evaluar la calidad de los resultados, cuando se trate de información
5. Conceptos Fundamentales Un Banco de Datos es: Una colección de información Organizado para aumentar su valor La guía telefónica es un ejemplo
6. Estructura de un Banco de Datos Registros (e.g., entradas en una guía telefónica) Campos (e.g., nombre, dirección, número telefónico) Organización (alfabético, jerárquico, numérico, etc.)
7. Estructura de un Banco de Datos Ejemplo Una página del web es un registro Los campos puede ser: Título URL Encabezado Texto Gráficos
8. Buscar Un proceso organizado y lógico mediante el cual se implementa un plan estratégico previamente planificado para encontrar en la Internet/Web aquello que desee el usuario, el cual puede ser un documento, una imagen, un archivo de música, la dirección de una persona, entre otros. En la búsqueda se emplean sistemas de rastreo o herramientas de búsquedas (generales o especializadas por materia). Este método es más eficiente y comunmente produce resultado más específicos.
9. Recomendaciones para Lograr Búsquedas Efectivas Selecciones dos o tres herramientas de búsqueda y aprenda a usarlas correctamente Identifique sus términos antes de iniciar la búsqueda Considere sinónimos, palabras relacionadas y variaciones tales como plurales Aprenda a utilizar los conectores booleanos. Utilice comandos de aproximación y símbolos de truncada cuando estén disponibles No se limite a usar una sola herramienta de búsqueda.
10. Opciones de Búsqueda en el Web Curioseando (“Browsing”) Con una dirección (URL) a la mano: Dada por otra persona Encontrada en un libro o registro de direcciones de Internet/Web Utilizando alguna herramienta de búsqueda
11. Herramientas de Búsqueda en el Web * Descripción * Programas que permiten la búsqueda por palabras en diversos servidores WWW dando como resultado final el lugar donde se encuentera la información
12. Herramientas de Búsqueda en el Web * Descripción * Páginas que proveen espacios o formas para entrar palabras orientadas a localizar documentos y otras utilidades en las bases de datos en formato HTML a través de la Internet
13. Herramientas de Búsqueda en el Web * Descripción * Programas de computadoras que permiten buscar y colectar información de lugares en el “Web” Proveen un encasillado para escribir términos, llevan a cabo la búsqueda y ofrecen una lista de documentos disponibles
15. Tipos de Herramientas Motores de búsqueda o “Robots” Megabuscadores (Meta-Índices) Directorios (Índices)
16. “Robots” de Búsqueda * Descripción * Programa de computadora que atraviesa la base de datos disponibles en los documentos del Web en busca de la estructura hipertexto de estas páginas HTML con el fin de localizar alguna pieza de información, como puede ser un documento, una imagen o un programa de computadora
17. “Robots” de Búsqueda * Descripción * Programas que localizan las diferentes Páginas WWW que tienen el término de búsqueda y proveen un índice de documentos
18. “Robots” de Búsqueda Características Programas diseñados para rastrear banco de datos en hypertexto localizados en el Web Son un Producto Comercial Generales y abarcadores: Banco de datos grandes Requiere el uso de palabras claves
19. “Robots” de Búsqueda Banco de Datos Páginas del Web (URLs, encabezados, texto, enlaces) Archivos de imágenes y sonido Mensajes de texto completo de grupos de noticias (“newsgroup”) Lista de archivos de servidores ftp
20. ¿Cómo Deciden a Dónde Ir? Depende del “robot” que sea, todos usan diversas estrategias Comienzan por buscar en su propia lista de localizadores (URL’s) Siguen por las páginas “Whats New” y los lugares más populares en el Web
21. Relevancia de los Resultados Catalogados Los resultados se enumeran según su relevancia Los métodos de clasificación de los resultados varían entre los diversos “Robots” de búsqueda Puede significar que una palabra clave aparece en la página WWW
22. Factores que Influyen en los Resultados El tamaño de la base de datos La frecuencia con que se actualiza Las capacidades de búsqueda disponibles Velocidad de respuesta Diseño de la interfaz La forma en que despliega los resultados La cantidad de ayudas que brinde La composición de los meta-datos
23. Características Generales de los “Robots” y Otros Mecanismos Se enriquecen y actualizan automáticamenmte Ordenamiento por relevancia Uso de múltiples palabras Truncamiento No son sensibles a las mayúsculas Usos de comandos booleanos Utilización de booleanos sustitutos Uso de frases Empleo de campos de acción
24. “Robots” de Búsqueda Búsqueda de Campo Se debe especificar el campo donde el término debe aparecer: Título: Salud y Medicina URL: www.saludmed.com Ayuda aumentar la calidad de los resultados
25. “Robots” de Búsqueda Truncación Búsquedas realizadas con la raíz de una palabra Ejemplo:Comput resulta en: Computadora Computación Evitar los plurares en cada búsqueda
26. “Robots” de Búsqueda Operadores Lógicos Booleanos Crean relaciones entre términos/palabras de búsqueda en la base de dados localizadas en el Web
27. “Robots” de Búsqueda Operadores Lógicos Booleanos Te permiten buscar el resultado de: La intersección de dos términos/palabras de búsqueda La combinación de dos palabras La exclusión de una palabra de la búsqueda
28. “Robots” de Búsqueda Operadores Lógicos Booleanos Conectores Booleanos: “AND”: Todas las plalabras deben de estar contenidas en los documentos “OR”: Cualquiera de las palabras deben estar contenidas en los documentos “NOT” Remueve los documentos que contienen una palabra dada
29. “Robots” : Operadores Booleanos Conectores Booleanos: “AND” Especifica que ambas palabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web en la cual se esta buscando Ejemplo: Internet AND Education: Busca únicamente aquellas bases de datos en las cuales se encuentran las palabras Internet y la palabra Educación
30. “Robots” : Operadores Booleanos Conectores Booleanos: “OR” Especifica que una o la otra o ambas de laspalabras en cualquiera de los lados del operador deben estar contenidas en los documentos de la base de datos del Web que se esta buscando Ejemplo: Internet OR Education: Busca únicamente aquellas bases de datos en las cuales se encuentran la palabra Internet o la palabra Educación o ambas
31. “Robots” : Operadores Booleanos Conectores Booleanos: “NOT” Especifica que la palabra antes del operador debe estar contenida en los documentos de la base de datos del Web, pero la palabra después del operador no debe de estar contenida en los resultados Ejemplo: Internet NOT Web: Busca todas aquellas bases de datos en las cuales se encuentran la palabra Internet con excepción de aqueloos registros en la cual aparece la palabra Web
33. “Robots” de Búsqueda Operadores Lógicos Booleanos:De Proximidad Empleados entre dos palabras de búsqueda para indicar que la palabra debe estar contenida en los documentos de la base de datos dentro de una distancia específica de cada una para el pareo en dicho banco de datos
34.
35.
36. “Robots” de Búsqueda Operadores Lógicos Booleanos:Sustitutos Ejemplo: + computadora + disco duro (es equivalente a: computadora AND disco duro)
38. “Robots” de Búsqueda Operadores Lógicos Booleanos:De Agrupamiento Unen palabras y frases para que sean tratadas como una sola unidad o para determinar el orden en el cual los operadores Booleanos son aplicados
39. “Robots” de Búsqueda Operadores Lógicos Booleanos:De Agrupamiento Comillas Dobles (“”): Los documentos encontrados por la búsqueda deben de contener las palabras dentro de las comillas dobles exactamente como se entraron Ejemplo: “World Wide Web” Busca aquellas páginas que contienen la frase World Wide Web y no las palabras individuales separadas por otras palabras o las mismas palabras en minúsculas
40. “Robots” de Búsqueda Operadores Lógicos Booleanos:De Agrupamiento Paréntesis (): Agrupa palabras y operadores en una cadena de búsqueda para definir el orden en el cual los operadores Booleanos deben aparecer Utilidad/Indicación de Uso: Cuando se emplean varios operadores simultáneamente
41. “Robots” de Búsqueda Operadores Lógicos Booleanos:De Agrupamiento Ejemplo: Se desea buscar información con referente a un visualizadior Web (navegador): Cadena de busqueda que se debe entrar: browser AND (internet or Web): Esta cadena encontrará páginas que contienen las palabras Internet y browser o las palabras Web y browser
42. “Robots” de Búsqueda - Parte I: Alta Vista:http://altavista.digital.com Hot Bot: http://www.hotbot.com InfoSeek: http://www.infoseek.com Excite: http://www.excite.com Google: http://www.google.com Lycos: http://www.lycos.com LookSmart: http://www.looksmart.com
43. “Robots” de Búsqueda: Parte II GoTo: http://www.goto.com WebCrawler: http://www.webcrawler.com Open Text: http://www.opentext.com DejaNews: http://www.deja.com InfoHiway: http://www.infohiway.com ThunderStone: http://www.thunderstone.com ScrubTheWeb: http://www.scrubtheweb.com Northern Light: http://www.nothernlight.com
44. “Robots” de Búsqueda: Parte III Netscape: http://search.netscape.com/ About..com: http://search.about.com/ Voila: http://world.voila.com/ HispaVista: http://buscar.hispavista.com
46. Megabuscadores Realizan búsquedas simultáneas en varios “Robots”: Programas que ejecutan búsquedas simultáneas en múltiples herramientas No tienen una base de datos propia Remueven los duplicados
47. Megabuscadores: Parte I MetaCrawler:http://www.metacrawler.com SavvySearch: http://www.savvysearch.com Beaucoup: http://www.beaucoup.com Dogpile: http://www.dogpile.com ProFusion: http://www.profusion.com All-in-One Search: http://www.allonesearch.com http://www.unam.mx/allinone/
48. Megabuscadores: Parte II StartingPoint:http://www.stpt.com MetaFind: http://www.metafind.com Inference Find: http://www.infind.com Mamma: http://www.mamma.com Cyber411:http://www.c4.com/index.html?cyber411=1 AskJeeves: http://www.ask.com
49. Directorios (Índices) Son creados manualmente sin la ayuda de ningún “Robot” Son más precisos que los “robots” pues son personas quienes compilan y mantiennen la información Proveen una lista de materiales organizada alfabéticamente: Basados en listas o catálogos Organizados jerárquicamente por materias Son más pequeños en contenido en comparación con los “Robots”
50. Directorios (Índices) Banco de datos de lugares de internet Estos lugares son sometidos por sus creadores o evaluadores Organizados en categoría Pueden incluir un robot de búsqueda para buscar en su banco de datos Son similares a catálogos o páginas amarillas Los sitios en el web cobren el mismo tópico agrupados en uno Son buenos para curiosear (“browsing”)
51. Directorios (Índices): Parte I Yahoo!: http://www.yahoo.com Magellan: http://magellan.mckinley.com/ Snap: http://www.snap.com Web Help: http://www.webhelp.com/
52. Directorios (Índices): Parte II Argus Clearinhouse:http://www.clearinghouse.net/ World Wide Web Virtual Library: http://www.vlib.org/ Britannica.com: http://www.britannica.com Librarians’ Index to the Internet:: http://lii.org/