Si su organización, bien sea para uso interno o externo o con el fin de vender o informar, detecta la necesidad de poner en marcha un buscador, este documento tiene por objetivo facilitarle una síntesis de los factores determinantes al éxito.
Conocer la necesidad, las oportunidades, los riesgos e implicaciones, constituir y liderar el equipo adecuado, seleccionar la tecnología correcta o medir el éxito, son cuestiones que a continuación se presentan.
1. -4390390-1483360Necesito un Buscador<br />Resumen ejecutivo<br />Si su organización, bien sea para uso interno o externo o con el fin de vender o informar, detecta la necesidad de poner en marcha un buscador, este documento tiene por objetivo facilitarle una síntesis de los factores determinantes al éxito.<br />Conocer la necesidad, las oportunidades, los riesgos e implicaciones, constituir y liderar el equipo adecuado, seleccionar la tecnología correcta o medir el éxito, son cuestiones que a continuación se presentan.<br /> TOC quot;
1-3quot;
Resumen ejecutivo PAGEREF _Toc162397402 2La necesidad y las oportunidades PAGEREF _Toc162397403 4Oportunidades5Necesidades5Tipos de proyecto de búsqueda PAGEREF _Toc162397404 6¿Es posible prever el tipo de búsquedas de los usuarios? PAGEREF _Toc162397405 6¿Cuál es el nivel de estructura de la información? PAGEREF _Toc162397406 7Selección de tecnología PAGEREF _Toc162397407 8Software Comercial PAGEREF _Toc162397408 8¿Cuáles son las restricciones de las licencias comerciales? PAGEREF _Toc162397409 9Open Source PAGEREF _Toc162397410 11¿Que aspectos definen la oferta Open Source? PAGEREF _Toc162397411 11El equipo PAGEREF _Toc162397412 13Los riesgos PAGEREF _Toc162397413 14Diseño funcional PAGEREF _Toc162397414 14Diseño agregación PAGEREF _Toc162397415 15Diseño técnico PAGEREF _Toc162397416 16Medir el éxito PAGEREF _Toc162397417 17La continuidad PAGEREF _Toc162397418 18Conclusiones PAGEREF _Toc162397419 19Sobre Colbenson PAGEREF _Toc162397420 20<br />La necesidad y las oportunidades<br />“Necesitamos un Google”<br />Son muchas las formas en las que la necesidad de un buscador se presenta y sin embargo, el requisito se comunica en términos tales como: “Necesitamos un Google”, “hay que poner un cajón de búsqueda” o simplemente: “Necesitamos un buscador”.<br />Hoy en día, en cualquier ecosistema empresarial o institucional, la información dirige multitud de escenarios de los cuales surgen infinidad de problemas que la búsqueda trata, haciendo del buscador un componente crítico.<br />OportunidadesEl objetivo es reducir el tiempo y el esfuerzo que distancia a los datos de sus usuarios, lo que presenta a su vez numerosas oportunidades.Dotar de mayor agilidad y dinamismo a los datos tiene un impacto directo en muchos aspectos de la operativa, el reto es identificar y priorizar.NecesidadesLas necesidades han de valorarse en el contexto de la mejora de productividad o incremento de ventas.¿Cómo puede mejorar el buscador la productividad de mi organización?¿Cómo puedo potenciar las ventas online?<br />Tipos de proyecto de búsqueda<br />28575274320<br />Cada proyecto responde naturalmente a objetivos específicos, sin embargo es posible clasificarlos de según el tipo de uso y según el tipo de datos.<br />¿Es posible prever el tipo de búsquedas de los usuarios?<br />El buscador de una tienda online recibe más de un 50% de búsquedas con lenguaje coloquial distinto al que describe los productos, cuando el buscador de un Web de gobierno puede recibir cientos de miles de búsquedas al mes y sin embargo solamente 3 temas tales como ayudas, becas o transporte pueden copar más del 70% del total de la demanda. <br />¿Cuál es el nivel de estructura de la información?<br />Véase por ejemplo el buscador de un Web de reservas de vuelos con datos altamente estructurados (fecha, origen y destino), mientras que los datos publicados en un Web de gobierno son principalmente des-estructurados.<br />Cuanto más estructurados son los datos, mayor es la probabilidad de convertir una búsqueda en una experiencia satisfactoria. <br />Estructurar o enriquecer debe de responder fielmente a una demanda de uso y a unos niveles de mantenimiento o actualización coherentes con el sentido y futuro del proyecto.<br />Selección de tecnología<br />La selección de una u otra tecnología no es un factor determinante del éxito, sin embargo marca una ruta de posibilidades o limitaciones en el futuro y continuidad.<br />A continuación se presentan los aspectos fundamentales a tener en cuenta durante la selección tecnologías abiertas o comerciales.<br />Software Comercial<br />El mercado de Software Comercial de búsqueda se ha consolidado en los últimos años, la oferta tecnológica es muy similar y las diferencias funcionales inapreciables.<br />Son muchas las empresas que ofrecen licencias, ya sean dedicadas como Autonomy, Endeca o Exaleed o la oferta de grandes fabricantes de software al efecto como Google GSA, Microsoft Fast o Oracle Enterprise Search.<br />La decisión de optar por Software licenciado o comercial tiene numerosas ventajas, desde la estandarización con el resto de plataformas comerciales hasta la negociación contractual de modelos de soporte Gold o Premium sin duda más extendidos y maduros que en la oferta de código abierto o Open Source.<br />Sin embargo, la introducción de código objeto o de autor en modo de licencias de uso comerciales, conlleva una serie de restricciones que han de valorarse y formar parte de la negociación durante el proceso de compra.<br />¿Cuáles son las restricciones de las licencias comerciales?<br />Sobrepasar cualquiera de las siguientes limitaciones o que nuevos interlocutores comerciales las re-definan implica nuevas negociaciones e incrementos en el TCO (Total Cost of Ownership).<br />Definición de uso: Acota el uso del software a ámbitos internos y/o externos. Dentro de cada uno de estos ámbitos es también limitable a número usuarios, departamentos, divisiones, dominios, zonas geográficas, etc.<br />Volumen de documentos, tamaño/número de índices, consultas concurrentes o CPUs: Sin lugar a dudas una de las limitaciones más confusas. ¿Qué es un documento? ¿Cuentan las consultas intra-procesos, paramétricas o de personalización? ¿De qué sirve tener índices grandes sino pueden escalarse a nuevas instancias?<br />Funcionalidades: El software viene limitado, evidentemente por sus funcionalidades. El problema radica en que los nombres de éstas cambian con frecuencia aun respondiendo a las mismas funciones de API.<br />Escalabilidad/Distribución/Alta Disponibilidad: Del mismo modo, las licencias controlan cómo pueden distribuirse, balancearse y en definitiva definir arquitectura.<br />Open Source<br />28575176530<br />Las posibilidades de maximizar los objetivos y las oportunidades de su proyecto de búsqueda son proporcionales a al grado de flexibilidad que la infraestructura y solución de búsqueda ofrezcan. <br />Open Source, en el lado positivo, ofrece dicha adaptabilidad y sin embargo es en esa virtud en donde también se encuentra su defecto, ofreciendo tal espectro de opciones y configuración que los requisitos técnicos, humanos y de conocimientos son comparativamente más complejos y sofisticados.<br />¿Que aspectos definen la oferta Open Source?<br />Sin restricciones: A diferencia de la oferta de Software comercial, Open Source en proyectos de búsqueda presenta una oportunidad de explotación libre de toda restricción volumétrica, funcional, idomática o de uso. <br />Investigación y Desarrollo: Desarrolladores por todo el mundo evolucionan el software. Estos programadores y arquitectos son movidos por su pasión por las tecnologías de agregación, conexión, enriquecimiento y procesado de información. El hecho de que Lucene/Solr esté en boca de todos es precisamente consecuencia del desarrollo acelerado que experimenta y de la rápida evolución técnica y funcional hasta el punto de haber alcanzado a las soluciones comerciales.<br />Lucene/Solr es desarrollado desde hace más de 10 años bajo el proyecto Apache. Los grandes proyectos de éxito en búsqueda como Linkedin, Twitter o Data.gov corren sobre esta tecnología.<br />El equipo<br />A los perfiles experimentados en tecnologías de búsqueda y agregación de aquellas tipologías de fuentes a agregar, es imprescindible sumar experiencia en diseño de patrones de encontrabilidad.<br />El diseño de arquitecturas de búsqueda de alto rendimiento, gestión de caches, compresión y tipologías de índices, securización y eficiencia de todo el espectro de acciones de búsqueda necesita de un conjunto de perfiles multidisciplinar, desde encontrabilidad hasta arquitectura pasando por administración de sistemas, documentación y desarrollo. <br />La tecnología de búsqueda coexiste en un ecosistema variado de aplicaciones y tipologías documentales con el que debe interactuar de forma coherente. Materializar dichas interacciones resulta en un claro proyecto de integración que demanda elevados conocimientos más allá del buscador en sí hacia los sistemas que le rodean.<br />Los riesgos<br />¿Cuáles son las razones por las que el proyecto puede fracasar?<br />Diseño funcional<br />Diseño agregación <br />Diseño técnico<br />Diseño funcional<br />Un correcto diseño funcional del proyecto buscador ha de contemplar los denominados patrones de búsqueda o conjunto de casos de uso del buscador según la tipología de información y las propias características del usuario. <br />La disponibilidad de funcionalidades no justifica su incorporación. Cada función de búsqueda ha de atender a un comportamiento común de la mayoría de usuarios y a intenciones de búsqueda definibles y diseñables.<br />Mitigación: Es preciso definir indicadores de éxito del buscador o KPIs (Key Performance Indicators). Sobre dichos parámetros es posible cuantificar objetivamente mediante Analítica de Búsqueda el éxito o fracaso de la casos de uso planteados, permitiendo adaptarlos o crear nuevos cuyo diseño sí corresponda y en efecto se disuelva con el comportamiento de sus usuarios.<br />Diseño agregación<br />Otra causa común de fracaso y un riesgo de gran potencial es la falta de un diseño apropiado de los procesos de agregación, bien por la introducción de ruido o por ignorar simples vías de enriquecimiento de información y datos que a su vez habilitan búsquedas efectivas.<br />Mitigación: Evaluar la normalización mediante la suma y el enriquecimiento de meta-datos de forma automática. Definir los ciclos de vida de contenidos e información para cada tipología.<br />Diseño técnico<br />Es frecuente que las arquitecturas lógicas y físicas planteadas no satisfagan los requisitos de rendimiento, disponibilidad y escalabilidad. Bien por la falta de previsión de los volúmenes de consultas (que muchas veces incluyen infinidad de acciones más allá de la búsqueda), o bien por el desconocimiento de los volúmenes y ciclos de indexación (tanto desde el punto de vista de unidades documentales como términos/idiomas).<br />Mitigación: Un correcto estudio de los ciclos de vida de los contenidos y de las previsiones de crecimiento ha de traducirse en arquitecturas que asignan diferentes responsabilidades a diferentes motores que pueden perfectamente inter-operar, cruzar y re-ordenar consultas y resultados.<br />Medir el éxito<br />Los indicadores de éxito deben ser duros y medibles.<br />Los indicadores de éxito deben ser duros y mediblesPor ejemplo, si el objetivo del proyecto es promover la venta cruzada, la métrica debe ser predefinida entorno a los índices de click-through rate (CTR).<br />Al otro lado del espectro, cuando el proyecto es interno, podemos medir por ejemplo el grado de conversión de búsquedas en el sistema de preguntas y respuestas y como se refleja en el numero de llamadas atendidas por el Centro de Atención al Usuario o CAU en dicho periodo. <br />La clave reside en analizar y cuantificar el impacto que a nivel de negocio tienen los clicks en contenidos y acciones como por ejemplo contratar un producto, pedir un presupuesto, o emplear un simulador de hipotecas.<br />La continuidad<br />Sobre una métrica dura que permite cuantificar el éxito del buscador, el proyecto ha de planificar una continuidad diseñada para elevar dichos resultados y obtener por otros cauces nuevos réditos.<br />Dos son los factores que fundamentan la previsión de continuidad de un proyecto de búsqueda:<br />Las propiedades volumétricas y tipológicas de la información<br />Las expectativas y casos de uso<br />Tanto en cuanto ambos factores cambian y evolucionan, los servicios de búsqueda asociados han de adaptarse y actualizarse, no hacerlo resulta en ignorar la verdadera naturaleza viva de los servicios de búsqueda y con ello abandonarlos a un deterioro continuado (a medida que volúmenes y tipologías se agregan y las intenciones de uso evolucionan).<br />Conclusiones<br />Bien para uso interno o externo, tanto en organismos públicos como privados, un buscador tiene la responsabilidad de simplificar y reducir el tiempo y el esfuerzo que distancia a los usuarios de la información que de forma inmediata precisan.<br />Tratar dicho objetivo, no es una cuestión exclusivamente tecnológica, sino metodológica. El éxito depende de analizar y comprender la demanda de información, en apreciar cómo buscan. <br />Diseñando sobre esos comportamientos el buscador proporcionará experiencias satisfactorias y medibles cuantitativamente, tanto en cuanto es posible calcular cuando una búsqueda ha fracasado, es igualmente posible detectar cuándo no lo ha hecho, pudiendo establecer un ratio de encontrabilidad medible y cuya maximización depende principalmente de la Analítica de Búsqueda y el Diseño de Patrones de Búsqueda.<br />Sobre Colbenson<br />Colbenson desarrolla y aplica metodologías y tecnologías que dotan a sus contenidos de mayor agilidad y rentabilidad, anticipándose a las necesidades de sus usuarios según sus patrones de comportamiento.<br />Desde Colbenson Software Factory se desarrollan productos y widgets de búsqueda y recomendación como OSP (Open&Search Platform) y de analítica, adaptación y optimización de buscadores, usuarios y contenidos como SearchBroker, con impacto directo en la productividad y conversión de indicadores de negocio para clientes como Casa del Libro, Mango, Caja Madrid/ Bankia, Acceso, Europa Press, Banco de España, Biblioteca Nacional, Poder Judicial o Gobierno Vasco.<br />Colbenson.com y @colbenson<br />Encontrabilidad.org<br />OpenandSearch.com<br />