Se ofrecen 2 PFCs para Ing. Informática relacionados con herramientas avanzadas de búsqueda:
Sistema de recuperación de opiniones en el dominio bursátil, dirigido por David E. Losada
El proyecto consiste en el desarrollo de una aplicación web de búsqueda centrada en la recuperación de opiniones sobre la evolución de las acciones en la Bolsa. Esto implica desarrollar un crawler que se centre en la exploración de blogs especializados, periódicos online y otro tipo de repositorios web de forma que se indexe sólo información relacionada con determinadas acciones (p.e. valores del IBEX35), que descarte información no reciente, y que considere vocabularios especializados (“soporte”, “resistencia”, etc. ) a la hora de determinar las piezas de información que es necesario indexar. Una vez que el índice está creado, una aplicación web de búsqueda se encargará de presentar información al usuario, enfatizando y contrastando opiniones, detallando identidad de las fuentes (y, si es posible, informando de su autoridad), etc. Este proyecto proporcina al alumno formación en tecnologías avanzadas de búsqueda y herramientas muy difundidas en el mercado (como Lucene), aplicaciones web, etc.
Sistema de búsqueda web guiado por diversidad, dirigido por Ronald Teijeira Fernández y David E. Losada
El objetivo de este proyecto es la implementación de un buscador web que, dada una consulta, sea capaz de recuperar documentos web que satisfagan la consulta y sean lo más diversos posible. Para la recuperación de documentos se utilizarán herramientas de recuperación de información ya existentes (APIs tales como los de Google, Yahoo!,... que proporcionan direcciones web a partir de una consulta). El ranking proporcionado por estas herramientas será post-procesado de tal forma que se pueda proporcionar al usuario un ranking distinto (que favorezca la diversidad). Es decir, usando técnicas que favorezcan la diversidad de documentos, se proporcionará un ranking de documentos con contenidos de distinta temática (pero, en todo caso, que satisfacen la necesidad del usuario – expresada a través de la consulta).
Por otro lado, la herramienta podrá incorporar capacidades para la estimación y presentación de subtópicos asociados a la consulta. Además, se evaluará la eficiencia de la aplicación y se buscarán alternativas que permitan optimizar el rendimiento de la misma.
La implementación se realizará usando herramientas de diseño de aplicaciones web en Java, así como el API de Lucene para Java