|
||||
Web de la asignatura de Informática Documental (3º ITIG) |
||||
|
Guiones de prácticasPráctica 1. Implementación de un sistema de recuperación espacio-vectorial I. Ponderación de términos e indización de documentos.
Esta práctica constituye la primera etapa en el proceso de implementación de un sistema de recuperación basado en el modelo espacio-vectorial. Concretamente, corresponde a las etapas de selección de términos de indización mediante los procesos de eliminación de palabras vacías y lematización, obteniendo, finalmente, la ponderación automática de términos de indización o vista lógica de los documentos. En la práctica, se deberá realizar un programa C++ que dado un conjunto de documentos constituyendo un fondo documental automatizado permita obtener los índices inversos asociados a cada uno de los documentos, donde éstos aparecen caracterizados en función de la relevancia de los términos que contiene. Para esta práctica, podemos utilizar como referencia los siguientes tutoriales del lenguaje C en general, y el manejo de archivos. (1) Tutorial de C. Universidad de Navarra. (2) Manejo de archivos en C. Universidad de La Concepción (3) Colección de documentos para la práctica. (4) Lista de palabras vacías o stopwords. (5) Introducción al sistema de control de versiones CVS. (6) Eclipse. Entorno de Desarrollo Integrado (Archivos). (7) Manual de Instalación de Eclipse y CygWin. (8) Guía de Instalación de MONO. Práctica 2. Implementación de un sistema de recuperación espacio-vectorial II. Proceso de consulta y generación de resultados. La segunda práctica representa la culminación del proceso de recuperación implementando el proceso de consulta con la traducción de la consulta y su representación en forma de vector k-dimensional y la recuperación de los documentos más relevantes con respecto a la consulta planteada. El alumno deberá implementar en el programa anterior el proceso de traducción de la consulta, y la generación de resultados implementando la función de semejanza como la distancia coseno entre los vectores del espacio k-dimensional. |
![]() |