Web de la asignatura de Informática Documental (3º ITIG)

Año académico: 2007-2008
Centro: ESCUELA POLITECNICA SUPERIOR
Estudios: INGENIERIA TECNICA DE INFORMATICA DE GESTION
Asignatura: INFORMATICA DOCUMENTAL
Ciclo: 1º
Curso: 3º
Cuatrimestre: 1º
Carácter: OPTATIVA
Créditos teóricos: 3
Créditos prácticos: 1,5
Profesor/es: ANTONIO BECERRA TERON
Area: LENGUAJES Y SISTEMAS INFORMATICOS

TEMARIO

Programa de teoría

Tema 1. Bases de Datos y Técnicas Documentales
1.1. Introducción a la documentación automatizada
1.2. Bases de datos documentales
  1.2.1. Definición y contexto
  1.2.2. Bases de datos bibliográficas
  1.2.3 Bases de datos factuales
  1.2.4. Bases de datos textuales
  1.2.5. Bases de datos comerciales
  1.2.6. Protocolos de acceso
1.3. Análisis documental
  1.3.1. Definición de documento
  1.3.2. Elementos de la cadena documental
  1.3.3 Indización manual
  1.3.4. Indización automática
  1.3.5 Clasificación, palabras clave y descriptores
1.4. Lenguajes Documentales
  1.4.1. Definición y contexto
  1.4.2. Lenguajes de estructura jerárquica
  1.4.3. Lenguajes de estructura asociativa
  1.4.4. Tesauro y su representación informática

Tema 2. Fundamentos de los Sistemas de Recuperación Documental
2.1. Introducción a la recuperación documental
  2.1.1. Recuperación documental versus recuperación de datos
2.2. Definición y objetivos
  2.2.1. Tarea del usuario
  2.2.2. Vista lógica de documentos
2.3. Arquitectura de los sistemas de recuperación documental
  2.3.1. Descripción funcional de un sistema de recuperación
  2.3.2. Retroalimentación por relevancia
2.4. Proceso de recuperación
  2.4.1. Operaciones de texto
  2.4.2. Operaciones de consulta
  2.4.3. Modelos clásicos de recuperación documental
2.5. Capacidades de los sistemas de recuperación documental
  2.5.1. Recuperación en bibliotecas
  2.5.2. Recuperación en la Web
  2.5.3. Bibliotecas digitales

Tema 3. Recuperación Documental Booleana
3.1. Introducción a la recuperación documental boolena
3.2. Modelo de recuperación por texto libre
3.3. Modelo de recuperación booleano
  3.3.1. Lenguaje de consulta
  3.3.2. Histórico de consultas
  3.3.3. Operadores booleanos
  3.3.4. Operadores de truncamiento
  3.3.5. Operadores de posición
  3.3.6. Operadores de rango
3.4. Indización y consulta en el modelo booleano
  3.4.1. Archivo de documentos
  3.4.2. Archivo de direccionamiento y posteo
  3.4.3. Proceso de consulta
3.5. Problemas del modelo de recuperación booleano
3.6. Modelo booleano extendido
  3.6.1. Generalización de los operadores para pesos
  3.6.2. Funcionalidad del sistema extendido

Tema 4. Recuperación Documental Espacio-Vectorial
4.1. Introducción a la recuperación espacio-vectorial
  4.1.1. Representación espacio-vectorial de documentos y consulta
  4.1.2. Definición de la función de semejanza espacio-vectorial
4.2. Selección automatizada de términos
  4.2.1. Palabras vacías (stopwords)
  4.2.2. Lematización (stemming)
  4.2.3. Palabras relevantes (keywords)
4.3. Indización y consulta en el modelo espacio-vectorial
  4.3.1. Matriz de asociación documento-término de indización
  4.3.2. Proceso de consulta
4.4. Otros modelos de recuperación
4.5. Perfeccionamiento de la recuperación
  4.5.1. Reformulación de la consulta
  4.5.2. Retroalimentación por relevancia
4.6. Un ejemplo de sistema de recuperación sencillo

Tema 5. Evaluación de la Recuperación Documental
5.1. Introducción a la evaluación de un sistema de recuperación
  5.1.1. Evaluación del rendimiento. Tiempo y espacio
  5.1.2. Rendimiento de la recuperación documental
5.2. Colecciones de evaluación
  5.2.1. Colección TREC
  5.2.2. Colección CACM
5.3. Medidas para la evaluación de un sistema de recuperación
  5.3.1 Exhaustividad y precisión
  5.3.2. Ruido y silencio
  5.3.3. Relación inversa de las medidas de evaluación
5.4. Medidas alternativas
5.5. Medidas de evaluación orientadas el usuario
  5.5.1. Exhaustividad relativa
  5.5.2. Precisión del usuario
  5.5.3. Esfuerzo de la exhaustividad
  5.5.4. Rendimiento por utilidad
5.6. Evaluación de la retroalimentación

Tema 6. Nuevas Perspectivas en los Sistemas Documentales
6.1. Introducción a las perspectivas actuales en recuperación
6.2. Búsqueda en la Web
  6.2.1. Caracterizando la Web
  6.2.2. Motores de búsqueda
6.3. Bibliotecas digitales
  6.3.1. De los OPAC a los portales de Internet
  6.3.2. Biblioteca electrónica y biblioteca digital
  6.3.3. Sistemas de información en bibliotecas
  6.3.4. Perspectivas futuras

Programa de prácticas

PRACTICA 1. Implementación de un sistema de recuperación espacio-vectorial I
1. Pondearación de términos
2. Indización de documentos 

PRACTICA 2. Implementación de un sistema de recuperación espacio-vectorial II
1. Proceso de consulta
2. Generación de resultados

BIBLIOGRAFIA BASICA

  • R. Peña, R. Baeza-Yates and J. Rodríguez. Gestión Digital de la Información. De Bits a Bibliotecas Digitales y la Web. RA-MA, 2002.
  • R. Baeza-Yates and R. Ribeiro-Neto. Modern Information Retrieval. Addison Wesley, 1999.
  • L. Lizasoain. Bases de Datos en CD-ROM. Paraninfo, 1992.

OBSERVACIONES

No existen requerimientos especiales, si bien el haber seguido asignaturas relacionados con la modelización de la información facilita la comprensión y aprovechamiento de la técnicas de documentación automatizada. La asignatura puede tener interés con independencia de la función profesional, por los principios, técnicas y métodos que se presentan y por la visión sobre la tecnología de la documentación automatizada.

EVALUACIÓN

Se fundamenta en la realización de un examen final y una evaluación global de los supuestos prácticos realizados durante el desarrollo del programa práctico.