Modelos Probabilísticos para la Inteligencia Artificial y la Minería de Datos

Programa de Doctorado con Mención de Calidad
Curso 2007-2008


METODOLOGÍA DE LA INVESTIGACIÓN CIENTÍFICA

Créditos: 3 Carácter: Obligatorio Lugar de impartición de clases presenciales: Granada.
Período de impartición de clases presenciales: 9 al 13 de Febrero de 2009. 

PROFESORADO

  • Pedro Larrañaga (UPV-EHU), director, 1 crédito.

  • José Antonio Lozano (UPV-EHU), 2 créditos.

OBJETIVOS

    El objetivo principal del presente curso es introducir a los alumnos en el mundo de la investigación. Se pretende que los alumnos adquieran una visión general del mundo de la investigación y que aprendan: diferentes medios de transmisión de información en investigación, métodos de búsqueda de información científica, a redactar documentos científicos. Asimismo, se pretende que los alumnos toman conciencia del proceso de realización de una tesis doctoral.

CONTENIDO

  1. Medios de divulgación científica.

  2. Búsqueda de información.

  3. Redacción de artículos científicos.

  4. Presentaciones.

  5. Organización y presentación de la tesis doctoral.

EVALUACIÓN

La evaluacion del curso se realizara mediante dos actividades. La primera de ellas consiste en la exposición de un trabajo basado en la lectura de varios documentos relacionados con la filosofia de la ciencia. La segunda consiste en la elaboracion de un proyecto de tesis doctoral.

BIBLIOGRAFÍA BÁSICA

  1. A. Fekete (1996) Preparation for research: instruction in interpreting and evaluating research. Proceedings of ACM Technical Symposium in Computer Science Education, Philadelphia, Pennsylvania, USA, pp 93-97.

  2. Witten, I.H. and Bell, T.C. (1993) "Getting research students started: a tale of two courses" SIGCSE Bulletin, 25 (1) 165-169

  3. David F. Beer (Ed.) (2003) Writing and Speaking in the Technology Professions: A Practical Guide , 2nd Edition. Wiley-IEEE Press.

  4. R. Sierra (1995) Tesis doctorales y trabajos de investigación científica. Paraninfo.

  5. R. M. Woelfle (1992) A new guide for better technical presentations. IEEE press.

 

 

BASES ESTADÍSTICAS Y COMPUTACIONALES PARA MGPs

Créditos: 3 Carácter: Optativo Lugar de impartición de clases presenciales: Granada.
Período de impartición de clases presenciales: 9 al 13 de Febrero de 2009. 

PROFESORADO

  • Serafín Moral (UGR), director, 1 crédito

  • Rafael Rumí (UAL), 1 crédito

  • Carmelo Rodríguez Torreblanca (UAL), 1 crédito

OBJETIVOS

  • Conocer los concetos fundamentales de Complejidad Algorítmica. En concreto, las clases de complejidad más habituales, los problemas completos para dichas clases y las clases para resolución aproximada de problemas.

  • Aplicar estos conceptos a problemas de modelos gráficos probabilísticos, conociendo los resultados existentes sobre la complejidad de calcular probabilidades condicionadas, abducción (total y parcial), triangulación y aprendizaje.

  • Comprender trabajos científicos donde se presente resultados de complejidad relativos a MGPs.

  • Repasar los conceptos básicos de variables aleatorias discretas y continuas.

  • Adquirir destrezas de cálculo con distribuciones multivariantes, y entender los conceptos de marginalización y condicionamiento.

  • Conocer los principales métodos de estimación y contraste de hipótesis.

  • Habilidad para resolver problemas de predicción mediante el modelo lineal.

  • Conocimiento del paquete estadístico R.

CONTENIDO

  1. Introducción a la probabilidad.

  2. Distribuciones discretas y continuas.

  3. Distribuciones multivariantes.

  4. Estimación puntual y por intervalos.

  5. Contraste de hipótesis.

  6. Regresión.

  7. Prácticas con software estadístico (R).

  8. NP-completitud.

  9. Complejidad de problemas de optimización.

  10. Algoritmos aproximados y complejidad.

EVALUACIÓN

  • Discusión en un foro en el que el profesor propone preguntas y cuestiones y todos los alumnos tienen que dar respuestas a las mismas. Estas son comentadas posteriormente por el profesor.

  •  Trabajo en el que cada alumno debe de leer y resumir un artículo entre varios propuestos en los que se presenta resultados relativos a la complejidad de problemas asociados a MGPs.

  • Resolución de una relación de ejercicios usando el paquete R.

BIBLIOGRAFÍA BÁSICA

  1. G. Ausiello et al. (1991) Complexity and Approximation. Combinatorial Optimization Problems and Their Approximability Properties. Springer Verlag.

  2. M. DeGroot (1988) Probabilidad y Estadística. Addison-Wesley Iberoamericana.

  3. J.L. Johnson (2003) Probability and Statistics for Computer Science. Ed Wiley-Interscience.

  4. W. Mendenhall, T. Sincich (1997) Probabilidad y Estadística para Ingeniería y Ciencias. Prentice Hall.

  5. D.C. Montgomery, G.C. Runger (2002) Probabilidad y Estadística aplicadas a la Ingeniería. Limusa Wiley.

  6. C.H. Papadimitriou (1994) Computational Complexity. Addison Wesley.

  7. W. N. Venables (1994) Modern applied statistics with S-Plus. Springer.



DE TIPO FUNDAMENTAL

 

FUNDAMENTOS DE MODELOS GRÁFICOS

Créditos: 3 Carácter: Obligatorio Lugar de impartición de clases presenciales: Granada.
Período de impartición de clases presenciales: 9 al 13 de Febrero de 2009. 

PROFESORADO

  • Francisco Javier Díez (UNED), director, 1.5 créditos

  • Concepción Bielza (UPM), 1.5 créditos

OBJETIVOS

Conocer el concepto de independencia probabilista y los modelos gráficos probabilistas más utilizados, incluidos los modelos de decisión y los modelos temporales, así como algunas de las aplicaciones que se han construido con ellos para diferentes problemas del mundo real.

CONTENIDO

  1. Independencia y su representación gráfica.

  2. Causalidad.

  3. Modelos probabilistas: redes bayesianas, redes de Markov, grafos en cadena.

  4. Modelos de decisión: árboles de decisión, diagramas de influencia.

  5. Modelos temporales: redes dinámicas, redes de eventos, PDM, PDMPO.

  6. Aplicaciones de los MGP.

EVALUACIÓN

La evaluación consiste en una serie de problemas y de preguntas de tipo test.

BIBLIOGRAFÍA BÁSICA

  1. E. Castillo, J.M. Gutiérrez y A.S. Hadi.  Sistemas Expertos y Modelos de Redes Probabilísticas. Academia de Ingeniería, Madrid, 1997.

  2. R.G. Cowell, A.P. Dawid, S.L. Lauritzen y D.J. Spiegelhalter. Probabilistic Networks and Expert Systems. Springer-Verlag, Nueva York, 1999.

  3. F.V. Jensen.  Bayesian Networks and Decision Graphs. Springer-Verlag, Nueva York, 2001.

  4. S. Ríos, C. Bielza y A. Mateos. Fundamentos de los Sistemas de Ayuda a la Decisión. Ra-Ma, Madrid, 2002.

 


INFERENCIA EN MGPs

Créditos: 4 Carácter: Obligatorio Lugar de impartición de clases presenciales: Granada.
Período de impartición de clases presenciales: 9 al 13 de Febrero de 2009. 

PROFESORADO

  • Antonio Salmerón (UAL), director, 1 crédito

  • José Antonio Gámez (UCLM), 1 crédito

  • Manuel Gómez (UGR), 1 crédito

  • Andrés Cano (UGR), 1 crédito

OBJETIVOS

  • Conocer los tipos de problemas que pueden resolverse con algoritmos de inferencia en MGPs.
  • Estudio de los fundamentos y complejidad de los algoritmos básicos de propagación exacta en redes bayesianas.
  • Conocer algoritmos avanzados de propagación exacta y aproximada en redes bayesianas y en diagramas de influencia.
  • Conocer metodologías para el tratamiento de variables continuas.
  • Conocer los principales métodos de abducción.

CONTENIDO

  1. Algoritmos exactos.

  2. Algoritmos aproximados de tipo Monte-Carlo.

  3. Algoritmos aproximados deterministas.

  4. Abducción (MAP).

  5. Evaluación de diagramas de influencia.

  6. Evaluación de modelos de Markov.

  7. Inferencia con variables continuas (CG y MTE).

EVALUACIÓN

  • Participación activa en las sesiones presenciales.
  • Resolución de una relación de ejercicios.

BIBLIOGRAFÍA BÁSICA

  1. E. Castillo, J.M. Gutiérrez, A.S. Hadi. Sistemas Expertos y Modelos de Redes Probabilísticas. Academia Española de Ingeniería. 1997.

  2. R.T. Clemen. Making Hard Decisions: An Introduction to Decision Analysis. Duxbury Press. 1997.

  3. J.A. Gámez, S. Moral, A. Salmerón. Advances in Bayesian networks. 2004.

  4. F.V. Jensen. Bayesian networks and decision graphs. Springer Verlag. 2001.

  5. J. Kholas, S. Moral, eds. Handbook of Defeasible Reasoning and Uncertainty Management Systems. Vol 5. Algorithms. Kluwer. 2000.

  6. R.G. Cowell, A. P. Dawid, S. L. Lauritzen, D. J. Spiegelhalter. Probabilistic Networks and Expert Systems Springer-Verlag, 1999

  7. G. Shafer. Probabilistic Expert Systems. SIAM, 1996.

 

APRENDIZAJE DE MGPs

Créditos: 5 Carácter: Obligatorio Lugar de impartición de clases presenciales: Granada.
Período de impartición de clases presenciales: 9 al 13 de Febrero de 2009. 

PROFESORADO

  • Pedro Larrañaga (UPV-EHU), 1 crédito

  • José Antonio Lozano (UPV-EHU), 1 crédito

  • José Miguel Puerta (UCLM), 1 crédito

  • Silvia Acid (UGR), 1 crédito

  • Luis Miguel de Campos (UGR), 1 crédito

OBJETIVOS

Se pretende que el alumno sea capaz de:

  1. Conocer y utilizar los métodos y técnicas de aprendizaje y descubrimiento de modelos gráficos, especialmente redes bayesianas.
  2. Conocer y utilizar los diversos métodos de clasificación automática, tanto supervisada como no supervisada, basados en modelos gráficos probabilísticos, así como métodos de preprocesamiento como selección de variables y discretización.
  3. Conocer las posibilidades reales de aplicación de estas técnicas en diferentes áreas del conocimiento.
  4. Estudiar las principales medidas de puntuacion de una red bayesiana dados los datos de entrada en el aprendizaje automatico.
  5. Conocer los principales algoritmos de busqueda utilzados en el aprendizaje de redes bayesianas en distintos espacios de estados: grafos, ordenes y clases de equivalencia.

CONTENIDO

  1. Aprendizaje de redes bayesianas.

    • Métodos basados en tests de independencias.

    • Métodos de puntuación+búsqueda.

    • Métodos para valores ausentes.

    • Tratamiento de variables continuas.

  2. Aprendizaje de clasificadores.

    • Clasificación supervisada.

    • Clasificación no supervisada.

    • Selección de variables.

  3. Validación de modelos.

  • Bootstrapping.

  • Validación cruzada.

 

EVALUACIÓN

  • Realización de distintos tipos de prácticas.
  • Pruebas periódicas, exámenes finales (orales, escritos).
  • Trabajos presentados y académicamente dirigidos, teóricos o prácticos.
  • Participación activa en clases, seminarios, etc.

BIBLIOGRAFÍA BÁSICA

  1. Jordan, M.I. (eds.), 1999. Learning in Graphical Models, MIT Press.

  2. Neapolitan, R., 2004. Learning Bayesian Networks. Prentice-Hall.

  3. E. Castillo, J.M. Gutiérrez, A.S. Hadi. Sistemas Expertos y Modelos de Redes Probabilísticas. Academia Española de Ingeniería. 1997.

  4. P. Spirtes, C. Glymour, R. Scheines. Causation, Prediction, and Search. Lecture Notes in Statistics 81, Springer. 1993.

 


MODELOS GRÁFICOS PROBABILISTAS EN MEDICINA

Créditos: 3 Carácter: Optativo Lugar de impartición de clases presenciales: A distancia.
Período de impartición de clases presenciales: Febrero-junio de 2009. 

PROFESORADO

  • Francisco Javier Díez (UNED), director, 1 crédito

  • Concepción Bielza (UPM), 1 crédito

  • Carmen Lacave (UCLM), 1 crédito

OBJETIVOS

Conocer los conceptos médicos probabilistas más importantes, ser capaz de construir modelos gráficos para diferentes problemas médicos y utilizarlos para el diagnóstico y el análisis de decisiones.

CONTENIDO

  1. Conceptos médicos probabilistas.

  2. Construcción de redes bayesianas en medicina.

    • Grafos causales.

    • Modelos canónicos.

    • Obtención de los parámetros numéricos.

  3. Funciones de utilidad en medicina.

  4. Análisis de coste-efectividad.

  5. Estudio de sesgos.

  6. Explicación de la inferencia.

EVALUACIÓN

La evaluación consiste en la lectura de una serie de artículos recomendados y en la redacción de un trabajo que sintetice dichos artículos.

BIBLIOGRAFÍA BÁSICA

  1. F. J. Díez Vegas Probabilidad y Teoría de la Decisión en Medicina UNED, Madrid, 2000. Revisado en 2003.

  2. M.F. Drummond, B. O’Brien, G.L. Stoddart y G.W. Torrance. Methods for the Economic Evaluation of Health Care Programmes. Oxford University Press, Oxford, RU, 1997, 2ª edición.

  3. M.R. Gold, J.E. Siegel, L.B. Russell y M.C. Weinstein (eds.). Cost-Effectiveness in Health and Medicine. Oxford University Press, Nueva York, 1996.

  4. M. Gómez Olmedo. IctNeo: Un sistema de Ayuda a la Decisión para el Tratamiento de la Ictericia en Recién Nacidos. Tesis doctoral, Dpto. Inteligencia Artificial, Universidad Politécnica de Madrid, 2001.

  5. H.C. Sox, M.A. Blatt, M.C. Higgins y K.I. Marton. Medical Decision Making. Butterworth-Heinemann, 1988.


MODELOS AUTOMÁTICOS DE GESTIÓN DE INFORMACIÓN

Créditos: 3 Carácter: Optativo Lugar de impartición de clases presenciales: Granada.
Período de impartición de clases presenciales: Febrero-junio. 

PROFESORADO

  • Juan Huete (UGR), director, 1.5 créditos

  • Juan Manuel Fernández Luna (UGR), 1.5 créditos

OBJETIVOS

Se pretende que el alumno sea capaz de:
  • Comprender los fundamentos de los sistemas de recuperación de información.
  • Conocer y emplear modelos avanzados de R.I. probabilísticos: Modelos basados en Modelos Gráficos Probabilísticos
  • Estudiar la aplicación de algoritmos de clasificación para la detección de correo spam.
  • Conocer aplicaciones reales en diversos ámbitos, especialmente en la web y comercio electrónico.

CONTENIDO

  1. Recuperación de información.

  2. Filtrado de correo electrónico.

  3. Comercio electrónico: sistemas de recomendación.

EVALUACIÓN

Para realizar una evaluación objetiva, se deberán de realizar distintos trabajos sobre el contenido del curso. Así proponemos dos tipos de trabajos distintos:
  • Realización de distintos tipos de prácticas, como por ejemplo la implementación de un filtro spam utilizando el clasificador Naive Bayes o la implementación de un modelo de Recuperación de Información básico.
  • Trabajos teóricos académicamente dirigidos
  • Pruebas finales (exámenes orales y/o escritos).

BIBLIOGRAFÍA BÁSICA

  1. R. Baeza-Yates, B. Ribeiro-Neto. Modern Information Retrieval. Addison-Wesley. 1999.

  2. K. Sparck-Jones, P. Willett, eds. Readings in Information Retrieval. Morgan Kaufman. 1997.

  3. Information Processing and Management Vol. 49, N. 5. 2004 (número especial).

 

ANÁLISIS ESTADÍSTICO DE DATOS

Créditos: 3 Carácter: Optativo Lugar de impartición de clases presenciales: Almería.
Período de impartición de clases presenciales: 18 al 24 de mayo de 2009. 

PROFESORADO

  • Carmelo Rodríguez Torreblanca (UAL), director, 1 crédito

  • Antonio Salmerón Cerdán (UAL), 1 crédito

  • Rafael Rumí Rodríguez (UAL), 1 crédito

OBJETIVOS

Se pretende que el alumno sea capaz de:
  • Diseñar un entorno experimental para determinar la validez de una acción.
  • Conocer los principales métodos de estimación y contraste de hipótesis no paramétricos.
  • Conocer las bases del enfoque bayesiano de la estadística, principalmente en su vertiente aplicada a los MGPs.
  • Ser capaz de analizar un conjunto de datos multivariantes usando los métodos estadísticos clásicos.

CONTENIDO

  1. Análisis de la varianza.

  2. Estimación no paramétrica.

  3. Estadística bayesiana.

  4. Análisis cluster, discriminante y de componentes principales.

EVALUACIÓN

  • Participación activa en las sesiones presenciales.
  • Resolución de una relación de ejercicios sobre los contenidos de la asignatura.

BIBLIOGRAFÍA BÁSICA

  1. J.O. Berger (1988) ''Statistical decision theory and Bayesian Analysis''. Springer-Verlag

  2. J.M. Bernardo, Smith (1994) ''Bayesian Theory''. Wiley. New York.

  3. M. DeGroot (1970) ''Optimal Statistical Decision''. Wiley. New York.

  4. L.D. Jobson (1992): Applied Multivariate Data Analysis. Vol. I y II. Ed. Springer Verlag.

  5. D. Peña (2002): Análisis de Datos Multivariantes. McGraw Hill.

  6. Rohatgi (1973) An Introduction to Probability. Theory and Mathematical Statistics. John Wiley.



METAHEURÍSTICAS Y MODELOS GRÁFICOS PROBABILÍSTICOS

Créditos: 3 Carácter: Optativo Lugar de impartición de clases presenciales: Almería.
Período de impartición de clases presenciales: 18 al 24 de Mayo de 2009. 

PROFESORADO

  • José Antonio Gámez (UCLM), director, 1.5 créditos

  • José Miguel Puerta (UCLM), 1.5 créditos

OBJETIVOS

  • Introducir al alumno en las técnicas metaheurísticas.
  • Estudio de algoritmos evolutivos basados en el uso de modelos gráficos probabilísticos como operador de variación.
  • Uso de algoritmos metaheurísticos en problemas de aprendizaje e inferencia en modelos gráficos probabilísticos.

CONTENIDO

  1. Resolución de problemas complejos en MGPs usando metaheurísticas

Aprendizaje de RBs.

Triangulación.

Abducción.

Propagación de prob. imprecisas.

   2. Uso de MGPs en metaheurísticas: Algoritmos de estimación de distribuciones (EDAs)

  • Introducción

  • EDAs en optimización combinatoria.

   3. Modelos univariados, bivariados, n-variados

  • EDAs en optimización numérica.

EVALUACIÓN

  • Participación activa en las sesiones presenciales.
  • Realización de un trabajo o implementación relacionado con los métodos estudiados en el curso.

BIBLIOGRAFÍA BÁSICA

  1. P. Larrañaga and J. A. Lozano (editors) Estimation of Distribution Algorithms. A new tool for Evolutionary Computation. Kluwer Academic Publishers, 2001.

  2. Statistics and Computing. Diversos artículos.

  3. International Journal of Approximate Reasoning. Diversos artículos.

  4. IEEE Transactions on Evolutionary Computation. Diversos artículos.

 

APLICACIONES DE MGPs EN BIOINFORMÁTICA

Créditos: 3 Carácter: Optativo Lugar de impartición de clases presenciales: San Sebastián.
Período de impartición de clases presenciales: 25 al 29 de Mayo de 2009. 

PROFESORADO

  • Iñaki Inza (UPV-EHU), director, 1 crédito

  • Pedro Larrañaga (UPV-EHU), 1 crédito

  • José Antonio Lozano (UPV-EHU), 1 crédito

OBJETIVOS

El curso de aplicaciones de MGP en bioinformática, tratará de que los alumnos adquieran capacidad para determinar cuando un problema de bioinformática puede ser acometido por MGP. Para ello se presentarán varios problemas y su resolución por medio de dicho modelos.

CONTENIDO

  1. Introducción a la bioinformática.

  2. Problemas de optimización en bioinformática

    • Alineamiento de secuencias

    • Plegado de proteínas

    • Estructura terciaria de la proteína

  3. Problemas de clasificación en bioinformática

  • Análisis de microarrays de ADN

  • Identificación de genes

  1. Redes genéticas

EVALUACIÓN

La evaluación se llevará a cabo de dos formas diferentes. Por un lado los alumnos realizarán un presentación de un trabajo de investigación y por otro se evaluará el trabajo práctico en laboratorio con bases de datos provenientes de problemas biológicos.

BIBLIOGRAFÍA BÁSICA

  1.  R. Durban, S., Hedí, S., A. Krogh and G. Mitchison (1998) Biological sequence analysis. Cambridge University Press.

  2. J.E. Ewens and G.R. Grant (2001) Statistical methods in bioinformatics. Springer.

  3. T. Speed (Ed.) (2003) Statistical Analysis of Gene Expression Microarray Data. Chapman & Hall.

  4. G.T. Fogel and D.W. Corne (2003) Evolutionary Computation in Bioinformatics. Morgan Kauffman.

  5. P. Baldi and S. Brunak (2002) Bioinformatics, the machine learning approach. MIT Press.