Análisis de Datos, 2014

JESÚS GARCÍA HERRERO
RICARDO ALER MUR
JULIA SIDOROVA
Departamento de Informática
Universidad Carlos III de Madrid
Área:
Computación e Inteligencia Artificial
Titulación:
Grado en Ingeniería Informática
Diciembre, 2014
Imagen cortesía de los profesores. Análisis de Datos. Universidad Carlos III de Madrid
Asignatura organizada en 6 créditos ECTS. 20 sesiones de 2h de teoría y ejercicios, y 10 sesiones de 2h de prácticas con herramientas, además de un tiempo recomendado de 6h semanales (14 semanas) de lecturas, estudio y resolución de ejercicios.
El tiempo total previsto de aprendizaje es de 144h totales.
PRERREQUISITOS Y CONOCIMIENTOS PREVIOS RECOMENDADOS
La asignatura está planteada con un carácter autocontenido, y se incluyen materiales y apuntes que describen las principales técnicas de análisis de datos. Es recomendable haber cursado las asignaturas de Estadística, especialmente para la parte de evaluación, y de Programación, para el conocimiento de la implementación en algunas herramientas, si bien no es un requisito imprescindible para cursar la asignatura. Conviene familiaridad y motivación con conceptos de algoritmos y computación y curiosidad por la aplicación de técnicas nuevas a problemas abiertos.
DESCRIPCIÓN GENERAL DE LA ASIGNATURA
La asignatura presenta las principales técnicas computacionales de análisis de datos de manera general, haciendo énfasis en la evaluación y criterios para decidir qué técnicas son más apropiadas para distintos tipos de problemas.
OBJETIVOS: CONOCIMIENTOS Y CAPACIDADES
Se adquirirán conocimientos de las principales técnicas computacionales de análisis de datos existentes, y criterios para decidir qué técnicas son más apropiadas para distintos tipos de problemas abordados. Además se busca adquirir capacidad de utilizar herramientas que implementan esas técnicas en proyectos reales así como destrezas de análisis crítico de los resultados obtenidos en problemas abiertos.
Los objetivos específicos de aprendizaje son:
- Conocimiento de los conceptos fundamentales sobre modelos estadísticos de los datos, aprendizaje, evaluación y validación de resultados.
- Conocimiento de las técnicas básicas de aprendizaje automático y tipos de problemas que pretenden resolver.
- Capacidad de formular un problema de análisis de datos para una determinada aplicación.
- Planificación de un proyecto de minería de datos, diseñando las diferentes etapas de preparación, modelado, evaluación y análisis.
- Capacidad de analizar resultados y comunicar el alcance del estudio desarrollado.
En resumen, familiarizarse con el trabajo en proyectos exploratorios de aplicación de técnicas novedosas de computación a problemas abiertos.
MATERIAL DOCENTE
Los materiales teóricos comprenden apuntes de la asignatura, diapositivas con las lecciones del programa, referencias bibliográficas y artículos de interés. Además, hay una serie de vídeos con presentaciones de aspectos específicos sobre técnicas avanzadas de interés en la asignatura.
ACTIVIDADES DE EVALUACIÓN O TAREAS PRÁCTICAS
Las prácticas contienen manuales de diferentes herramientas (WEKA, R y RapidMiner), tutoriales para ejercitarse en su uso y una serie de prácticas (algunas resueltas) centradas en aspectos específicos de las técnicas presentadas en el curso. Los ejercicios son enunciados cortos que cubren la teoría de la materia, ejercicios propuestos y exámenes. Se facilitan una serie de cuestionarios y exámenes resueltos que permitirán al alumno realizar pruebas de autoevaluación.
Course Contents
Vídeos de temas avanzados: datos secuenciales, teoría y aplicaciones de los HMMs , 2014
Ejercicios y pruebas de evaluación , 2014
Manuales y ejemplos introductorios , 2014
Bibliografía y lecturas recomendadas , 2014