_____________________________________________________________________________________
|
Aprendizaje Automático para el Análisis de Datos
RICARDO ALER MUR
|
---|
Horas de clase de teoría y de laboratorio: 21 horas de clase y 21 horas de laboratorio.
Tiempo total previsto de aprendizaje: 42 horas.
El Aprendizaje Automático es un componente importante en campos tales como el análisis de datos o la minería de datos. Sin dejar de lado una introducción básica, esta asignatura pretende ser un complemento a otras que describan los fundamentos del aprendizaje automático, mediante el desarrollo de temas menos tratados, tales como el aprendizaje con muestras desbalanceadas, o tecnologías básicas para Big Data como MapReduce o Spark.
1.) DE CONOCIMIENTO:
2.) DE COMPRENSION:
3.) DE APLICACIÓN:
4.) CRITICA O VALORACIÓN
El material docente consiste fundamentalmente de las transparencias usadas durante las clases y también de tutoriales de introducción a MLR (librería de aprendizaje automático para R).
ACTIVIDADES DE EVALUACIÓN O TAREAS PRÁCTICAS
Se aportan 3 prácticas a completar durante la asignatura:
1) Aprendizaje Automático básico. En esta práctica se trabajan los conceptos básicos de aprendizaje automático (entrenamiento de modelos, evaluación, ajuste de hiper-parámetros). Para completar la práctica es importante haber realizado previamente el tutorial de MLR básico (MLR es la librería de R que se usa en la asignatura para llevar a cabo todas las operaciones de aprendizaje automático).
2) Muestras desbalanceadas. En esta práctica se trabajan las maneras de resolver problemas con muestras desbalanceadas. Para realizarla, es necesario haber completado previamente el tutorial MLR sobre este tema (también presente en el curso).
3) Spark: Por último, se aborda un pequeño trabajo sobre Spark (aprendizaje automático con Big Data), en el que se usan las librerías de R dplyr y sparklyr. Es importante también haber completado previamente el tutorial correspondiente (disponible en el curso).