_____________________________________________________________________________________




Aprendizaje Automático para el Análisis de Datos

RICARDO ALER MUR

Departamento de Nombre Informática, Universidad Carlos III de Madrid

Área: Aprendizaje Automático

Titulación: Grado en Estadística y Empresa

Diciembre, 2019 (segunda ed.)Compartir:    


Horas de clase de teoría y de laboratorio: 21 horas de clase y 21 horas de laboratorio.
Tiempo total previsto de aprendizaje: 42 horas.

 

PRERREQUISITOS Y CONOCIMIENTOS PREVIOS RECOMENDADOS

Conocimientos básicos de estadística.

 

DESCRIPCIÓN GENERAL DEL CURSO

El Aprendizaje Automático es un componente importante en campos tales como el análisis de datos o la minería de datos. Sin dejar de lado una introducción básica, esta asignatura pretende ser un complemento a otras que describan los fundamentos del aprendizaje automático, mediante el desarrollo de temas menos tratados, tales como el aprendizaje con muestras desbalanceadas, o tecnologías básicas para Big Data como MapReduce o Spark.


OBJETIVOS: CONOCIMIENTOS Y CAPACIDADES

1.) DE CONOCIMIENTO:

  • Dominar los conceptos básicos sobre el aprendizaje automático
  • Conocer las diferentes tareas que se pueden resolver con aprendizaje automático
  • Conocer las técnicas de aprendizaje automático y su tipología
  • Conocer la metodología de extracción de conocimiento y las fases que conlleva
  • Conocer herramientas disponibles para aprendizaje automático

2.) DE COMPRENSION:

  • Comprender los conceptos básicos del aprendizaje automático
  • Comprender los fundamentos y las motivaciones del aprendizaje automático
  • Comprender la metodología de trabajo y las distintas fases del aprendizaje automático
  • Comprender la utilidad de las diferentes técnicas del aprendizaje automático
  • Comprender la relación entre complejidad del modelo, cantidad de datos, características del problema y sobreaprendizaje

3.) DE APLICACIÓN:

  • Analizar los dominios y diseñar procesos de aprendizaje automático acordes al problema.
  • Evaluar las prestaciones y eficiencia de los distintos métodos de aprendizaje automático
  • Trabajar sobre dominios específicos y contrastar distintas técnicas para comprobar su rendimiento en la extracción de conocimiento

4.) CRITICA O VALORACIÓN

  • Selección de algoritmos, selección de modelos y ajuste de parámetros.
  • Considerar la relación entre coste computacional y mejora marginal de diferentes soluciones
  • Valoración de si los resultados obtenidos son adecuados, comparados con el azar o algoritmos básicos


MATERIAL DOCENTE

El material docente consiste fundamentalmente de las transparencias usadas durante las clases y también de tutoriales de introducción a MLR (librería de aprendizaje automático para R).


 ACTIVIDADES DE EVALUACIÓN O TAREAS PRÁCTICAS

Se aportan 3 prácticas a completar durante la asignatura:

1) Aprendizaje Automático básico. En esta práctica se trabajan los conceptos básicos de aprendizaje automático (entrenamiento de modelos, evaluación, ajuste de hiper-parámetros). Para completar la práctica es importante haber realizado previamente el tutorial de MLR básico (MLR es la librería de R que se usa en la asignatura para llevar a cabo todas las operaciones de aprendizaje automático).

2) Muestras desbalanceadas. En esta práctica se trabajan las maneras de resolver problemas con muestras desbalanceadas. Para realizarla, es necesario haber completado previamente el tutorial MLR sobre este tema (también presente en el curso).

3) Spark: Por último, se aborda un pequeño trabajo sobre Spark (aprendizaje automático con Big Data), en el que se usan las librerías de R dplyr y sparklyr. Es importante también haber completado previamente el tutorial correspondiente (disponible en el curso).


Última modificación: martes, 22 de marzo de 2022, 16:52