Procesamiento de Lenguaje Natural con Aprendizaje Profundo: Ejercicios

Ejercicios

_____________________________________________________________________________________

Enlaces a los ejercicios

5.1. Cómo cargar un dataset desde Hugging Face
En este ejercicio, aprenderemos a cargar un dataset alojado en Hugging Face.

5.2. Cómo cargar un dataset desde local en un objeto Dataset
En este ejercicio, aprenderemos a cargar un dataset alojado en nuestra unidad de google drive o en un repositorio. También veremos la forma más eficiente para acceder a sus datos.

5.3. Algunos métodos útiles para trabajar con objetos DatasetDict.
En este ejercicio, conoceremos y practicaremos con algunos métodos muy útiles de las clases DatasetDict y Dataset. Estos métodos permitirán eliminar y renombrar campos, seleccionar instancias usando condiciones, aplicar funciones a todo el dataset, etc.

5.4. Cómo crear particiones (splits) en un objeto Dataset
En este ejercicio, aprenderemos a dividir un objeto Dataset para crear un objeto DictDataset con las particiones (splits) para entrenar, validar y evaluar un transformer.

5.5. Tokenización en transformers
En este ejercicio, aprenderemos a tokenizar un texto con el tokenizador de un transformer y estudiaremos su salida. También trabajaremos con el concepto wordpiece tokenizacion.

5.6. Aplicando padding y truncation
En este ejercicio, aprenderemos a tokenizar una colección de textos, revisaremos los conceptos de padding y truncation y aprenderemos a aplicarlos con un tokenizador de un transformer.

5.7. Cómo usar un transformer para inferir (pipelines)
En este ejercicio, aprenderemos a utilizar la clase Pipelines, que nos permite cargar transformer que ya han sido ajustados para una tarea y utilizarlos directamente para inferir sobre nuevos textos.

5.8. Cómo ajustar (fine-tuning) un transformer
En este ejercicio, aprenderemos a ajustar (fine-tuning) para la tarea de clasificación de textos.

Last modified: Wednesday, 4 October 2023, 4:39 PM