Procesamiento de Lenguaje Natural con Aprendizaje Profundo: Ejercicios

Ejercicios

_____________________________________________________________________________________

Enlaces a los ejercicios

1.1. Librería spacy
En este ejercicio, estudiaremos la librería de Python spacy, con la que realizaremos algunas de las principales tareas básicas de PLN como la tokenización, la lematización, el análisis de dependencias o el reconocimiento de entidades.

1.2. Librería nltk
En este ejercicio, estudiaremos otra de las librerías de Python más populares para tareas básicas de PLN, nltk.

1.3. Clasificación binaria de mensajes sexistas (con SVM)
En este ejercicio, trabajaremos con el dataset de la competición EXIST 2021 (http://nlp.uned.es/exist2021/) cuyo objetivo era la detección de mensajes sexistas. Vamos a desarrollar un pipeline encargado de procesar los textos y entrenar un algoritmo de clasificación binaria (SVM). Además, también evaluaremos el pipeline sobre el conjunto de evaluación de EXIST.

1.4. Cómo crear splits de un dataset y cómo visualizar un dataset.
En este ejercicio, aprenderemos a dividir un dataset en subconjuntos. También aprenderemos a visualizar alguna información relevante de un dataset para las aplicaciones de PLN como su distribución de clases o la distribución de los tamaños de sus textos.

Última modificación: miércoles, 27 de septiembre de 2023, 13:53