Salta al contenido principal
Panel lateral
Buscar (añada tildes).
Cerrar
Buscar (añada tildes).
Selector de búsqueda de entrada
Español - Internacional (es)
English (en)
Español - Internacional (es)
Entrar
Procesamiento de Lenguaje Natural con Aprendizaje Profundo
Inicio
OCW-UC3M
Conócenos
Cómo participar
Buscar cursos por:
Titulación
Año
Título del curso
Ayuda
Preguntas frecuentes
Inicio
OCW-UC3M
Conócenos
Cómo participar
Buscar cursos por:
Titulación
Año
Título del curso
Ayuda
Preguntas frecuentes
Pantalla completa
Vista estándar
Cursos
Ingeniería
Informática
Procesamiento de Lenguaje Natural con Aprendizaje Profundo
Tema 4: Word Embeddings
Ejercicios
Ejercicios
_____________________________________________________________________________________
Enlaces a los ejercicios
4.1.
Cómo usar los modelos de word embeddings de spacy
.
En este ejercicio, aprenderás a cargar un modelo en spacy y utilizar sus vectores de palabras.
4.2.
Librería Gensim
.
En este ejercicio, practicarás con la librería de Python Gensim, una de las más populares para entrenar y utilizar modelos de word embeddings.
4.3.
Cómo entrenar un modelo de word embeddings con la librería Gensim
.
En este ejercicio, usaremos la librería de Python Gensim para entrenar un modelo de word embeddings a partir de una colección de textos.
4.4.
Cómo crear una matriz de embeddings a partir de un modelo pre-entrenado de word embeddings
.
En este ejercicio, crearemos una matriz de embeddings a partir de un modelo de embeddings. Esta matriz nos servirá para inicializar los vectores de los tokens como entrada para un modelo CNN o BiLSTM.
4.5.
CNN inicializado con word embeddings y aplicado a la multi-clasificación de mensajes sexistas
En este ejercicio, vamos a crear, entrenar y evaluar un modelo CNN para la tarea de multi-clasificación de mensajes sexistas. Esta vez, vamos a inicializar los pesos de la red con un modelo de word embeddings.
Última modificación: jueves, 5 de octubre de 2023, 12:32
Actividad previa
Vídeos
Próxima actividad
Material de estudio
Ir a...
Ir a...
Presentación
Programa
Material de estudio
Vídeos Parte 1: Introducción y primeros pasos en Google Colaboratory
Vídeos Parte 2: Librería NLTK: tokenización, lematización, stemming y stopwords
Vídeos Parte 3: Librería Spacy: tokenización, análisis sintáctico y reconocomiento de entidades.
Ejercicios
Material de estudio
Vídeos
Ejercicios
Material de estudio
Vídeos
Ejercicios
Material de estudio
Vídeos
Material de estudio
Vídeos Parte 1: Cómo cargar datasets para transformers
Vídeos Parte 2: Preprocesando textos para transformers (tokenización)
Vídeos Parte 3: Trabajando con transformers
Ejercicios
Material de estudio
Vídeos
Ejercicios
Material de estudio
Vídeos
Ejercicios
Prácticas
Bibliografía
Otros recursos
Profesorado