Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Programa del Curso
Introducción
- ¿Qué son Large Language Models (LLMs)?
- LLMs vs modelos tradicionales de PNL
- Descripción general de las características y la arquitectura de los LLM
- Desafíos y limitaciones de los LLM
Comprensión de los LLM
- El ciclo de vida de un LLM
- Cómo funcionan los LLM
- Los componentes principales de un LLM: codificador, decodificador, atención, incrustaciones, etc.
Empezar
- Configuración del entorno de desarrollo
- Instalar un LLM como herramienta de desarrollo, por ejemplo, Google Colab, Hugging Face
Trabajar con LLM
- Explorando las opciones de LLM disponibles
- Creación y uso de un LLM
- Ajuste de un LLM en un conjunto de datos personalizado
Resumen de texto
- Comprender la tarea del resumen de textos y sus aplicaciones
- Uso de un LLM para el resumen de textos extractivos y abstractos
- Evaluar la calidad de los resúmenes generados utilizando métricas como ROUGE, BLEU, etc.
Respuesta a preguntas
- Comprender la tarea de responder preguntas y sus aplicaciones
- Uso de un LLM para responder preguntas de dominio abierto y dominio cerrado
- Evaluar la precisión de las respuestas generadas utilizando métricas como F1, EM, etc.
Generación de texto
- Comprender la tarea de la generación de texto y sus aplicaciones
- Uso de un LLM para la generación de texto condicional e incondicional
- Controlar el estilo, el tono y el contenido de los textos generados mediante parámetros como temperatura, top-k, top-p, etc.
Integración de LLM con otros marcos y plataformas
- Uso de LLM con PyTorch o TensorFlow
- Uso de LLM con Flask o Streamlit
- Uso de LLM con Google Cloud o AWS
Solución de problemas
- Comprender los errores y fallos comunes en los LLM
- Uso de TensorBoard para supervisar y visualizar el proceso de entrenamiento
- Uso de PyTorch Lightning para simplificar el código de entrenamiento y mejorar el rendimiento
- Uso de conjuntos de datos de Hugging Face para cargar y preprocesar los datos
Resumen y próximos pasos
Requerimientos
-
Comprensión del procesamiento del lenguaje natural y el aprendizaje profundo
Experiencia con Python y PyTorch o TensorFlow
Experiencia básica en programación
Audiencia
-
Desarrolladores
Entusiastas de la PNL
Científicos de datos
14 horas