Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Machine Learning Introducción
- Tipos de aprendizaje automático – supervisado vs no supervisado
- Del aprendizaje estadístico al aprendizaje automático
- El flujo de trabajo del data mining: comprensión del negocio, preparación de datos, modelado, implementación
- Elegir el algoritmo adecuado para la tarea
- Sobredispersión y el compromiso sesgo-varianza
Python y Resumen de Bibliotecas ML
- Por qué usar lenguajes de programación para ML
- Elegir entre R y Python
- Tutorial rápido de Python y Jupyter Notebooks
- Bibliotecas de Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Pruebas y Evaluación de Algoritmos ML
- Generalización, sobredispersión y validación del modelo
- Estrategias de evaluación: holdout, validación cruzada, bootstrapping
- Métricas para regresión: ME, MSE, RMSE, MAPE
- Métricas para clasificación: precisión, matriz de confusión, clases desequilibradas
- Visualización del rendimiento del modelo: curva de beneficio, curva ROC, curva de elevación
- Selección y búsqueda en cuadrícula del modelo para ajuste
Preparación de Datos
- Importación y almacenamiento de datos en Python
- Análisis exploratorio y estadísticas descriptivas
- Gestión de valores faltantes y outliers
- Estandarización, normalización y transformación
- Codificación de datos cualitativos y manipulación de datos con pandas
Algoritmos de Clasificación
- Clasificación binaria vs multiclase
- Regresión logística y funciones discriminantes
- Naïve Bayes, k-vecinos más cercanos
- Árboles de decisión: CART, Random Forests, Bagging, Boosting, XGBoost
- Máquinas de vectores soporte y núcleos
- Técnicas de aprendizaje en ensambles
Regresión y Predicción Numérica
- Mínimos cuadrados y selección de variables
- Métodos de regularización: L1, L2
- Regresión polinomial y modelos no lineales
- Árboles de regresión y splines
Neural Networks
- Introducción a las redes neuronales y el aprendizaje profundo
- Funciones de activación, capas y retropropagación
- Multilayer perceptrons (MLP)
- Uso de TensorFlow o PyTorch para modelado básico de redes neuronales
- Redes neuronales para clasificación y regresión
Ventas Forecasting y Predictive Analytics
- Pronóstico basado en series temporales vs regresión
- Gestión de datos estacionales y basados en tendencias
- Construcción de un modelo de pronóstico de ventas utilizando técnicas ML
- Evaluación de la precisión del pronóstico e incertidumbre
- Business interpretación y comunicación de resultados
Unsupervised Learning
- Técnicas de agrupamiento: k-means, k-medoids, agrupamiento jerárquico, SOMs
- Reducción de dimensionalidad: PCA, análisis factorial, SVD
- Escala multidimensional
Mining de Texto
- Preprocesamiento y tokenización del texto
- Bolsa de palabras, stemming y lematización
- Análisis de sentimientos y frecuencia de palabras
- Visualización de datos de texto con nubes de palabras
Sistemas de Recomendación
- Filtrado colaborativo basado en usuarios e ítems
- Diseño y evaluación de motores de recomendaciones
Minería de Patrones Asociativos
- Juegos frecuentes de elementos y algoritmo Apriori
- Análisis del cesto de compras y razón de elevación
Detección de Outliers
- Análisis de valores extremos
- Métodos basados en distancia y densidad
- Detección de outliers en datos de alta dimensionalidad
Machine Learning Estudio de Caso
- Comprender el problema del negocio
- Preprocesamiento de datos e ingeniería de características
- Selección y ajuste de parámetros del modelo
- Evaluación y presentación de hallazgos
- Implementación
Resumen y Próximos Pasos
Requerimientos
- Conocimiento básico de conceptos de aprendizaje automático, como el aprendizaje supervisado y no supervisado
- Familiaridad con Python programación (variables, bucles, funciones)
- Alguna experiencia en manejo de datos utilizando bibliotecas como pandas o NumPy es útil pero no obligatoria
- No se espera experiencia previa con modelado avanzado o redes neuronales
Público objetivo
- Científicos de datos
- Business analistas
- Ingenieros de software y profesionales técnicos que trabajan con datos
28 Horas