Programa del Curso
Preprocesamiento de datos
Data Cleaning
Integración y transformación de datos
Reducción de datos
Discretización y generación de jerarquías de conceptos
Inferencia estadística
Distribuciones de probabilidad, Variables aleatorias, Teorema del límite central
Muestreo
Intervalos de confianza
Inferencia estadística
Prueba de hipótesis
Regresión lineal multivariante
Especificación
Selección de subconjuntos
Estimación
Validación
Predicción
Métodos de clasificación
Regresión logística
Análisis discriminante lineal
K-Vecinos más cercanos
Bayes ingenuo
Comparación de métodos de clasificación
Neural Networks
Adaptación de redes neuronales
Problemas de redes neuronales de entrenamiento
Árboles de decisión
Árboles de regresión
Árboles de clasificación
Árboles frente a modelos lineales
Embolsado, Random Forests, Potenciador
Embolsado
Random Forests
Impulsar
Máquinas de vectores de soporte y disco flexible
Clasificador de margen máximo
Clasificadores de vectores de soporte
Máquinas de vectores de soporte
2 y más clases SVM's
Relación con la regresión logística
Análisis de Componentes Principales
Agrupamiento
Agrupación en clústeres de K-means
Agrupamiento de K-medoides
Agrupación jerárquica
Agrupación en clústeres basada en la densidad
Evaluación y selección de modelos
Sesgo, varianza y complejidad del modelo
Error de predicción en la muestra
El enfoque bayesiano
Validación cruzada
Bootstrap Métodos