Programa del Curso

spark.mllib: tipos de datos, algoritmos y utilidades

    Tipos de datos Estadísticas básicas Resumen estadístico Correlaciones Muestreo estratificado Prueba de hipótesis Pruebas de significación de streaming Generación de datos aleatorios
Clasificación y regresión modelos lineales (SVM, regresión logística, regresión lineal)
  • barnalegur Bayes
  • Árboles de decisión
  • conjuntos de árboles (Random Forests y árboles potenciados por gradiente)
  • Regresión isotónica
  • Filtrado colaborativo mínimos cuadrados alternos (ALS)
  • Agrupamiento K-medias
  • Mezcla gaussiana
  • clústeres de iteración de potencia (PIC)
  • Asignación de Dirichlet latente (LDA)
  • Bisección de K-medias
  • Transmisión de K-means
  • Reducción de dimensionalidad descomposición de valores singulares (SVD)
  • análisis de componentes principales (PCA)
  • Extracción y transformación de características
  • Minería de patrones frecuente FP-crecimiento
  • Reglas de la asociación
  • PrefixSpan
  • Métricas de evaluación
  • Exportación de modelos PMML
  • Optimización (desarrollador) Descenso de gradiente estocástico
  • BFGS DE MEMORIA LIMITADA (L-BFGS)
  • spark.ml: API de alto nivel para canalizaciones de ML
  • Resumen: estimadores, transformadores y tuberías Extracción, transformación y selección de entidades Clasificación y regresión Agrupamiento Temas avanzados

    Requerimientos

    Conocimiento de uno de los siguientes:

    • Java
    • Scala
    • pitón
    • SparkR.
      35 horas
     

    Número de participantes


    Comienza

    Termina


    Dates are subject to availability and take place between 09:30 and 16:30.
    Los cursos de formación abiertos requieren más de 5 participantes.

    Testimonios (9)

    Cursos Relacionados

    Categorías Relacionadas