Contacta con nosotros

Temario del curso

Introducción a los Ecosistemas de Big Data

  • Visión general de las tecnologías y arquitecturas de big data.
  • Procesamiento por lotes frente a procesamiento en tiempo real.
  • Estrategias de almacenamiento de datos para escalabilidad.

Procesamiento Avanzado de Datos con Apache Spark

  • Optimización de trabajos de Spark para rendimiento.
  • Transformaciones y acciones avanzadas.
  • Trabajo con streaming estructurado (structured streaming).

Machine Learning a Gran Escala

  • Técnicas de entrenamiento de modelos distribuidos.
  • Ajuste de hiperparámetros en grandes conjuntos de datos.
  • Despliegue de modelos en entornos de big data.

Deep Learning para Big Data

  • Integración de TensorFlow y PyTorch con Spark.
  • Pipelines de entrenamiento de deep learning distribuido.
  • Casos de uso en análisis de imágenes, texto y series temporales.

Análisis en Tiempo Real y Streaming de Datos

  • Apache Kafka para la ingestión de datos en streaming.
  • Frameworks de procesamiento de flujos.
  • Monitoreo y alertas en sistemas en tiempo real.

Gobernanza, Seguridad y Ética de los Datos

  • Requisitos de privacidad y cumplimiento normativo de datos.
  • Control de acceso y cifrado en sistemas de big data.
  • Consideraciones éticas en el análisis a gran escala.

Integración de Big Data con Inteligencia Empresarial

  • Visualización de datos y tableros (dashboards) para big data.
  • Conexión de pipelines de big data con herramientas de BI.
  • Impulso de resultados empresariales mediante análisis avanzados.

Resumen y Próximos Pasos

Requerimientos

  • Fuerte comprensión de los conceptos de análisis de datos y modelado estadístico.
  • Experiencia con herramientas de procesamiento de datos y lenguajes de programación como Python, R o Scala.
  • Conocimiento de frameworks de computación distribuida como Hadoop o Spark.

Público Objetivo

  • Científicos de datos que buscan dominar el procesamiento de datos a gran escala y los análisis predictivos.
  • Analistas senior que desean diseñar e implementar flujos de trabajo analíticos avanzados.
  • Profesionales de I+D enfocados en soluciones innovadoras basadas en datos.
 42 Horas

Número de participantes


Precio por participante

Testimonios (2)

Próximos cursos

Categorías Relacionadas