Programa del Curso
Cimientos de Almacenes de Datos
- Propósito, componentes y arquitectura del almacén
- Marts de datos, almacenes empresariales y patrones lakehouse
- Fundamentos de OLTP vs OLAP y separación de cargas de trabajo
Modelado Dimensional
- Facts, dimensiones y granularidad
- Esquema estrella vs esquema nieve
- Tipo y manejo de dimensiones en cambio lento
Procesos ETL y ELT
- Estrategias de extracción desde OLTP y APIs
- Transformaciones, limpieza de datos y conformidad
- Patrón de carga, orquestación y gestión de dependencias
Calidad de Datos y Gestión de Metadatos
- Perfilar y reglas de validación de datos
- Alineación de datos maestros y referenciales
- Linaje, catálogos y documentación
Análisis y Rendimiento
- Conceptos de cubos, agregados y vistas materializadas
- Agrupamiento, clusterización e índices para análisis
- Gestión de cargas de trabajo, caché y optimización de consultas
Seguridad y Gobierno
- Control de acceso, roles y seguridad por fila
- Consideraciones de cumplimiento y auditoría
- Prácticas de respaldo, recuperación y fiabilidad
Arquitecturas Modernas
- Almacenes de datos en la nube y elasticidad
- Ingesta en streaming y análisis en tiempo casi real
- Otimitzación de costos y monitoreo
Capstone: De la Fuente al Esquema Estrella
- Modelado de procesos de negocio en hechos y dimensiones
- Construcción de flujos de trabajo ETL o ELT completo
- Publishing de paneles y validación de métricas
Resumen y Próximos Pasos
Requerimientos
- Comprensión de bases de datos relacionales y SQL
- Experiencia en análisis de datos o informes
- Familiaridad básica con plataformas de datos en la nube u on-premises
Público objetivo
- Analistas de datos que se están trasladando a almacenes de datos
- Desarrolladores de BI y ingenieros ETL
- Arquitectos de datos y líderes de equipo
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
muy interactivo...
Richard Langford
Curso - SMACK Stack for Data Science
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
Aprende sobre Spark Streaming, Databricks y AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática