Temario del curso
Introducción
Visión general de los enfoques de acceso a datos (Hive, bases de datos, etc.)
Visión general de las características y la arquitectura de Spark
Instalación y configuración de Spark
Comprensión de Dataframes en Spark
Definición de tablas e importación de conjuntos de datos
Consulta de DataFrames utilizando SQL
Ejecución de agregaciones, JOINs y consultas anidadas
Carga y acceso a datos
Consulta de diferentes tipos de datos
- JSON, Parquet, etc.
Consulta de Data Lakes con SQL
Solución de problemas
Resumen y conclusión
Requerimientos
- Experiencia con consultas SQL
- Experiencia en programación en cualquier lenguaje
Audiencia
- Analistas de datos
- Científicos de datos
- Ingenieros de datos
Testimonios (3)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
La combinación de teoría y práctica con herramientas como databricks