CIENCIA DE DATOS Y BIG DATA
SPARK (CON RDDS)
Fecha de Inicio: 5 de octubre de 2025
Duración: 15 Horas
Modalidades: Live Stream / Presencial (C. de México)
Inversión: $5,499.00 + I.V.A. / $6,499.00 + I.V.A.
Promoción: 20% de Descuento
MÓDULO I:
- Instalación de PySpark en una Máquina EC2
MÓDULO II:
- Creación de RDDs
- Carga de Datos
- Operaciones con RDDs
- Map, Reduce, Filter, Union, Intersection, Group, Distinct
- KeyFunctions
- Persistencia
- Variables Broadcast
PRÁCTICA: Construcción de Wordcloud en Tiempo Real
Andrés Octavio
Actuario, científico de datos en BBVA: forma parte de un grupo de Científicos de Datos en el área de ingeniería con tareas de desarrollar modelos predictivos para las diferentes Subdirecciones. Trabaja y explota la volumetría de las bases con Spark y modelos en Pyspark, Python y R (Árboles y Bosques de decisión, regresión logística, Perceptrón Multicapa, Cluster y Análisis de componentes principales, entre otros). Cuenta con amplia experiencia docente, dirigiendo cursos exitosamente en RHCECAM División Capacitación.