Spark y Scala en Databricks: Big Data e ingeniería de datos

Trabajo desde niveles básicos hasta avanzados con RDD y DataFrame.

4.63 (210 reviews)

Udemy

platform

Español

language

Data Science

What you will learn

Conocer el funcionamiento y la estructura de Apache Spark

Trabajar con RDDs de Spark desde niveles básicos hasta avanzados

Trabajar con DataFrames en Spark mediante el API de SQL desde niveles básicos hasta avanzados

Optimizar sus aplicaciones de Apache Spark para el manejo de grandes volúmenes de datos a través de DataFrames

Why take this course?

Bienvenidos al curso Spark y Scala en Databricks: Big Data e ingeniería de datos.

En este curso aprenderás a trabajar con Scala-Spark en Databricks.

Spark es esencialmente un sistema distribuido que fue diseñado para procesar un gran volumen de datos de manera eficiente y rápida. El objetivo de este curso es aprender a trabajar con las principales abstracciones de Spark, las cuales son los RDDs y los DataFrames.

El material que proponemos en el curso está pensado para todas las personas que bien deseen iniciarse en el trabajo con Spark, o que por otro lado, deseen consolidar los conocimientos que ya poseen sobre los temas que se abordarán. El curso está diseñado de una forma progresiva y gradual que le permitirá al estudiante entender y desarrollar las principales habilidades para el trabajo con RDDs y DataFrames en Spark. Además, se abordarán temas avanzados que le permitirán optimizar las aplicaciones de Spark que pueda construir en un futuro, o bien, mejorar aquellas que ya se tengan implementadas.

Empezamos el curso con una breve introducción al Big Data y a Spark. Posteriormente continuamos con una sección dedicada a explicar los aspectos fundamentales de Databricks Community Edition que necesitaremos para el desarrollo del curso. Una vez hayan concluido esta sección, estarán en condiciones de ejecutar notebooks de Scala-Spark en Databricks. Las siguientes secciones del curso están pensadas para entender y aplicar en la práctica las principales cuestiones sobre los RDDs y los DataFrames.

El temario procura en todo momento analizar temas específicos por cada lección, permitiéndole así al estudiante localizar rápidamente cualquier contenido de una forma rápida. La mayoría de las lecciones están conformadas por una parte teórica y otra práctica.

Mi nombre es José Miguel Moya y me desempeño actualmente como Ingeniero de Datos. Como parte de mi trabajo diario utilizo Spark con Python y Scala para obtener y procesar enormes cantidades de datos.

Te invito a que veas el video de presentación del curso y las lecciones gratuitas.

Te espero en el curso, tenga usted un cordial saludo.

Screenshots

Spark y Scala en Databricks: Big Data e ingeniería de datos - Screenshot_01

Spark y Scala en Databricks: Big Data e ingeniería de datos - Screenshot_02

Spark y Scala en Databricks: Big Data e ingeniería de datos - Screenshot_03

Spark y Scala en Databricks: Big Data e ingeniería de datos - Screenshot_04

Reviews

Javier

September 28, 2023

Curso con buenos ejercicios y contenidos bien explicados. Los ejercicios te obligan a ir un poco más allá de lo que se te enseña, buscando recursos por tu cuenta pero siempre con la solución a mano.

Valeria

June 26, 2023

Curso muy claro para aprender Spark, muchos ejercicios y explicaciones paso a paso. Genial para familiarizarse con las funciones mas comunes de Spark SQL.

Alberto

June 24, 2023

Curso muy completo, el hecho de que haya ejercicios y un proyecto final lo hace más atractivo todavía, recomiendo hacerlos todos sin mirar la solución previamente. La parte de RDDs se me ha hecho más pesada y quizás falta algo más de profundidad en los conceptos de Driver, Worker, etc. pero la parte de Dataframes y SQL me ha parecido la más interesante

Carlos

June 22, 2023

Es un buen curso si quieres aprender más acerca del mundo de los datos y como trabajar con ellos con la tecnología de databricks

Adrian

June 7, 2023

Muy bueno. Muy didáctico y con ejemplos completos. Me gustaría una segunda parte en donde se cubrieran temas de Machine Learning y de Streaming.

Marco.

May 22, 2023

too theoric, tutor exhibits poor knowledge, he seems to be just reading, Not engaging nor insightful. Explanations are not deep nor practical

Katherine

May 9, 2023

Porque es muy detallista la clase desde la instalación de las herramientas que se va a utilizar y la explicación de los proceso o ejecicios. Me encanta!

Marina

April 11, 2023

Curso muy bueno para empezar desde cero con Scala. El profesor explica muy bien los conceptos y los ejercicios son bastante prácticos.

Natalia

March 30, 2023

Está todo muy bien explicado, es claro y conciso, me gusta mucho que exista un apartado con ejercicios propuestos y que alguno de ellos sea un pequeño reto para seguir aprendiendo. Nunca había desarrollado en Scala y ha sido un buen comienzo ? Gracias José Miguel!!!

José

March 14, 2023

Buen curso, me gusta que el curso esté dividido en bastantes videos de poca duración. Los ejercicios son interesantes. Como mejora quizás habría añadido una pequeña introducción a Scala, para personas que no conozcan el lenguaje.

Laura

March 13, 2023

Es un buen curso para profundizar en Scala y Spark, pero es recomendable tener algunos conocimientos previos.

Ana

March 7, 2023

Creo que si no conoces scala y spark un poco por encima puede costar más, pero en sí es un buen curso que recoge todos los conceptos necesarios para poder trabajar con scala y spark. Te enseña perfectamente el entorno Databricks Community Edition.

Tamer

March 6, 2023

Los ejercicios no están pensados para que los pueda resolver el alumno, se preguntan cosas que no se explican

Arturo

January 26, 2023

El curso es excelente, los contenidos están bien estructurados y muy bien explicados, recomendable la metodología del profesor y también los ejercicios prácticos de cada sección.

Charts

Price

Rating

Enrollment distribution

Spark y Scala en Databricks: Big Data e ingeniería de datos - Distribution chart