Apache Spark con Python - Aprende Big Data desde Cero
Curso de Apache Spark con Python. Aprende de manera sencilla a analizar gran cantidad de datos desde tu ordenador.
What you will learn
Aprender Apache Spark desde cero
Entender los proyectos de Big Data
Analizar gran cantidad de datos con Machine Learning
Realización Practica de proyectos con Spark
Spark RDD
Spark DataFrames
Why take this course?
Aprende a utilizar Apache Spark, el motor de análisis unificado para el procesamiento de big data, con modules integrados para streaming, SQL, aprendizaje automático y procesamiento de grafos.
Apache Spark es un motor de computación unificado que viene con un conjunto de librerías para procesar datos en paralelo en clústeres. Por tanto es un gran momento para aprender a utilizar el motor de código abierto número 1 en el mercado.
Si deseas comenzar tu carrera como científico de datos este es un curso que has de realizar, puesto que tienes que tener conocimiento de Spark y de los beneficios de utilizarlo.
Actualmente Spark lo puede utilizar en tu computadora o en un clúster con miles de máquinas.
Lo que vas a aprender al realizar este curso:
RDD, DataFrames y DataSets
Curso desde cero con Spark y utilizando el lenguaje de programación Python.
Analizar problemas de BigData (Ejemplo de base de datos con más de 5 millones de filas)
Entender que nos ofrece Spark cuando tratamos de BigData
Spark SQL, Spark MLlib, Spark Straming, GraphX
La gran aportación real hoy en día de Spark es que es una plataforma unificada para escribir aplicaciones de big data, ciencia de datos, ML. Antes de Spark, todas las tareas descritas anteriormente no estaban unificadas en una única plataforma, lo que significaba que los usuarios tenían que unir sus diferentes aplicaciones para montar un proyecto de Big Data.
Si quieres introducirte en esta tecnología no lo dudes y apuntate.