PYSPARK: Utilizando SPARK e Python para analisar dados

Trabalhando com SPARK e Python para resolver todos os seus problemas com dados

4.56 (156 reviews)

Udemy

platform

Português

language

Other

category

MSc Grimaldo Lopes | + 6

instructor

PYSPARK: Utilizando SPARK e Python para analisar dados

593

students

3 hours

content

Oct 2024

last update

$19.99

regular price

What you will learn

O que é PYSPARK

O que é SPARK

Instalando o SPARK em um ambiente Windows, configurando

Instalando o ANACONDA

Instalando a JDK

Entendendo o ecossistema : Apache Spark + Anaconda + JAVA

Entendendo o conceito de NÓ, CLUSTER

Conhecendo os módulos e pacotes do PYSPARK

O que é SparkContext

Entendo o que é RDD (Resilient Distributed Dataset)

Trabalhando com Spark Dataframe

Compreendendo as diferenças entre transformações e ações, operações com PYSPARK

Operações: collect, count, parallelize, getNumPartitions, textFile, first, filter, cache, Show, take

Aprendendo o que é uma função Lambda

Operações: flatMap, map, reduceByKey, sortBY, join, leftOuterjoin, rightOuterjoin, select, groupBy, orderBy

Monitoramento de jobs com SPARK UI

O que é SparkSession

Leitura de arquivos externos

SPARK SQL

Leitura de dados em JSON

Related Topics

4213170

udemy ID

7/30/2021

course created date

8/7/2021

course indexed date

Bot

course submited by