Udemy

Platform

Español

Language

Data Science

Category

Curso completo de R para Data Science con Tidyverse

Aprende a programar con R, R Studio y Tidyverse: Data Analytics, Data Science, Análisis Estadístico, ggplot2 y mucho más

4.75 (839 reviews)

Students

35.5 hours

Content

Sep 2020

Last Update
Regular Price

SKILLSHARE
SkillShare
Unlimited access to 30 000 Premium SkillShare courses
30-DAY FREE TRIAL

What you will learn

Aprender a programar con R desde cero hasta un nivel elevado

Aprender los principios fundamentales de la programación funcional, como variables y funciones

Aprender los tipos de datos como enteros, booleanos, doubles, strings y estructuras como los vectores, data frames y tibbles

Llevar a cabo representaciones gráficas completas y funcionales gracias a ggplot2 de tidyverse

Tener una buena intuición de la mayoría de técnicas que se aplican al mundo del machine learning y el data science

Dar valor añadido a tu propia empresa o negocio

Hacer análisis muy potentes y precisos con los paquetes gratuitos de R y R Studio

Ser todo un master Jedi del Machine Learning y el Data Science con R Studio y tidyverse


Description

Fundamentos de Data Science con R Studio y Tidyverse, con ejercicios reales y ejemplos de todo tipo. El prerequisito indispensable para luego continuar con el Curso completo de Machine Learning con R Studio del profesor Juan Gabriel Gomila

Bienvenido a este magnífico y completo curso de R Studio y Tidyverse donde el objetivo es formarte para que seas un buen data science con los fundamentos esenciales de uso de los paquetes del software estadístico R y R studio y que puedas llevar a cabo análisis de datos completos y desde cero sin experiencia previa. Aquí tendrás todo lo que necesitas para luego continuar con cursos como los de Machine Learning con R o con Python que tengo publicados aquí mismo en Udemy con todos los conocimientos esenciales bien asentados y completos. Basado en el manual gratuito de Tidyverse, R for Data Science de Garrett Grolemund y Hadley Wickham, y adaptado con ejemplos de casos reales y divertidos, tienes todo lo que necesitas para aprender de un modo divertido a ser todo un analista de datos.

En particular, tengo muchas cosas que enseñarte pues el trabajo del data scientist es muy variado y divertido.

  • Usarás R desde cero hasta convertirte en un profesional, haciendo mucho énfasis en las diferentes partes que lo componen, en la sintaxis básica de creación de scripts, la generación y exportación de gráficos, instalación de librerías diversas y mucho más.

  • Aprenderás a utilizar ggplot2, una librería muy completa para representaciones gráficas basada en el uso de capas de información para ir haciendo el gráfico cada vez más completo y avanzado con el que transmitir todo lo que has ido aprendiendo.

  • Organizarás y manipularás datos con dplyr, la librería para trabajar datos como si fuera una base de datos con la que seleccionarás, ordenarás y crearás nuevas variables para su posterior análisis y representación gráfica. 

  • Estructuras de datos avanzadas con las tibbles de tidyverse y la completa sintaxis de maggrit que acelera y potencia la sintaxis para evitarnos crear variables intermedias en nuestro trabajo de data science gracias a sus pipes

  • Carga de datos a través de la lectura de ficheros de todo tipo gracias a readr, la versión de lectura mejorada de tidyverse que dinamiza y acelera la carga de millones de datos directamente con una instrucción, independientemente del tipo de fichero: CSV, XML, JSON...

  • Librerías especiales de tratamiento de datos como stringr o lubridate especiales para formatos de datos puntuales, así como para hacer una sintaxis de expresión regular que ayude a procesar cadenas complejas de textos como twits o comentarios de un blog entre otros.

  • Trabajar a fondo con todos los tipos de datos esenciales para un analista: desde valores lógicos, números enteros, doubles, strings, date, datetimes... Incluso veremos las estructuras de datos más comunes incluidos los vectores, las listas o las tibbles entre otros.

  • Programación funcional vs programación imperativa. Las ventajas de cada una de ellas y cuando usar una u otra cuando toque. 

  • Creación y actualización de modelos, la fase final del analista de datos que todo el mundo busca para resolver su problema original.

  • Reporting y cómo escribir recomendaciones, actualizaciones y unos informes finales que te permitan cobrar al final de tu trabajo realizado como Data Scientist. 

Y mucho más en este curso completo de Tidyverse, donde la idea es formarte como analista de datos y poder dedicarte en el futuro a ser un data scientist bien pagado y con mucho trabajo en el futuro.


Screenshots

Curso completo de R para Data Science con Tidyverse
Curso completo de R para Data Science con Tidyverse
Curso completo de R para Data Science con Tidyverse
Curso completo de R para Data Science con Tidyverse

Content

Introducción

Introducción a RStudio y Tidyverse

Pre requisitos del curso

Conoce a Juan Gabriel Gomila, tu instructor online

Comunidad de estudiantes del curso

Bookdown de Garrett Grolemund y Hadley Wickham

Acerca de la valoración prematura del curso en Udemy

R, Rstudio y Tidyverse

Ser data scientist en el siglo XXI

El camino del data science no es facil

R, RStudio y Tidiverse

Ayuda con la instalación de R y RStudio

Si tienes problemas con Ubuntu...

Manejo básico de R

Github del curso

La visualización de los datos

Introducción al análisis exploratorio con R

El dataset mpg de ggplot2

Nuestro primer ggplot2

Cambiando los mappings estéticos del gráfico

Problemas comunes cuando empezamos a usar R

Los facets de ggplot

Las diferentes geometrias de ggplot2

Combinar gráficos y añadir dimensiones de visualización

Transformaciones estadísticas básicas

Cambiando las transformaciones estadísticas de nuestros gráficos

El parámetro position del gráfico

Cambiando los sistemas de coordenadas

La gramática final de ggplot2

Guía de recordatorio de ggplot2

Repaso de ggplot2

Los fundamentos de uso de R

La frustración con la informática es buena

R como calculadora científica

Los trucos para asignar nombres a las variables

Las funciones en R

Los scripts y modos de trabajo de R

Rutas y directorios de trabajo en R

Proyectos de RStudio

La transformación de los datos

Introducción a la transformación de los datos

El paquete dplyr y su peculiar sintaxis

Filtrado de filas con filter

El álgebra de Bool en el filtrado

El síndrome contagioso de los NA

Ordenando las filas con arrange

Filtrar columnas con select

Renombrar y ordenar las columnas

Calcular nuevas variables a partir de las que ya tenemos

Funciones útiles para mutar los datos

Resúmenes de variables agrupados con dplyr

La magia oscura de las pipes

Eliminar los NA de los datos

Contar y visualizar resumenes correctamente

El ejemplo del béisbol

Funciones estadísticas útiles

Agrupaciones múltiples y desagrupaciones

Mutates y filters por segmento

Análisis exploratorio de nuestros datos

Una nueva forma de pensar

Definiciones generales

La variación de variables categóricas

La variación de variables contínuas

Las preguntas que debemos hacernos

Encontrando subgrupos dentro de los datos

Outliers en la información

Reemplazando errores por NAs

La covariación a través de las densidades

La covariación a través de boxplots

La covariación de factores a través de heatmaps

La covariación de variables contínuas con scatterplots

Visualización de patrones

Una reflexión sobre la sintaxis de tidyverse

Data Wranling con Tidyverse

El data wranling

Del data frame a las tibbles

Creando tibbles de tidyverse

Imprimir una tibble por pantalla

Subconjuntos y acceso a tibbles

El paquete readr para la importación de datos

Guardar un CSV con el paquete base de R

Leer un CSV con readr

Paquete base vs readr

Los parsers de readr

Procesado de números

Procesado de strings

Procesado de factores

Procesado de fechas y horas

La heurística del parseo

Elegir más muestras y la función type_convert

Otros tipos de ficheros especiales

Limpiando y dando estructura a los datos

La tarea de limpiar los datos

¿Qué hace que un fichero de datos esté limpio?

Spreading y Gathering

La técnica de gathering

La técnica de spreading

La técnica de la separación

La técnica de la reunión

Los NA en la limpieza de datos

Un caso real de sanidad

Un último apunto sobre datos desestructurados

Datos relacionales en R

Las claves primarias y foráneas

Los mutating joins

Diagramas para entender los joins

Inner join

Outer joins

El problema de las claves duplicadas

Definir las columnas clave de los joins

Unas nociones de SQL y de la función merge

Filtering joins

Operaciones entre conjuntos

Manejo de strings, factores y fechas

Strings

Los fundamentos de los strings

Operaciones con strings

Las bases de las expresiones regulares

Anclas y caracteres de clase

Repetición de grupos y referencias

Encontrar y extraer coincidencias de la expresión regular

Agrupaciones y reemplazos de strings

Divisiones y búsquedas de strings

Otras expresiones regulares

Buscar funciones, variables y directorios

Factores

Crear un factor en R

La encuesta anual americana

Cambiar el orden de los niveles de un factor

Mutar los niveles de los factores

Fechas

Modos de crear fechas

Obtener las componentes de una fecha

Redondeo y modificación de componentes de fechas

Lapsos de tiempo

Zonas horarias

Técnicas de programación hacker con RStudio

Técnicas de programador profesional

Las pipes y cuando usarlas

Pipes alternativas

Creación de funciones

Cuando conviene crear funciones

Funciones para humanos y ordenadores

Condicionales y toma de decisiones

Los argumentos de las funciones

Punto, punto, punto y evaluación tardía

Valores de retorno y valores de entorno

La estructura del vector

Los vectores atómicos

Transformaciones y castings

La regla del reciclaje de datos

Subconjuntos de vectores

Los vectores recursivos (listas)

Atributos de un vector

Vectores aumentados

El bucle for para iterar

Más tipos de bucles

Bucles vs programación funcional

Las funciones de map

Las funciones Safely, Possibly, Quietly

Mappings con argumentos múltiples

Accumulate, reduce, detect, some, every, keep, discard y walk

Modelización con R Studio

La creación de modelos

Elección y ajuste del modelo

Introducción a los modelos lineales

Cómo encontrar el 'mejor' modelo

Visualización de predicciones y residuos

Fórmulas y modelos

Modelos según el tipo de variable

Transformaciones de variables

NAs en el modelo

Otros modelos no lineales

Casos reales de estudio - Aplica lo que has aprendido

La experiencia en casos reales de estudio

Los diamantes más malos son los más caros

Mejorando el modelo de diamantes

El problema de los vuelos diarios

Vuelos por día de la semana y trimestre

Modelos múltiples

Gapminder del Doctor Hans Rosling

El data frame anidado

Modelando y operando con data frames anidados

Midiendo la calidad del modelo con broom

Las columnas de listas

Generando columnas de listas

De columnas de listas al dato original

Comunicación de los resultados con R Studio

Comunicar nuestros resultados

El formato de Rmarkdown

La sintaxis de Rmd

El código dentro de un Rmd

BONUS: Un regalo para ti

Enhorabuena por completar el curso

Todos los cursos de Juan Gabriel con descuento


Reviews

J
Juan7 October 2020

Como siempre, un gran curso. Aunque ya tenía cierta experiencia profesional con el paquete tidyverse, siempre se aprende algo nuevo.

L
Luis30 September 2020

Excelente curso. Los temas muy completos y muy bien explicados. El profesor emplea una pedagogía que atrapa al estudiante y lo motiva a continuar con el curso; las dudas son solucionadas de forma rápida y clara.

C
Carlos21 September 2020

Muy buen curso, muy completo, se nota que el profesor es realmente un experto en el tema. Sugerencias: - Varias clases con poca estructura y orden en la explicación del profesor. - Hay varias cosas que se explican "en el aire", sin forma de ver alguna slide o presentación que guíe mientras el profesor habla. - Algunas clases demasiado largas. - El último video tiene un problema de audio, lo cual genera distracción.

J
Juan31 August 2020

muy buenas herramientas para el analisis de datos en R, el cual es excelente para el manejo de bases de datos grandes las cuales no pueden ser manipuladas en Excel

G
German14 August 2020

Verdaderamente, he aprendido bastante sobre RStudio, es una poderosa herramienta para un data science, lo bueno es que existe mucha documentación los cheatsheet son bien completos.

M
Manuel20 February 2020

Juan Gabriel es un profesor que explica de forma muy clara los conceptos, he estudiado ya varios cursos con él. Elegir sus cursos son un acierto seguro.

Y
Yeison19 February 2020

Excelente para Complementar los demás cursos de R que tiene el profesor Juan. Muy buenos temas y enfoque para BigData y Data Science

J
Joel14 February 2020

El curso tiene bastante contenido, responden las dudas de manera eficiente, tiene bastantes tareas y exámenes, que lo hacen mas atendibles y no muy técnicos. No tengo muchas recomendaciones ya que el curso es muy didáctico.

S
Sergio4 February 2020

El curso ha tenido todas las secciones muy bien explicadas, los recursos adicionales han creado mucho valor para los conocimientos que aquí se explican y he podido mantener comunicación con todos aquellos que realizan el curso así como personas con conocimientos más avanzados que pueden resolver dudas o contribuir a incrementar mi curiosidad por el tema. El profesor ha mostrado siempre disposición a resolver dudas e incluso para emitir comentarios de aliento cuando se cumplen tareas. Supero mis expectativas porque creo que he recibido mucho más material, consejos y conocimientos del que yo esperaba por un curso como este. ¡Gracias totales!

E
Efrain2 February 2020

Hasta ahora excelente, todas las operaciones que reproduce uno en nuestra pc funcionan tal como se hace en el video.

G
Gonzalo29 January 2020

Mi 1ra experiencia y muy excelente, ademas se que cada día aprenderé mas, de acuerdo me proponga a documentarme y agregar mas conocimientos.

J
José19 January 2020

Profesor Juan Gabriel, no me queda más que decir que usted es un crack!, gracias por convertir una información tan densa en algo asequible para los mortales como yo. Éxitos por siempre.

A
Angel12 December 2019

Gran curso. El docente es realmente muy bueno, lo explica todo de forma sencilla y entendible. Lo mejor es tener los vídeos para poder repasarlos cuando quieras, y el curso está muy bien estructurado, para que sea fácil encontrar lo que estás buscando. Muy recomendable para introducirse en el mundo de R.

L
Luis13 November 2019

El curso esta muy bueno, la verdad lo recomiendo. Esta muy bien estructurado, bueno creo que esta basado enteramente en el libro que nos presentan al principio,. Pero perfecto! para quienes no les gusta leer, el profesor hace un excelente trabajo resumiendolo y presentando casos interesantes y prácticos para entender por que hacemos o no algo. El curso, es muy denso, para mi algo muy positivo!! sobretodo por que todos los capitulos traen algo realmente nuevo y no repiten lo mismo de siempre! En general muy bueno, incluso ya compre otro curso del profe acerca de machine learning, que espero sea igual de bueno. Recomendado!

F
Francisco7 October 2019

Excelente curso. Puedes tomarlo siendo un absoluto novato a lo que programación se refiere, y acabar teniendo una fuerte noción de como resolver problemas de análisis de datos utilizando R. Muy recomendado.


Coupons

DateDiscountStatus
6/27/202193% OFFExpired
7/9/202193% OFFValid

1686432

Udemy ID

5/10/2018

Course created date

11/1/2019

Course Indexed date
Bot
Course Submitted by