Tus datos en la nube: ETLs con Python en el cloud

Lleva tus habilidades de tratamiento de datos con Python al siguiente nivel generando tus propios proyectos sin límites.

3.55 (168 reviews)
Udemy
platform
Español
language
Data & Analytics
category
instructor
Tus datos en la nube: ETLs con Python en el cloud
1,313
students
11.5 hours
content
Oct 2023
last update
$49.99
regular price

What you will learn

Implementación de ETLs en Python con un framework híbrido (cloud-local) para su automatización.

Un método que te servirá al abordar proyectos de obtención, transformación y carga de datos de forma profesional.

Obtención de datos con Python desde múltiples tecnologías como APIs REST, ficheros JSON o bases de datos SQL.

Tratamiento y obtención de datos desde texto mediante expresiones regulares (RegEx).

Desarrollo de procesos de obtención de datos desde páginas web mediante webscraping en Python.

Metodología y código para asegurarnos que nuestros datos tienen la forma, estructura y calidad que deseamos para nuestros análisis.

Creación y despliegue de recursos cloud en un proveedor hiperescalar para alojar tus propios datos en la nube.

Desarrollo de una base de datos destinada para el análisis de datos estructurados.

Inyección y extracción de datos desde bases de datos SQL mediante Python.

Why take this course?

  • ¿Quieres aprender a desplegar sistemas de gestión de datos en la nube mediante ETLs?

  • ¿Tienes conocimientos en el campo del análisis de datos o el Machine Learning y quieres conocer cómo desplegar sistemas de consumo de datos en producción?

  • ¿No te sientes suficientemente confiado en tus habilidades de programación para crear tus propios sets de datos?

Si la respuesta a alguna de estas preguntas es Sí, entonces este curso es para ti.

La proliferación exponencial de nuevos tipos de fuentes de datos y el ritmo de generación de los mismos son probablemente los factores clave detrás del auge de toda la innovación que conlleva el Big Data y el análisis de datos en general.

Por eso como profesionales en este sector, no sólo es importante tener la capacidad de generar y entrenar modelos, sino aprender a desarrollar sistemas que puedan generar para nosotros nuestros propios sets de datos.

Sin embargo, aun teniendo acceso a cantidades brutales de datos, estos no siempre son ni fácilmente accesibles ni suelen estar en los formatos ni estándares de calidad que deseamos. Nuestra misión será dotarte de conocimientos y herramientas para poder afrontar estos escenarios con éxito.

En este curso vas a aprender a hacerlo cubriendo todo el ciclo de vida del dato y no sólo con un enfoque práctico, sino también usando fuentes y datos reales.

Conocerás y practicarás para dominar un montón de herramientas y tecnologías relacionadas con el mundo del manejo de datos, sobretodo en relación a la obtención, la transformación o manipulación y la carga de los mismos.

El curso se desarrolla sobre el concepto de ETL, los procesos que permiten precisamente obtener, procesar y cargar los datos desde un sistema a otro para conocer y dominar todas las tecnologías implicadas. Además aprenderemos a automatizar estos sistemas con un framework híbrido (cloud-local) basado en Python, uno de los lenguajes de programación por excelencia en el mundo del análisis de datos.

Lo más interesante de todo no solo es eso sino que:

  • las herramientas que conocerás son altamente compatibles entre sí, con lo que crearás una caja de herramientas que te será muy útil cuando enfrentes este tipo de escenarios.

  • Más allá de las herramientas, te daremos un método que te servirá al abordar proyectos de forma profesional.

En el desarrollo del curso, cubriremos temas como:

  • El contexto en el que viven este tipo de proyectos, los sistemas de gestión empresariales. Cubriremos aspectos como qué tipos existen, en qué tipo de tecnologías de gestión de datos suelen basarse y como benefician a los negocios.

  • Introduciremos el ecosistema IT donde se alojará nuestro proyecto: el cloud (la nube). Conoceremos qué tipos de servicios existen, el estado del mercado y las tecnologías que destacan en el mundo del tratamiento de datos en este modelo de consumo de recursos IT.

  • Conoceremos con profundidad los sistemas ETL, que se encargan de gobernar la extracción/obtención de datos desde un sistema, el tratamiento basado en manipulaciones y conversiones que se les da a estos datos para que cumplan nuestros objetivos y la carga en sistemas preparados para el análisis de datos a escala.

  • Implementaremos estas ETLs en Python con un framework híbrido (cloud-local) llamado Prefect. Este framework nos permitirá automatizar y orquestar nuestras tareas de ETL combinándolas con la flexibilidad y potencia que nos proporciona el tratamiento de datos con Python y sus librerías, el lenguaje más usado en el mundo del análisis de datos.

  • Conoceremos y obtendremos datos desde APIs REST basadas en webservices, ficheros JSON o bases de datos SQL.

  • Profundizaremos en uno de los campos más interesantes en esta industria, el webscraping, con el que podremos extraer datos que estén en páginas web de forma automatizada de forma que ¡todos los datos que estén en internet se convertirán en potenciales fuentes de datos para ti! Y créenos que eso es un gran poder ;-).

  • Aprenderás a tratar texto con una de las técnicas más potentes, las expresiones regulares, cazando datos y patrones de interés de forma eficiente y automatizable desde strings o cadenas para ser extraídos o tratados posteriormente.

  • Revisaremos metodologías y código para asegurarnos que nuestros datos tienen la forma, estructura y calidad que deseemos para nuestros análisis.

  • Crearás y desplegarás recursos cloud en un proveedor hiperescalar para alojar tus propios datos en la nube, así como desarrollar conexiones a ellos desde Python.

  • Instalaremos y usaremos uno de los entornos de desarrollo (IDE) más usados hoy en día, Visual Studio Code, con el que podrás trabajar de forma eficiente y profesional proyectos del mundo del análisis de datos.

Acabaremos poniendo todo esto en práctica con un caso real y de interés actual, en el que aprenderás a obtener datos sobre el valor del Bitcoin así como de los valores bursátiles de varias empresas cotizadas en la bolsa americana, a fin de crear un set de datos que permita analizar si existe dependencia entre los valores bursátiles y el valor de la criptomoneda.

Este curso es ideal para cualquiera que quiera obtener conocimientos acerca de la ingeniería y infraestructura de datos. En particular te lo recomiendo si eres:

  • Data scientist o te estás formando para ello, de forma que aprendas a usar Python para capturar y crear tus propios sets de datos para su posterior análisis.

  • Iniciados como analistas de datos que quieren mejorar su portfolio desde una perspectiva más de infraestructura y gobierno de datos.

  • Un consultor freelance en tecnología IT que quiere profundizar en el mundo del Big Data o la ingeniería de datos.

  • Product o Project Manager que tiene necesidad de conocer la realidad y superar los retos que estas nuevas tecnologías conllevan

Si buscabas aprender Python para poner tus ideas en producción, yo no esperarías más! ¡Apúntate ya haciendo click en el botón de tomar este curso ahora, y nos vemos en clase!

Screenshots

Tus datos en la nube: ETLs con Python en el cloud - Screenshot_01Tus datos en la nube: ETLs con Python en el cloud - Screenshot_02Tus datos en la nube: ETLs con Python en el cloud - Screenshot_03Tus datos en la nube: ETLs con Python en el cloud - Screenshot_04

Reviews

Carlos
July 19, 2023
Si el primer script hello world ya no funciona por que cambió la forma de programarlo el curso pierde sentido inmediatamente en mi opinión. Además los profesores no contestan las preguntas. Decepcionante comenzar así.
Andres
June 12, 2023
El curso fue muy bueno, explicado al detalle, sin embargo, el versionamiento de la herramienta utilizada ya se encuentra actualizada y en algunos escenarios del curso, el código compartido no se encuentra actualizado a las versiones mas reciente.
Robin
May 29, 2023
El curso esta desactualizado, ya hay una version de prefect 2.0 y nada de lo que se comenta aca esta alineado a esa nueva version, muy decepcionante como perdi 1 dia entero en toda la introduccion (por que abarca muchos conceptos teoricos), para darme cuenta que las librerias y la interfaz de prefect cloud cambiaron totalmente a como se presenta en el video.
Daniel
October 7, 2022
Es material es muy bueno, las explicaciones son claras, es un buen curso de introducción a ETL de Python me gusto
Pablo
August 5, 2022
Es una buena herramienta y explica muy bien las bases. Sin embargo el caso práctico muy sencillo. Ideal para quienes se quieren iniciar en la ingeniería de datos.
Diego
July 23, 2022
Muy contento con el curso en general. Te explica de una forma sencilla el funcionamiento de una ETL y su implementación en prefect y Azure. Al principio mucha clase teórica sin implementación práctica, pero luego queda todo muy claro con el caso práctico. Me falta un poco más de desarrollo de prefect, ya que en entornos profesionales se utilizan las clases en vez de funciones, pero para hacerte una idea de cómo funciona está bien.
Alberto
July 23, 2022
Realmente una formación muy útil e instructiva tanto en el apartado teórico como en el práctico. Contenido de gran aplicabilidad a Proyectos Reales, totalmente recomendable si estás empezando a ver ETL's en Python.
Jorge
June 28, 2022
El profesor sabe del tema, muy buena explicación. Esperaba ver mas ejemplos. Siento que hay mucha teoría y muy poca practica
Santiago
April 19, 2022
Muy interesante, bien explicado y con casos prácticos útiles. Me encantaría hacer un curso similar a este pero con Azure DataFactory.
Federico
March 11, 2022
Muy buen curso. Excelente la exposición del profesor con claridad y conocimiento. Me gustaría que contara con un apartado final para conocer la aplicación de Prefect a casos mas complejos desde el punto de vista de los scripts (por ejemplo: si es excluyente consolidar todo en un unico script python) y como integrar otras herramientas de webscraping como Scrapy.
Luis
February 24, 2022
Excelente curso, al grano y con el material necesario para poder desarrollarte en la creación y automatización de ETLs utilizando Azure.
Luis
February 4, 2022
Me llevo una experiencia buena, explica los vídeos con gran precisión y resuelve las dudas muy concisamente.
Carlos
January 20, 2022
Curso para empezar con muy buenas bases para Ingeniería de Datos. Estaría super, otro curso para arquitectura de datos. Me encanto este curso, lo recomiendo al 100%
Maximiliano
December 16, 2021
Excelente curso para conectarse desde Pyhton a la nube e interactuar con SQL Server tambien desde Python. Lo recomiendo al 100%
Alberto
December 5, 2021
Mucho tiempo dedicado a la teoría de un ejemplo inventado. Poco código diverso. Práctica muy básica. El temario principal del curso es muy escueto.

Charts

Price

Tus datos en la nube: ETLs con Python en el cloud - Price chart

Rating

Tus datos en la nube: ETLs con Python en el cloud - Ratings chart

Enrollment distribution

Tus datos en la nube: ETLs con Python en el cloud - Distribution chart
4275574
udemy ID
9/1/2021
course created date
11/10/2021
course indexed date
Bot
course submited by