Web Scraping con Python

Utiliza Requests, BeautifulSoup, Scrapy y Selenium para extraer datos de una página web

4.60 (34 reviews)
Udemy
platform
Español
language
Programming Languages
category
190
students
4.5 hours
content
Mar 2022
last update
$49.99
regular price

What you will learn

Entenderás cuales son las distintas formas de extraer datos de la web, sumado a sus ventajas y limitaciones.

Aprenderás HTML, CSS y JavaScript básicos para entender cómo funciona un sitio web y que no sea una “caja negra”

Verás una comparativa entre todos los frameworks y librerías disponibles en Python, para que elijas sabiamente en un futuro con cuál trabajar.

A través de diversos ejemplos de aplicación entenderás como utilizar Requests, BeautifulSoup, Scrapy, Selenium y hasta cómo combinarlas.

Serás capaz de extraer información de un sitio web que cargue su contenido dinámicamente, haciendo uso de diferentes técnicas como user-agents, delay, interac

BONUS: te mostraré como es posible crear aplicaciones ejecutables con Pyinstaller, para compartir el script que hayas hecho a, por ejemplo, un cliente.

Description

En este curso aprenderás los fundamentos del Web Scraping. Aprenderás a utilizar los diferentes frameworks y librerías disponibles en Python para Web Scraping y también entenderás cómo funciona una página web.

El curso es mayoritariamente práctico, y lo que lo distingue de otros cursos es que se explicarán en detalle cada uno de los frameworks y librerías, resaltando las ventajas y desventajas de cada uno.

El curso comenzará con una unidad teórica donde se explicarán todos los conceptos básicos necesarios. Aprenderás cuáles son los distintos métodos de extracción de información y entre otras cosas, la legalidad del Web Scraping.

Luego, entenderás cómo está compuesto un sitio web con ejemplos sencillos, para que no sean una “caja negra” al momento de diseñar la lógica de scraping. Es decir, aprenderás los conceptos básicos de HTML, CSS y JavaScript.

En las próximas unidades, verás en detalle cómo funciona Requests, BeautifulSoup, Scrapy, Selenium, y una breve comparación entre ellos.

Finalmente, en caso de que requieras crear un archivo ejecutable (con extensión .exe) a partir del script de Python, se te mostrará un ejemplo de cómo funciona Pyinstaller.

Este curso será impartido por Lisandro Cesaratto, un ingeniero electrónico especializado en el área de la ciencia de datos, y con mucha experiencia en la división de Inteligencia Artificial de una empresa mundialmente conocida (PriceWaterhouseCoopers o PwC).

En Datademia trabajamos para crear el mejor contenido de datos en español, incluyendo ciencia de datos, inteligencia de negocios y programación. Nuestro objetivo es transformarte en un experto en datos, aprendiendo desde cualquier parte del mundo y a tu ritmo.

Te invitamos a que veas la presentación del curso y algunas de las clases gratuitas. Cualquier duda que tengas nos puedes contactar a través de nuestras redes sociales o a través de la plataforma.

¡Nos vemos en el curso!

Content

Introducción al curso

Introducción al curso

Fundamentos del Web Scraping

Introducción al Web Scraping
API's
Web Scraping - Ventajas y desventajas
Funcionamiento del proceso de Web Scraping
Aspectos legales y recomendaciones

Instalaciones y requisitos

Visual Studio Code y Python
Librerías y Chrome WebDriver

Componentes Web

Funcionamiento de un sitio web
HTML - parte 1
HTML - parte 2
CSS - parte 1
CSS - parte 2
Request y JavaScript - Introducción
Request y JavaScript - Ejemplo Request
Request y JavaScript - Ejemplo JavaScript parte 1
Request y JavaScript - Ejemplo JavaScript parte 2
Propuesta de aplicación

Comparativa de frameworks y librerías

Beautiful Soup
Selenium
Scrapy
Requests y otras

Beautiful Soup

Introducción a Beautiful Soup
Navegando el objeto de BS4
Buscar instancias de etiquetas
Metodos find y find_all
Selectores CSS
Comentarios finales

Extrayendo los datos del clima

Introduccion
Análisis de la estructura HTML
Creando objeto de BS4
Extrayendo los dias
Identificando el dia para cada entrada
Exportando los datos de un pandas dataframe

Scrapy

Introducción a Scrapy Shell
Respuesta HTTP desde Scrapy Shell
Selectores CSS vs XPATH
Creando primer proyecto de Scrapy
Introducción a Scrapy Spider
Consideraciones al utilizar Spiders
Creando la lógica de una Spider
Exportando resultados de una Spider
Extraer el contenido de páginas consecutivas
Navegando por medio del menú
Extrayendo los productos de cada categoría
User-Agent
Scrapy desde un único script
Scrapy Item
Declarando un ItemLoader
Utilizando el ItemLoader en la Spider
Splash
Ejemplo de aplicación con Splash

Selenium

Introducción a Selenium
Chrome WebDriver
WebDriverWait
Interactuando con el sitio web
ActionChains
Extrayendo la información deseada
Propuesta de aplicación

Contenido Adicional

Pyinstaller - parte 1
Pyinstaller - parte 2
¡Ya has terminado!

Screenshots

Web Scraping con Python - Screenshot_01Web Scraping con Python - Screenshot_02Web Scraping con Python - Screenshot_03Web Scraping con Python - Screenshot_04

Reviews

Jorge
October 14, 2021
muy buen curso, enseña distintas técnicas para poder scrapear sitios. Luego lo que resta es practicar. gracias!

Charts

Price

Web Scraping con Python - Price chart

Rating

Web Scraping con Python - Ratings chart

Enrollment distribution

Web Scraping con Python - Distribution chart

Related Topics

4012202
udemy ID
4/28/2021
course created date
8/25/2021
course indexed date
Bot
course submited by