Udemy

Platform

Español

Language

Data & Analytics

Category

Aprendizaje por Refuerzo Profundo 2.0 en Python

La combinación más inteligente de Deep Q-Learning, Políticas de Gradiente, Actor-Crítico y DDPG utilizando PyTorch

4.55 (53 reviews)

Students

14 hours

Content

Aug 2020

Last Update
Regular Price

SKILLSHARE
SkillShare
Unlimited access to 30 000 Premium SkillShare courses
30-DAY FREE TRIAL

What you will learn

Q-Learning.

Deep Q-Learning.

Políticas de gradiente

Modelos de Actor-Crítico

Gradiente de Política Determinista Profunda (DDPG).

GPDP de doble retardo (TD3) o Twin Delayed DDPG

Las técnicas fundamentales del aprendizaje por refuerzo profundo.

Cómo implementar un modelo del estado del arte más actual de IA, de última generación, que supera las aplicaciones virtuales más desafiantes como enseñar a un robot a caminar.


Description

Bienvenido al curso Aprendizaje por Refuerzo Profundo 2.0 en Python

En este curso, aprenderemos e implementaremos un nuevo modelo de IA increíblemente inteligente, llamado el Gradiente de Política Determinista de doble retardo (Twin Delayed DDPG, en inglés), que combina las técnicas más avanzadas en Inteligencia Artificial, incluyendo el Aprendizaje de Doble Profundidad, Políticas de Gradiente y Actor-Crítico. El modelo es tan robusto que por primera vez en nuestros cursos, somos capaces de resolver las aplicaciones de IA virtual más desafiantes (entrenar a una hormiga/araña y medio humanoide a caminar y correr a través de un terreno).

Para abordar este modelo de la manera correcta, estructuramos el curso en tres partes:

  • Parte 1: Fundamentos.

En esta parte estudiaremos todos los fundamentos de la Inteligencia Artificial que te permitirán entender y dominar la IA de este curso. Estos incluyen Q-Learning, Deep Q-Learning, Políticas de Gradiente, Actor-Crítico y mucho más.

  • Parte 2: La teoría del DDPG de doble retardo.

Estudiaremos a fondo toda la teoría que hay detrás del modelo. Verás claramente todo el proceso de construcción y entrenamiento de la IA a través de una serie de diapositivas de visualización. No sólo aprenderás la teoría en detalle, sino que también darás forma a toda la intuición para saber cómo aprende y trabaja la IA. Los fundamentos de la Parte 1, combinados con la muy detallada teoría de la Parte 2, harán que este modelo altamente avanzado sea accesible para ti, y con el tiempo serás una de las pocas personas que puede dominar y entender este modelo.

  • Parte 3: La implementación del DDPG de doble retardo.

Implementaremos el modelo desde cero, paso a paso, y a través de sesiones interactivas, una nueva característica de este curso que te hará practicar en muchos ejercicios de codificación mientras implementamos el modelo. Al hacerlos no seguirás el curso de forma pasiva sino muy activa, permitiéndote así mejorar eficazmente tus habilidades en programación e IA.

Y por último, pero no menos importante, haremos toda la implementación en Colaboratory, o Google Colab, que es una plataforma de IA totalmente gratuita y de código abierto que te permitirá programar y entrenar algunas IA sin tener que instalar ningún paquete en tu equipo. En otras palabras, puedes estar 100% seguro de que al pulsar el botón de ejecución, la IA comenzará a entrenar y al final obtendrás los videos de la araña y el humanoide corriendo.


Screenshots

Aprendizaje por Refuerzo Profundo 2.0 en Python
Aprendizaje por Refuerzo Profundo 2.0 en Python
Aprendizaje por Refuerzo Profundo 2.0 en Python
Aprendizaje por Refuerzo Profundo 2.0 en Python

Content

Parte 1 - Fundamentos

Bienvenido a nuestro curso

Cómo conseguir los tres bonus del curso

Algunos recursos antes de empezar

Las rutas de aprendizaje

Q-Learning

Deep Q-Learning

Políticas del Gradiente

Actor - Crítico

Taxonomía de los modelos de IA

5 ventajas del Deep Reinforcement Learning

Mapa de los algoritmos de Reinforcement Learning

Parte 2 - Teoría del GPDP (TD3) de doble retardo

Introducción e inicialización

La parte de Q-Learning

La parte de aprendizaje de políticas

El proceso completo de entrenamiento

Parte 3 - Implementación del GPDP (TD3) de doble retardo

El código fuente del curso con toda la implementación

Introducción

Implementación - Paso 1

Implementación - Paso 2

Implementación - Paso 3

Implementación - Paso 4

Implementación - Paso 5

Implementación - Paso 6

Implementación - Paso 7

Implementación - Paso 8

Implementación - Paso 9

Implementación - Paso 10

Implementación - Paso 11

Implementación - Paso 12

Implementación - Paso 13

Implementación - Paso 14

Implementación - Paso 15

Implementación - Paso 16

Implementación - Paso 17

Implementación - Paso 18

Implementación - Paso 19

Implementación - Paso 20

La demo final!

Demo - Entrenamiento

Demo - Inferencia

Anexo 1 - Redes Neuronales Artificiales

Plan de Ataque

El perceptrón

Las funciones de activación

¿Cómo funcionan las redes neuronales?

¿Cómo aprenden las redes neuronales?

El gradiente descendente

Gradiente descendente estocástico

Propagación hacia atrás

Anexo 2 - Q-Learning

La ecuación de Bellman

El plan

Procesos de Decisión de Markov

La diferencia entre la política y el plan

Living Penalty

Idea intuitiva del Q-Learning

La diferencia temporal

Visualización del Q-Learning

Anexo 3 - Q-Learning Profundo

Plan de Ataque

Idea intuitiva del Deep Q-Learning - Parte 1

Idea intuitiva del Deep Q-Learning - Parte 2

Repetición de experiencias

Políticas de selección de las acciones

BONUS: Lecturas adicionales

Recurso 1 - Top 10 de Aplicaciones de la IA en el mundo actual

Recurso 2 - Un modelo de IA adicional: Actor-Crítico

Recurso 3 - Una mina de oro de implementaciones de IA

BONUS


Reviews

A
Andrés19 January 2021

Segundo curso que llevo con Juan Gabriel y estoy igual de agradecido con él, por compartir tanto conocimiento a un precio super cómodo, gracias Juan

J
Juan2 January 2021

Este es esa clase de cursos que no piensas que puedan llegar a la plataforma, que no te engañen sus 7 lecciones el curso esta cargado de cosas donde deberás prestar mucha atención y analizar, recomendable pero muy avanzado.

J
Johnny18 October 2020

Es el curso más difícil que me he enfrentado. Esto es Inteligencia Artificial del nivel de un investigador. Para ello te recomiendo usar sus rutas de aprendizaje sino te perderás, o no sabrás muchos conceptos que se han dado en otros cursos.

E
Edgar10 September 2020

Uno de los cursos más retadores, tremendos, desafiantes e interesantes que he tenido en la vida!!!! Un montón de información, y contenidos que sin duda te ayudarán a conseguir un trabajo en esta área... (Yo ya lo conseguí) Yeah!!! Excelente curso

O
Oscar7 September 2020

Muy buen curso. Me gustaria tambien si puede ser, que hicierais algun curso sobre IA aplicada a drones o detección de objetos como yolo.


Coupons

DateDiscountStatus
6/27/202190% OFFExpired
7/9/202190% OFFValid

3193148

Udemy ID

6/1/2020

Course created date

6/27/2020

Course Indexed date
Bot
Course Submitted by