Udemy

Platform

Español

Language

Data Science

Category

Curso completo de Machine Learning: Data Science en Python

Aprende los algoritmos de Machine Learning con Python para convertirte en un Data Science con todo el código para usar

4.67 (6247 reviews)

Students

48 hours

Content

May 2021

Last Update
Regular Price

SKILLSHARE
SkillShare
Unlimited access to 30 000 Premium SkillShare courses
30-DAY FREE TRIAL

What you will learn

Ser todo un master Jedi del Machine Learning con Python

Llevar a cabo predicciones precisas

Elaborar modelos robustos de Machine Learning

Utilizar las técnicas de Machine Learning para uso personal y para asesorar empresas

Tener una buena intuición de la mayoría de modelos de Machine Learning

Hacer análisis muy potentes y precisos

Dar valor añadido a tu propia empresa o negocio

Conocer qué modelo de Machine Learning se ajusta mejor a cada tipo de problema

Construir modelos diversos de Machine Learning y combinarlos para resolver cualquier problema que uno se plantee

Utilizar técnicas avanzadas para reducir la dimensión del problema


Description

¿Te suenan las palabras Machine Learning o Data Scientist? ¿Te pica la curiosidad de para qué sirven estas técnicas o por qué empresas de todo el mundo pagan un sueldo de 120.000 hasta 200.000$ al año a un científico de datos? 

Pues este curso está pensado y diseñado por todo un profesional del mundo del Data Science como es Juan Gabriel Gomila, de modo que os va a compartir todo su conocimiento y ayudaros a entender la teoría tan compleja sobre las matemáticas que tiene detrás, los algoritmos y librerías de programación con Python para convertiros en todo unos expertos a pesar de que no tengáis experiencia previa. 

Veremos paso a paso como empezar a trabajar con conceptos y algoritmos del mundo del Machine Learning. Con cada nueva clase y sección que completes tendrás unas nuevas habilidades que te ayudarán a entender este mundo tan completo y lucrativo que puede ser esta rama del Data Science.

También decirte que este curso es muy divertido, en la línea de Juan Gabriel Gomila y que aprenderás y te divertirás mientras vas aprendiendo acerca de técnicas de Machine Learning con Python. En particular, los temas que trabajaremos serán los siguientes:

  • Parte 1 - Instalación de Python y paquetes necesarios para data science, machine learning y visualización de los datos
  • Parte 2 - Evolución histórica del análisis predictivo y el machine learning
  • Parte 3 - Pre procesado y limpieza de los datos 
  • Parte 4 - Manejo de datos y data wrangling, operaciones con datasets y distribuciones de probabilidad más famosas
  • Parte 5 - Repaso de estadística básica, intervalos de confianza, contrastes de hipótesis, correlación,...
  • Parte 6 - Regression lineal simple, regresión lineal múltiple y regresión polinomial, variables categóricas y tratamiento de outliers.
  • Parte 7 - Clasificación con regresión logística, estimación con máxima verosimititud, validación cruzada, K-fold cross validation, curvas ROC 
  • Parte 8 - Clustering, K-means, K-medoides, dendrogramas y clustering jerárquico, técnica del codo y análisis de la silueta
  • Parte 9 - Clasificación con árboles, bosques aleatorios, técnicas de poda, entropía, maximización de la información
  • Parte 10 - Support Vector Machines para problemas de clasificación y regresión, kernels no lineales, reconocimiento facial (cómo funciona CSI)
  • Parte 11 - Los K vecinos más cercanos, decisión por mayoría, programación de algoritmos de Machine Learning vs librerías de Python
  • Parte 12 - Análisis de componentes principales, reducción de la dimensión, LDA
  • Parte 13 - Deep learning, Reinforcement Learning, Redes neuronales artificiales y convolucionales y Tensor Flow

Además, en el curso encontrarás ejercicios, datasets para practicar basados en ejemplos de la vida real, de modo que no solo aprenderás la teoría con los vídeos, si no también a practicar para construir tus propios modelos de Machine Learning. Y como no olvidar que tendrás un github con todo el código fuente en Python para descargar y utilizar en todos tus proyectos. Así que no esperes más y apúntate al curso de Machine Learning más completo y útil del mercado español!


Screenshots

Curso completo de Machine Learning: Data Science en Python
Curso completo de Machine Learning: Data Science en Python
Curso completo de Machine Learning: Data Science en Python
Curso completo de Machine Learning: Data Science en Python

Content

Introducción

Introducción

Pre requisitos del curso

Conoce a tu instructor online, Juan Gabriel Gomila

Acerca de la valoración prematura del curso en Udemy

Instalando nuestra herramienta de trabajo

Cómo instalar Python con Anaconda Navigator

Cómo instalar paquetes en Python gracias a pip

Instalación de pip en Windows

Las librerías estándar de Machine Learning en Python

Los editores para programar en Python

Las 5 etapas del análisis de datos

Comunidad de estudiantes del curso

Algunos cambios en la versión 3.7 de Python

Una introducción al análisis predictivo y al Machine Learning

Ser Data Scientist es la profesión más sexy del siglo XXI

¿Qué es el análisis predictivo de datos?

Data Scientist = Matemáticas + Programación + Business

Aplicaciones y ejemplos del mundo del Data Science

Limpieza de Datos

Data Cleaning

El concepto de data frame

El repositorio Git del curso

¿Qué hago si no me autocompleta Jupyter?

Acerca de las barras en Windows

Leer datos procedentes de un CSV

Los parámetros de la función read_csv

Ejemplos de diferentes carga de datos con read_csv

El método open para la carga manual de datos

Cuidado con el método open

Leer y escribir en un fichero con Python

Leer los datos desde una URL externa

La carga de datos desde una hoja de cálculo

Ejercicio: descargar y procesar datos desde una URL externa

Las funciones básicas de resumen, estructura, dimensiones y cabecera

¿Por qué faltan valores en los data sets?

Qué hacer cuando faltan valores en el dataset

Las variables dummy

Visualización básica de un dataset: el scatterplot

Visualización básica de un dataset: el histograma de frecuencias

Visualización básica de un dataset: el boxplot

Operaciones de manejo de datos

Data Wrangling

Una chuleta de pandas para Data Wrangling

Fe de erratas

Buscar un subconjunto de datos de un dataset

Filtrados alternativos

Subconjuntos de filas con ciertas condiciones

Subconjuntos con loc e iloc y creación de nuevas columnas

Generar números aleatorios

La semilla de la generación aleatoria

Funciones de distribución de probabilidades

La distribución uniforme

La distribución Normal

El método de la simulación de Monte-Carlo para encontrar el valor de Pi

Generando dummy data frames

Un dummy data frame con variables categóricas

Agrupación de los datos por categorías

Agregación de datos

Filtrado, Transformación y otras operaciones útiles

Conjunto de entrenamiento y de testing

Atualización: cómo dividir conjunto de entrenamiento y test

Muestreo aleatorio: cómo dividir un dataset en conjunto de entreno y validación

Concatenar dos datasets por filas

Carga de cientos de datos distribuidos

Ejercicio: el data set de los juegos olímpicos

Concatenar los datos con merge

Formas de cruzar tablas con joins

Eliminar datos de datasets con restricciones de conjunto

Ejemplos de joins con Python

Ya conoces las bases del manejo de datos

¿Te gusta el curso? ¡Valóralo y cuéntanos tu opinión!

Conceptos básicos de estadística para la modelización predictiva

Los conceptos fundamentales de estadística

Un resumen de los estadísticos básicos (en R)

El resumen de estadísticos en Python (propuesta de un estudiante)

Muestreo aleatorio y el teorema central del límite

Los contrastes de hipótesis

Cómo hacer un contraste de hipótesis paso a paso

Test de la chi cuadrado

Correlación entre variables

Un resumen de lo aprendido

Regresión lineal con Python

La regresión lineal

Las matemáticas tras una regresión lineal

Demostración de la obtención de los parámetros del modelo lineal

Errores normalmente distribuidos

Sumas de los cuadrados totales, de las diferencias y de la regresión

Ejercicio demostrar que SST = SSR + SSD

Encontrando los coeficientes óptimos de la regresión

Interpretar los parámetros de la regresión

Implementar una regresión lineal con Python

Regresión lineal múltiple

El problema de la multicolinealidad

Validando nuestro modelo

El resumen de todos los modelos lineales creados

Regresión lineal con scikit-learn

Modelos lineales con variables categóricas

Variables categóricas en una regresión lineal

Otra forma más simple de calcular las predicciones

Enmascarado de variables categóricas redundantes

Transformar las variables en relaciones no lineales

El problema de los outliers

Otros problemas y consideraciones de la regresión lineal

Un resumen de la regresión lineal

Regresión logística con Python

La regresión logística

Regresión lineal vs regresión logística

Las matemáticas detrás de la regresión logística

Probabilidades condicionadas

Cociente de probabilidades

De la regresión lineal a la logística

Estimación con el método de máxima verosimilitud

Crear un modelo logístico desde cero

Análisis exploratorio de los datos

La selección de variables del dataset para el modelo logístico

Implementar una regresión logística con Python

Validación del modelo y evaluación del mismo

La validación cruzada

Validación cruzada con Python

Las matrices de confusión y las curvas ROC

Implementación de las curvas ROC en Python

Resumen de la regresión logística

Clustering y clasificación

Clustering

¿Qué es y para qué sirve el clustering?

El concepto de distancia

Matriz de distancias en Python

Métodos de enlace

Uniendo datos manualmente

Clustering jerárquico en Python

Un clustering completo: la fase de exploración de datos

Un clustering completo: representación del dendrograma

Un clustering completo: por donde cortamos el dendrograma

Un clustering completo: visualización final del clustering

El método de k-means

Implementando k-means con Python

Ejercicio: Segmentación de los vinos

El método del codo

El coeficiente de la silueta

Implementando la técnica del codo y el coeficiente de la silueta

Propagación de la afinidad

Implementando la propagación de la afinidad

Generando distribuciones en forma de anillo

Los K medoides y el clustering espectral

Resumen del clustering

Árboles y bosques aleatorios

Árboles y bosques aleatorios

¿Qué es un árbol de decisión?

Homogeneidad en los datos

Entropía y ganancia de Información

Algoritmos para la generación de árboles de clasificación

La poda del árbol

Los problemas del árbol

Los árboles de clasificación con Python

El tratamiento de ficheros dot

La validación cruzada en un árbol de clasificación

Los árboles de regresión

El dataset de las casas de Boston y Kaggle

Árboles de regresión con Python

Random forests

Random forests para regresión

Random forest para clasificación

¿Por qué funcionan los random forests?

Resumen de árboles y bosques aleatorios

Máquinas de Soporte Vectorial

Las máquinas de soporte vectorial

Las support vector machines

El problema de clasificación no óptimo

Los núcleos no lineales y el problema de la dimensión

Soporte Vectorial Clasificador Lineal

Creando el modelo clasificador lineal

Representación gráfica del hiperplano separador en 2D

El problema de la separación

Maximizar el margen de clasificación

Los soportes de SVM

Kernels no lineales

Radial basis function

Ajustando las SVM

Práctica de SVM: reconocimiento facial a lo CSI

Práctica de SVM: Clasificación de las flores de Iris

Truco: qué hacer cuando me toca hacer una análisis de datos

SVM para regresión

K Nearest Neighbors

La decisión de los K vecinos

Los k vecinos más cercanos

Limpieza del dataset del Cancer

Clasificación según los K vecinos

Clasificando nuevos datos de los tests médicos

Creando los datos para la clasificación

Implementando la decisión por mayoría

Nuestro algoritmo vs scikit-learn

Una opinión final sobre los algoritmos de Machine Learning

Sistemas de recomendación

El rol de las recomendaciones dinámicas en el siglo XXI

El dataset de películas de Movie Lens

Análisis exploratorio de los datos y distribución de las valoraciones

Esparseidad de los datos

División en entrenamiento y validación

La matriz de similaridad entre usuarios

Predecir la valoración de un ítem para un usuario

Corrección: Error en la clase anterior

Filtrando con los K nearest neighbors

Sistemas de Recomendación basados en Ítems

Recomendando con los K items más parecidos

Los resultados finales

Análisis de componentes principales

Análisis de Componentes principales

El problema de la dimensión

Demostración de cómo se hace un ACP

Implementando nuestro propio ACP en Python

Plotly, la librería de gráficos personalizados e interactivos

Los valores y vectores propios de la matriz de covarianzas

La matriz de correlaciones y el Singular Value Decomposition

La selección de las componentes principales

La proyección en el subespacio vectorial resultante

Implementación de ACP con sklearn

Más gráficos con Plotly

Personalizando los gráficos de plotly

Coloraciones y etiquetas de plotly

Introducción a las redes neuronales y al deep learning con TensorFlow

Redes neuronales del futuro

Introducción a Tensor Flow

Acerca de las redes neuronales y el deep learning

Instalando TensorFlow en tu ordenador

Si tienes problemas con la instalación de TensorFlow

La carga del dataset de imágenes

Análisis exploratorio de los datos

Un resumen visual de imágenes

Pre procesado de imágenes previo al ML

Creación del modelo

Entrenamiento del modelo

Validación del modelo

El dataset de reconocimiento de dígitos

De datos desestructurados a espacios vectoriales n-dimensionales

La regresión softmax

Tensorflow y la regresión softmax

La fase de entrenamiento de la red neuronal

La fase de evaluación de la red neuronal

Juntar código de R y Python con la librería rpy2

Cuando Python conoce a R, no hay límites en el Big Data

Instalar la librería rpy2

Nota adicional para instalar rpy2 en Windows

Llevando objetos de R a Python

Llevando objetos de Python a R

Cómo instalar y cargar paquetes de R desde Python

La librería extRemes en acción desde Python

Rmagic

Lo bueno de programación en Python, lo mejor de estadística con R

¿Qué nos depara el futuro?

Proyecto final. ¿Qué me depara el futuro?

Ejemplo: dashboard con las valoraciones de las películas

Nos vemos en el próximo curso

Un regalo para ti


Reviews

J
Juan9 October 2020

Hice el curso para conocer como es el análisis de datos y me lo ha dejado bastante claro. Respecto el curso, reconozco que ha sido de los más densos que he hecho pero he quedado muy satisfecho con el contenido. Ahora a por los dos que quedan.

G
Gabriel9 October 2020

Bastante bueno, yo soy estudiante de Ing. en Sistemas de Información de segundo año y no tuve problema para seguir el curso hasta ahora, solo problemas de incompatibilidad entre los entornos ya que el profesor trabaja en Mac y yo en Windows. Esencial saber usar google, y saber inglés, porque la mayoría de los foros están en inglés. Le doy un 4 porque hay muchas cosas que se podrían pulir y mejorar pero es lo que uno espera, simplemente no me sorprendió

J
Juan8 October 2020

La experiencia de aprendizaje no es nada interactiva, es como una charla y el medianamente te explica como se hace cada cosa y que, se ve que domina el tema, pero programa muy feo, ademas es cero practica, solo lo escuchas y escuchas y escuchas pero no es realmente buen curso, llevo el 40% y si bien si he aprendido, no ha sido como esperaba. Paralelo a esto hay uno de python for finance mucho mas interactivo.

M
Marco7 October 2020

Fue muy buena elección.. hasta ahora todos los conceptos fueron mostrados con prácticas y eso es beneficioso.

J
Jorge2 October 2020

Estupendo curso de Machine Learning orientado a DataScience, con lo visto hasta ahora supera las expectativas, es muy detallado y explica con ejemplos prácticos cada uno de los conceptos y provee los recursos necesarios para trabajar y seguir a la par del avance de los capítulos, sigue así Juan Gabriel muchas gracias.

I
Ignacio28 February 2020

El curso es muy bueno. El aprendizaje es progresivo, está muy bien tratado el tiempo y los ejemplos muy trabajados. Además las herramientas que utiliza permiten seguirlo tanto en Windows como en linux, sin ningún problema.

K
Kevin21 February 2020

Excelente curso para descubrir y aprender sobre diferentes técnicas de ML. El profesor es muy bueno y es notorio el esfuerzo y la dedicación a su profesión. Altamente recomendado a quien quiera ingresar a este mundo. No doy más estrellas porque no se puede. Los animo a que tomen el curso no se arrepentirán y aprenderán muchísimo!

H
Haymara20 February 2020

Muy complicado la descarga de los archivos necesarios para iniciar el curso. Puede hacer que algunos desistan

S
Santiago20 February 2020

Excelente explicación, contenido y ejecución del curso, realmente me sorprende la buena estructura del mismo

Z
Zupe18 February 2020

Muy buena introducción a Machine Learning. Con el final del curso próximo, creo que tengo una base sólida como para profundizar más en los temas. Como sugerencia de mejora estaría muy bien una actualización de los videos para resolver las obsolescencias/evoluciones de los paquetes de python que ya no se utilizan a día de hoy

S
Soledad15 February 2020

Es excelente la bajada a la vida real de cómo aplicar los algoritmos, cómo usar la estádistica y modelar. También refleja aspectos de contexto que son importantes para tomar decisiones. Es sumamente claro y explicativo! 100% recomendable.

J
José14 February 2020

Es un excelente curso. En este curso uno puede aprender desde lo básico de la ciencia de datos, hasta cosas un tanto avanzadas. Las lecciones se van dando poco a poco y se explican la mayoría de las cosas, y, si no, se da referencia a paginas web especiales para informarse sobre las dudas que se tengan en Python.

A
Andrea12 February 2020

Llevo cerca de 3/4 del curso y me ha parecido estupendo. La verdad no esperaba aprender tanto. Destaco el conocimiento matemático del profe que siempre trata de explicar qué efecto tienen los hiperparámetros en las funciones predefinidas, además de compartir sus experiencias y apreciaciones utilizando distintos métodos. 100% recomendable!

C
Carlos12 February 2020

Es un muy buen curso , el profesor y la comunidad que hay en el grupo es muy agradable y siempre responden las dudas

S
Sergio12 February 2020

Porque los conceptos se explican paso a paso y de forma muy sencilla y lo suficientemente detallada como para ver todas las posibilidades


Coupons

DateDiscountStatus
3/9/202193% OFFExpired
6/23/202192% OFFExpired
7/9/202192% OFFValid

1606018

Udemy ID

3/19/2018

Course created date

11/1/2019

Course Indexed date
Bot
Course Submitted by