Машинное обучение в Python: Machine Learning & Data Science

Изучите NumPy, Pandas, Matplotlib, Seaborn, Scikit-Learn и многое другое! Осваивайте Искусственный Интеллект на практике

4.76 (531 reviews)
Udemy
platform
Русский
language
Data Science
category
instructor
2,837
students
50.5 hours
content
Feb 2024
last update
$69.99
regular price

What you will learn

Построение моделей машинного обучения с учителем (Supervised Learning)

Применение NumPy для работы с числами в Python

Применение Seaborn для создания красивых графиков визуализации данных

Применение Pandas для манипуляции с данными в Python

Применение Matplotlib для детальной настройки визуализаций данных в Python

Конструирование признаков (Feature Engineering) на реалистичных примерах

Алгоритмы регрессии для предсказания непрерывных переменных

Навыки подготовки данных к машинному обучению

Алгоритмы классификации для предсказания категориальных переменных

Создание портфолио проектов машинного обучения и Data Science

Работа с Scikit-Learn для применения различных алгоритмов машинного обучения

Быстрая настройка Anaconda для работ по машинному обучению

Понимание полного цикла этапов работ по машинному обучению

Description

Добро пожаловать на самый полный курс по Машинному Обучению и Data Science!

Этот курс - лучший способ начать с нуля и стать специалистом по data science и машинному обучению с помощью Python.

Это русскоязычная версия курса, который Хосе и его команда готовили больше года. И это уже после того, как предыдущие курсы прошли более 2 миллионов слушателей.

Этот объёмный курс может заменить Вам целый набор других курсов, которые могут стоить в десятки раз больше.

В этом курсе Вы изучите следующие темы:

  • Программирование в Python (экспресс-курс)

  • NumPy в Python

  • Детальное изучение Pandas для анализа и предварительной обработки данных

  • Детальное изучение Seaborn для визуализации данных (включая Matplotlib для кастомизации графиков)

  • Машинное обучение с помощью SciKit Learn, включая следующие темы:

    • Linear Regression - Линейная Регрессия

    • Regularization - Регуляризация

    • Lasso Regression - Лассо-Регрессия

    • Ridge Regression - Ридж-Регрессия

    • Регуляризация Elastic Net

    • Logistic Regression - Логистическая регрессия

    • K Nearest Neighbors - Метод К-ближайших соседей

    • Decision Trees - Деревья решений

    • Random Forests - Случайные леса

    • AdaBoost, GradientBoosting - Адаптивный бустинг, Градиентный бустинг

    • Natural Language Processing - Обработка языковых данных

    • K Means Clustering - Кластеризация К-средних

    • Hierarchical Clustering - Иерархическая кластеризация

    • DBSCAN (Density-based spatial clustering of applications with noise) - Кластеризация на основе плотности данных

    • PCA - Principal Component Analysis - Метод главных компонент

    • И многое, многое другое!

Внутри курса находится набор блокнотов Jupyter Notebook с русском языке с примерами кода и детальным описанием. Для каждой лекции это отдельные блокноты, которые разложены по папкам с соответствии с разделами курса.  Так что Вы сможете не только просмотреть видео-лекции, но и прочитать блокноты.  Это особенно удобно, когда Вам нужно что-то вспомнить или быстро пробежаться по материалу в поисках нужной информации.

Как всегда, мы очень ценим возможность стать Вашими инструкторами по data science, машинному обучению и Python. Надеемся, что Вы запишетесь на этот курс и прокачаете Ваши навыки!

Content

Вводная часть курса

Добро пожаловать на курс!
ОБЗОР КУРСА - НЕ ПРОПУСКАЙТЕ ЭТУ ЛЕКЦИЮ
Установка Anaconda, Python, Jupyter Notebook
Прочтите эту статью - Замечание о настройке среды разработки
Настройка среды разработки

ОПЦИОНАЛЬНО: Экспресс-курс по Python

Опционально: Экспресс-курс по Python
Экспресс-курс по Python - Часть 1
Экспресс-курс по Python - Часть 2
Экспресс-курс по Python - Часть 3
Проверочные упражнения по Python
Решения для проверочных упражнений по Python

Этапы работ по машинному обучению

Этапы работ по машинному обучению

NumPy

Обзор раздела про NumPy
Массивы NumPy
Индексация и выбор данных из массивов NumPy
Операции в NumPy
Проверочные упражнения по NumPy
Решения для проверочных упражнений по NumPy

Pandas

Обзор раздела про Pandas
Series - Часть 1
Series - Часть 2
Датафреймы - Часть 1 - Создание датафреймов
Датафреймы - Часть 2 - Основные атрибуты
Датафреймы - Часть 3 - Работа с колонками
Датафреймы - Часть 4 - Работа со строками
Выборка данных по условию (Conditional Filtering)
Полезные методы - Apply для одной колонки
Полезные методы - Apply для нескольких колонок
Полезные методы - Статистическая информация и сортировка данных
Отсутствующие данные (missing data) - Обзор
Отсутствующие данные (missing data) - Операции в Pandas
Агрегация данных GROUP BY - Часть 1
Агрегация данных GROUP BY - Часть 2 - Мульти-индекс
Объединение датафреймов - Конкатенация
Объединение датафреймов - Inner Merge
Объединение датафреймов - Left и Right Merge
Объединение датафреймов - Outer Merge
Методы Pandas для текста
Методы Pandas для даты и времени
Input/Output в Pandas - CSV-файлы
Input/Output в Pandas - HTML-таблицы
Input/Output в Pandas - Excel-файлы
Input/Output в Pandas - SQL базы данных
Сводные таблицы в Pandas (pivot tables)
Проверочные упражнения по Pandas
Решения для проверочных упражнений по Pandas

Matplotlib

Обзор раздела про Matplotlib
Основы Matplotlib
Объект Figure - принципы работы
Объект Figure - код в Python
Объект Figure - параметры
Subplots - несколько графиков рядом друг с другом
Стилизация Matplotlib: легенды
Стилизация Matplotlib: цвета и стили
Дополнительные материалы по Matplotlib
Проверочные упражнения по Matplotlib
Решения для проверочных упражнений по Matplotlib

Seaborn

Обзор раздела про Seaborn
Scatterplots - Графики рассеяния (диаграммы рассеяния)
Distribution Plots - Часть 1 - Типы графиков
Distribution Plots - Часть 2 - Код в Python
Categorical Plots - Статистики по категориям - Типы графиков
Categorical Plots - Статистики по категориям - Код в Python
Categorical Plots - Распределения по категориям - Типы графиков
Categorical Plots - Распределения по категориям - Код в Python
Графики сравнения - Типы графиков
Графики сравнения - Код в Python
Seaborn Grid
Матричные графики
Проверочные упражнения по Seaborn
Решения для проверочных упражнений по Seaborn

Большой Проект по Визуализации Данных

Обзор Проекта по Визуализации Данных
Разбор решений проекта - Часть 1
Разбор решений проекта - Часть 2
Разбор решений проекта - Часть 3

Обзор Машинного Обучения

Обзор раздела
Зачем нужно машинное обучение
Типы алгоритмов машинного обучения
Процесс для обучения с учителем (supervised learning)
(ОПЦИОНАЛЬНО) Дополнительная книга для чтения - ISLR

Линейная Регрессия

Обзор раздела про линейную регрессию
Линейная регрессия - История алгоритма
Наименьшие квадраты
Функция стоимости (Cost Function)
Градиентный спуск (Gradient Descent)
Простая линейная регрессия
Обзор Scikit-Learn
Scikit-Learn - Train Test Split
Scikit-Learn - оценка работы модели
Графики остатков - Residual Plots
Внедрение модели и интерпретация коэффициентов
Полиномиальная регрессия - теория
Полиномиальная регрессия - создание признаков
Полиномиальная регрессия - обучение и оценка модели
Дилемма смещения-дисперсии (Bias-Variance Trade-Off)
Полиномиальная регрессия - выбираем степень полинома
Полиномиальная регрессия - внедрение модели
Регуляризация - обзор
Масштабирование признаков (feature scaling)
Кросс-валидация - обзор
Регуляризация - подготовка данных
L2 Регуляризация - Ридж-регрессия - теория
L2 Регуляризация - Ридж-регрессия - код в Python
L1 Регуляризация - Лассо-регрессия - теория и код в Python
L1 и L2 Регуляризация - Эластичная сеть Elastic Net
Обзор данных для проверочного проекта по линейной регрессии

Конструирование признаков (Feature Engineering) и подготовка данных

Обзор Feature Engineering
Работа с выбросами (outliers)
Работа с отсутствующими данными (missing data) - Часть 1 - Оценка ситуации
Работа с отсутствующими данными (missing data) - Часть 2 - Работа по строкам
Работа с отсутствующими данными (missing data) - Часть 3 - Работа по колонкам
Работа с категориальными переменными

Кросс-валидация и Проверочный проект по линейной регрессии

Обзор раздела про кросс-валидацию
Разбиение Train | Test Split
Разбиение Train | Validation | Test Split
Кросс-валидация - cross_val_score
Кросс-валидация - cross_validate
Поиск по сетке - Grid Search
Обзор проверочного проекта по линейной регрессии
Решения для проверочного проекта по линейной регрессии

Логистическая регрессия

Обзор раздела про логистическую регрессию
Теория логистической регрессии - Часть 1 - Логистическая функция
Теория логистической регрессии - Часть 2 - Переход от линейной к логистической
Теория логистической регрессии - Часть 3 - Математика перехода
Теория логистической регрессии - Часть 4 - Поиск наилучшего графика
Логистическая регрессия в Scikit-Learn - Часть 1 - Исследование данных
Логистическая регрессия в Scikit-Learn - Часть 2 - Создание и обучение модели
Метрики классификации - Confusion Matrix и Accuracy
Метрики классификации - Precision, Recall и F1-Score
Метрики классификации - ROC-кривые
Логистическая регрессия в Scikit-Learn - Часть 3 - Оценка работы модели
Мульти-классовая классификация - Логистическая регрессия - Исследование данных
Мульти-классовая классификация - Логистическая регрессия - Модель
Проверочный проект по логистической регрессии
Решения для проверочного проекта по логистической регрессии

Метод К-ближайших соседей (KNN - K-Nearest Neighbors)

Обзор раздела про метод К-ближайших соседей
Теория метода К-ближайших соседей
KNN: пишем код в Python - Часть 1
KNN: пишем код в Python - Часть 2
Проверочные упражнения по KNN
Решения для проверочных упражнений по KNN

Метод опорных векторов (SVM - Support Vector Machines)

Обзор раздела про метод опорных векторов
История метода опорных векторов
Теория метода опорных векторов - Гиперплоскости и зазоры (margins)
Теория метода опорных векторов - ядра (kernels)
Теория метода опорных векторов - "kernel trick" и математика (опционально)
SVM в Scikit-Learn для задач классификации - Часть 1
SVM в Scikit-Learn для задач классификации - Часть 2
SVM в Scikit-Learn для задач регрессии
Проверочные упражнения по методу опорных векторов
Решения для проверочных упражнений по методу опорных векторов

Деревья решений - Decision Trees

Обзор раздела про деревья решений
Деревья решений - История
Деревья решений - Терминология
Деревья решений - метрика "Gini Impurity"
Построение деревьев решений с помощью Gini Impurity - Часть 1
Построение деревьев решений с помощью Gini Impurity - Часть 2
Код в Python для деревьев решений - Часть 1 - Данные
Код в Python для деревьев решений - Часть 2 - Модель

Случайные леса - Random Forests

Обзор раздела про случайные леса
История и мотивация создания случайных лесов
Гиперпараметры случайного леса - Обзор
Гиперпараметры случайного леса - Количество деревьев и Количество признаков
Гиперпараметры случайного леса - Bootstrapping и oob_score
Классификация данных с помощью RandomForestClassifier - Часть 1
Классификация данных с помощью RandomForestClassifier - Часть 2
Регрессия с помощью RandomForestRegressor - Часть 1 - Обзор данных
Регрессия с помощью RandomForestRegressor - Часть 2 - Базовые модели
Регрессия с помощью RandomForestRegressor - Часть 3 - Полиномиальная модель
Регрессия с помощью RandomForestRegressor - Часть 4 - Остальные модели

Бустинг и Расширяемые деревья - Boosted Trees

Обзор раздела про бустинг
История возникновения бустинга
AdaBoost - Теория - Как работает адаптивный бустинг
AdaBoost - Код в Python - Данные
AdaBoost - Код в Python - Модель
Градиентный бустинг - Теория
Градиентный бустинг - Пишем код в Python

Проверочный проект по моделям обучения с учителем (Supervised Learning)

Обзор проверочного проекта
Разбор решений - Часть 1 - Исследование данных (Exploratory Data Analysis)
Разбор решений - Часть 2 - Анализ оттока (churn analysis)
Разбор решений - Часть 3 - Модели на основе деревьев решений

NLP (Natural Language Processing) и Наивный Байесовский Классификатор

Обзор раздела про NLP и Наивный Байесовский алгоритм
Наивный Байесовский алгоритм - Часть 1 - Теорема Байеса
Наивный Байесовский алгоритм - Часть 2 - сам алгоритм
Извлечение признаков из текста - Теория
Извлечение признаков из текста - "Мешок слов" - пишем код вручную
Извлечение признаков из текста с помощью Scikit-Learn
Классификация текста - Часть 1
Классификация текста - Часть 2
Проверочные упражнения по классификации текста
Решения для проверочных упражнений по классификации текста

Машинное обучение без учителя - Unsupervised Learning

Обзор обучения без учителя - Unsupervised Learning

Кластеризация К-Средних - K-Means Clustering

Обзор раздела про кластеризацию К-средних
Принципы кластеризации данных (без привязки к конкретному алгоритму)
Теория кластеризации К-средних
Кластеризация К-средних - Пишем код - Часть 1
Кластеризация К-средних - Пишем код - Часть 2
Выбираем количество кластеров К - Теория
Выбираем количество кластеров К - Пишем код в Python
Квантование цветов - Теория
Квантование цветов - Пишем код в Python
Проверочные упражнения по кластеризации К-средних
Решения для проверочных упражнений по кластеризации К-средних - Часть 1
Решения для проверочных упражнений по кластеризации К-средних - Часть 2
Решения для проверочных упражнений по кластеризации К-средних - Часть 3

Иерархическая кластеризация данных

Обзор раздела про иерархическую кластеризацию
Теория и интуиция иерархической кластеризации
Иерархическая кластеризация - Пишем код, часть 1 - Данные
Иерархическая кластеризация - Пишем код, часть 2 - Scikit-Learn

DBSCAN - Кластеризация на основе плотности данных

Обзор раздела про кластеризацию DBSCAN
Теория алгоритма DBSCAN
Сравниваем DBSCAN и K-Means Clustering
Ключевые гиперпараметры DBSCAN - Теория
Ключевые гиперпараметры DBSCAN - код в Python
Проверочные упражнения по DBSCAN
Решения для проверочных упражнений по DBSCAN

Метод главных компонент (PCA - Principal Component Analysis)

Обзор раздела про метод главных компонент
Теория метода главных компонент - Часть 1 - История и интуиция
Теория метода главных компонент - Часть 2 - Математика
Реализация метода главных компонент вручную
Метод главных компонент в Scikit-Learn
Проверочные упражнения по методу главных компонент
Решения для проверочных упражнений по методу главных компонент

Резюме курса

Резюме курса

Screenshots

Машинное обучение в Python: Machine Learning & Data Science - Screenshot_01Машинное обучение в Python: Machine Learning & Data Science - Screenshot_02Машинное обучение в Python: Machine Learning & Data Science - Screenshot_03Машинное обучение в Python: Machine Learning & Data Science - Screenshot_04

Reviews

Максим
October 10, 2023
То что пройдено на данный момент, сформировано создателями курса очень понятно с пояснениями всех деталей и нюансов. Отличная работа! Дальше буду смотреть.
Alexber
August 18, 2023
превосходно !! информация дается шаг за шагом много самостоятельных заданий четкий разбор заданий много повторений для лучшего запоминания
Nikita
May 3, 2023
Курс как сериал, смотреться на одном дыхании и также грустно когда он заканчивается. Материал - топ, изложение - топ, курс - топ, рекомендую!!!
David
March 31, 2023
Отличный курс. Я до этой лекции пересмотрел кучу других курсов на разных языках к тому же прошел 5 месячный курс по ML & Deep Learning, была в голове каша (с терминологиями, как применять модели не говоря что надо их подготавливать и перепроверять) и только просмотрев этот курс все стало по своим местам.
Сергей
March 31, 2023
Дошел до середины Pandas и что мне хочется сказать.. Материал дается очень структурированно и понятно. Пожалуй, это лучший курс для новичков среди многих в области ML and AI. Отзывы с небольшим количеством звезд читают лучше, потому, что люди всегда ищут подвох, так вот, его здесь нет, даже не задумываясь берите курс!!! А на рейтинг преподавателя моя оценка повлияет не сильно, потому, что хороших отзывов более, чем достаточно!
Alladin
February 17, 2023
Курс слушал на одном дыхании! В какой-то момент было интересно, в какой-то сложно, но в итоге получил желаемый результат!
Marina
February 13, 2023
All very understandable. But now I see what will be useful before this course to learn Python and math
Gulgul
January 26, 2023
очень насыщенный курс!! Благодарю за труд, предварительно прошла курс Python, по окончанию курса дополню отзыв
Irina
January 9, 2023
Очень информативный и практически понятный курс! Всё, что нужно для понимания процесса ML! спасибо огромное авторам!
Alex
November 20, 2022
Курс хороший и очень полный. Лично мне не нравится, что очень много информации для начинающих и что подача информации, как в школе "от кирпичиков к общей картине", а не наоборот
Антон
October 12, 2022
Из всех предлагаемых в сети курсов по Machine Learning & Data Science - этот курс, однозначно, ТОР-1.
Alexey
July 27, 2022
Курс очень сильный, ничего лишнего. Все "разжевывается" доступным языком. Очень понравилась организация курса, в начале теория, затем практика и в конце проверочные задания с дальнейшим разъяснением по каждому пункту. Давно хотелось попробовать что то новое!
Bogdan
June 17, 2022
Я работаю веб-разработчиком. Очень хотел изучить тему искуственного интелекта и понял что для начала надо пройти тему машинного обучения. На дорогостоящие курсы не хотел тратить деньги, да и фиксированное время не мог выделить (днем работаю, по вечерам гуляю с дочкой). Вот и выбирал видеокурс на udemy и в первую очередь знакомился с англоязычными (так как знаю язык). Но сразу понял что они не такие фундаментальные и по сути простые в сравнении с этим. Поэтому выбрал его. Прошел его за 2 месяца, слушая по пути на работу или перед сном, делая в свободное время. Очень много тем охватывает курс, но все они базовые (значит обязательные). В целом понравился, ни разу не пожалел что купил его, советую)
Ivan
June 9, 2022
Отличный курс, наверное лучший из представленных на Udemy (включая англоязычные). Безусловно Data Science такая область, где всё равно всегда можно было бы рассказать что-то ещё, но базовые вещи представлены доступно плюс отличные ноутбуки, которыми можно пользоваться как конспектом в дальнейшем. Будем надеяться на Deep Learning от автора ;) Спасибо!
Константин
February 16, 2022
Отличная работа. Дают не только код, но и теоретическую часть. Что помогает разобраться в принципе работы. Для меня это большой +!

Charts

Price

Машинное обучение в Python: Machine Learning & Data Science - Price chart

Rating

Машинное обучение в Python: Machine Learning & Data Science - Ratings chart

Enrollment distribution

Машинное обучение в Python: Machine Learning & Data Science - Distribution chart
3051582
udemy ID
4/25/2020
course created date
1/21/2022
course indexed date
Bot
course submited by