Вводная часть курса
Добро пожаловать на курс!
ОБЗОР КУРСА - НЕ ПРОПУСКАЙТЕ ЭТУ ЛЕКЦИЮ
Установка Anaconda, Python, Jupyter Notebook
Прочтите эту статью - Замечание о настройке среды разработки
Настройка среды разработки
ОПЦИОНАЛЬНО: Экспресс-курс по Python
Опционально: Экспресс-курс по Python
Экспресс-курс по Python - Часть 1
Экспресс-курс по Python - Часть 2
Экспресс-курс по Python - Часть 3
Проверочные упражнения по Python
Решения для проверочных упражнений по Python
Этапы работ по машинному обучению
Этапы работ по машинному обучению
NumPy
Обзор раздела про NumPy
Массивы NumPy
Индексация и выбор данных из массивов NumPy
Операции в NumPy
Проверочные упражнения по NumPy
Решения для проверочных упражнений по NumPy
Pandas
Обзор раздела про Pandas
Series - Часть 1
Series - Часть 2
Датафреймы - Часть 1 - Создание датафреймов
Датафреймы - Часть 2 - Основные атрибуты
Датафреймы - Часть 3 - Работа с колонками
Датафреймы - Часть 4 - Работа со строками
Выборка данных по условию (Conditional Filtering)
Полезные методы - Apply для одной колонки
Полезные методы - Apply для нескольких колонок
Полезные методы - Статистическая информация и сортировка данных
Отсутствующие данные (missing data) - Обзор
Отсутствующие данные (missing data) - Операции в Pandas
Агрегация данных GROUP BY - Часть 1
Агрегация данных GROUP BY - Часть 2 - Мульти-индекс
Объединение датафреймов - Конкатенация
Объединение датафреймов - Inner Merge
Объединение датафреймов - Left и Right Merge
Объединение датафреймов - Outer Merge
Методы Pandas для текста
Методы Pandas для даты и времени
Input/Output в Pandas - CSV-файлы
Input/Output в Pandas - HTML-таблицы
Input/Output в Pandas - Excel-файлы
Input/Output в Pandas - SQL базы данных
Сводные таблицы в Pandas (pivot tables)
Проверочные упражнения по Pandas
Решения для проверочных упражнений по Pandas
Matplotlib
Обзор раздела про Matplotlib
Основы Matplotlib
Объект Figure - принципы работы
Объект Figure - код в Python
Объект Figure - параметры
Subplots - несколько графиков рядом друг с другом
Стилизация Matplotlib: легенды
Стилизация Matplotlib: цвета и стили
Дополнительные материалы по Matplotlib
Проверочные упражнения по Matplotlib
Решения для проверочных упражнений по Matplotlib
Seaborn
Обзор раздела про Seaborn
Scatterplots - Графики рассеяния (диаграммы рассеяния)
Distribution Plots - Часть 1 - Типы графиков
Distribution Plots - Часть 2 - Код в Python
Categorical Plots - Статистики по категориям - Типы графиков
Categorical Plots - Статистики по категориям - Код в Python
Categorical Plots - Распределения по категориям - Типы графиков
Categorical Plots - Распределения по категориям - Код в Python
Графики сравнения - Типы графиков
Графики сравнения - Код в Python
Seaborn Grid
Матричные графики
Проверочные упражнения по Seaborn
Решения для проверочных упражнений по Seaborn
Большой Проект по Визуализации Данных
Обзор Проекта по Визуализации Данных
Разбор решений проекта - Часть 1
Разбор решений проекта - Часть 2
Разбор решений проекта - Часть 3
Обзор Машинного Обучения
Обзор раздела
Зачем нужно машинное обучение
Типы алгоритмов машинного обучения
Процесс для обучения с учителем (supervised learning)
(ОПЦИОНАЛЬНО) Дополнительная книга для чтения - ISLR
Линейная Регрессия
Обзор раздела про линейную регрессию
Линейная регрессия - История алгоритма
Наименьшие квадраты
Функция стоимости (Cost Function)
Градиентный спуск (Gradient Descent)
Простая линейная регрессия
Обзор Scikit-Learn
Scikit-Learn - Train Test Split
Scikit-Learn - оценка работы модели
Графики остатков - Residual Plots
Внедрение модели и интерпретация коэффициентов
Полиномиальная регрессия - теория
Полиномиальная регрессия - создание признаков
Полиномиальная регрессия - обучение и оценка модели
Дилемма смещения-дисперсии (Bias-Variance Trade-Off)
Полиномиальная регрессия - выбираем степень полинома
Полиномиальная регрессия - внедрение модели
Регуляризация - обзор
Масштабирование признаков (feature scaling)
Кросс-валидация - обзор
Регуляризация - подготовка данных
L2 Регуляризация - Ридж-регрессия - теория
L2 Регуляризация - Ридж-регрессия - код в Python
L1 Регуляризация - Лассо-регрессия - теория и код в Python
L1 и L2 Регуляризация - Эластичная сеть Elastic Net
Обзор данных для проверочного проекта по линейной регрессии
Конструирование признаков (Feature Engineering) и подготовка данных
Обзор Feature Engineering
Работа с выбросами (outliers)
Работа с отсутствующими данными (missing data) - Часть 1 - Оценка ситуации
Работа с отсутствующими данными (missing data) - Часть 2 - Работа по строкам
Работа с отсутствующими данными (missing data) - Часть 3 - Работа по колонкам
Работа с категориальными переменными
Кросс-валидация и Проверочный проект по линейной регрессии
Обзор раздела про кросс-валидацию
Разбиение Train | Test Split
Разбиение Train | Validation | Test Split
Кросс-валидация - cross_val_score
Кросс-валидация - cross_validate
Поиск по сетке - Grid Search
Обзор проверочного проекта по линейной регрессии
Решения для проверочного проекта по линейной регрессии
Логистическая регрессия
Обзор раздела про логистическую регрессию
Теория логистической регрессии - Часть 1 - Логистическая функция
Теория логистической регрессии - Часть 2 - Переход от линейной к логистической
Теория логистической регрессии - Часть 3 - Математика перехода
Теория логистической регрессии - Часть 4 - Поиск наилучшего графика
Логистическая регрессия в Scikit-Learn - Часть 1 - Исследование данных
Логистическая регрессия в Scikit-Learn - Часть 2 - Создание и обучение модели
Метрики классификации - Confusion Matrix и Accuracy
Метрики классификации - Precision, Recall и F1-Score
Метрики классификации - ROC-кривые
Логистическая регрессия в Scikit-Learn - Часть 3 - Оценка работы модели
Мульти-классовая классификация - Логистическая регрессия - Исследование данных
Мульти-классовая классификация - Логистическая регрессия - Модель
Проверочный проект по логистической регрессии
Решения для проверочного проекта по логистической регрессии
Метод К-ближайших соседей (KNN - K-Nearest Neighbors)
Обзор раздела про метод К-ближайших соседей
Теория метода К-ближайших соседей
KNN: пишем код в Python - Часть 1
KNN: пишем код в Python - Часть 2
Проверочные упражнения по KNN
Решения для проверочных упражнений по KNN
Метод опорных векторов (SVM - Support Vector Machines)
Обзор раздела про метод опорных векторов
История метода опорных векторов
Теория метода опорных векторов - Гиперплоскости и зазоры (margins)
Теория метода опорных векторов - ядра (kernels)
Теория метода опорных векторов - "kernel trick" и математика (опционально)
SVM в Scikit-Learn для задач классификации - Часть 1
SVM в Scikit-Learn для задач классификации - Часть 2
SVM в Scikit-Learn для задач регрессии
Проверочные упражнения по методу опорных векторов
Решения для проверочных упражнений по методу опорных векторов
Деревья решений - Decision Trees
Обзор раздела про деревья решений
Деревья решений - История
Деревья решений - Терминология
Деревья решений - метрика "Gini Impurity"
Построение деревьев решений с помощью Gini Impurity - Часть 1
Построение деревьев решений с помощью Gini Impurity - Часть 2
Код в Python для деревьев решений - Часть 1 - Данные
Код в Python для деревьев решений - Часть 2 - Модель
Случайные леса - Random Forests
Обзор раздела про случайные леса
История и мотивация создания случайных лесов
Гиперпараметры случайного леса - Обзор
Гиперпараметры случайного леса - Количество деревьев и Количество признаков
Гиперпараметры случайного леса - Bootstrapping и oob_score
Классификация данных с помощью RandomForestClassifier - Часть 1
Классификация данных с помощью RandomForestClassifier - Часть 2
Регрессия с помощью RandomForestRegressor - Часть 1 - Обзор данных
Регрессия с помощью RandomForestRegressor - Часть 2 - Базовые модели
Регрессия с помощью RandomForestRegressor - Часть 3 - Полиномиальная модель
Регрессия с помощью RandomForestRegressor - Часть 4 - Остальные модели
Бустинг и Расширяемые деревья - Boosted Trees
Обзор раздела про бустинг
История возникновения бустинга
AdaBoost - Теория - Как работает адаптивный бустинг
AdaBoost - Код в Python - Данные
AdaBoost - Код в Python - Модель
Градиентный бустинг - Теория
Градиентный бустинг - Пишем код в Python
Проверочный проект по моделям обучения с учителем (Supervised Learning)
Обзор проверочного проекта
Разбор решений - Часть 1 - Исследование данных (Exploratory Data Analysis)
Разбор решений - Часть 2 - Анализ оттока (churn analysis)
Разбор решений - Часть 3 - Модели на основе деревьев решений
NLP (Natural Language Processing) и Наивный Байесовский Классификатор
Обзор раздела про NLP и Наивный Байесовский алгоритм
Наивный Байесовский алгоритм - Часть 1 - Теорема Байеса
Наивный Байесовский алгоритм - Часть 2 - сам алгоритм
Извлечение признаков из текста - Теория
Извлечение признаков из текста - "Мешок слов" - пишем код вручную
Извлечение признаков из текста с помощью Scikit-Learn
Классификация текста - Часть 1
Классификация текста - Часть 2
Проверочные упражнения по классификации текста
Решения для проверочных упражнений по классификации текста
Машинное обучение без учителя - Unsupervised Learning
Обзор обучения без учителя - Unsupervised Learning
Кластеризация К-Средних - K-Means Clustering
Обзор раздела про кластеризацию К-средних
Принципы кластеризации данных (без привязки к конкретному алгоритму)
Теория кластеризации К-средних
Кластеризация К-средних - Пишем код - Часть 1
Кластеризация К-средних - Пишем код - Часть 2
Выбираем количество кластеров К - Теория
Выбираем количество кластеров К - Пишем код в Python
Квантование цветов - Теория
Квантование цветов - Пишем код в Python
Проверочные упражнения по кластеризации К-средних
Решения для проверочных упражнений по кластеризации К-средних - Часть 1
Решения для проверочных упражнений по кластеризации К-средних - Часть 2
Решения для проверочных упражнений по кластеризации К-средних - Часть 3
Иерархическая кластеризация данных
Обзор раздела про иерархическую кластеризацию
Теория и интуиция иерархической кластеризации
Иерархическая кластеризация - Пишем код, часть 1 - Данные
Иерархическая кластеризация - Пишем код, часть 2 - Scikit-Learn
DBSCAN - Кластеризация на основе плотности данных
Обзор раздела про кластеризацию DBSCAN
Теория алгоритма DBSCAN
Сравниваем DBSCAN и K-Means Clustering
Ключевые гиперпараметры DBSCAN - Теория
Ключевые гиперпараметры DBSCAN - код в Python
Проверочные упражнения по DBSCAN
Решения для проверочных упражнений по DBSCAN
Метод главных компонент (PCA - Principal Component Analysis)
Обзор раздела про метод главных компонент
Теория метода главных компонент - Часть 1 - История и интуиция
Теория метода главных компонент - Часть 2 - Математика
Реализация метода главных компонент вручную
Метод главных компонент в Scikit-Learn
Проверочные упражнения по методу главных компонент
Решения для проверочных упражнений по методу главных компонент