Python数据分析与机器学习实战

机器学习实战

4.65 (145 reviews)
Udemy
platform
中文
language
Programming Languages
category
instructor
Python数据分析与机器学习实战
1,090
students
31 hours
content
May 2019
last update
$49.99
regular price

What you will learn

掌握数据科学领域必备Python工具包

掌握机器学习算法原理数学推导

基于真实数据集结合Python工具包进行项目实战

数据分析与预处理方法及Pandas实战

科学计算库-numpy实战方法

可视化展示策略与Matlotpltolib实战

人工智能学习路线图

K近邻算法原理与实战方法

线性回归算法原理推导

机器学习的优化策略-梯度下降原理

逻辑回归算法原理与实战方法

样本不均衡数据集解决方案

逻辑回归建模方法

决策树算法原理与应用实例

集成算法思想

随机森林建模方法

集成算法回归任务实战

贝叶斯算法原理

文本分析与分类建模实战

无监督算法原理与可视化展示方法

降维算法原理与应用效果

支持向量原理与实战策略

Xgboost提升算法原理与框架使用

基于实际业务需求进行模型开发

EDA数据集展示与分析

时间序列算法原理与建模实战

Description

课程概述:

使用数据领域最主流语言Python及其分析与建模库作为核心武器。对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题。


课程特色:

1. 通俗易懂,快速入门

对机器学习经典算法结合数学推导进行形象解释,实例演示。

2. Python主导,实用高效

使用数据领域最主流语言Python及其分析与建模库作为课程核心工具。

3. 案例为师,实战护航

基于真实数据集,从零开始结合Python工具与机器学习算法完成整个案例实战。

4. 持续更新,一劳永逸

Python数据分析与机器学习课程会支持更新下去,逐步加入更多算法与案例。


 

Content

人工智能入门指南

AI时代首选Python
Python该怎么学
人工智能的核心-机器学习
机器学习如何开始
算法推导与案例应用

科学计算库-numpy

数据代码下载(谷歌网盘)
Numpy概述
Array数组
数组结构
数组类型
数值计算
排序操作
数组形状操作
数组生成函数
常用生成函数
四则运算
随机模块
文件读写
数组保存

数据分析处理库-Pandas

Pandas概述
基本操作
索引方法
groupby操作
数值运算
对象操作
对象操作函数
merge操作
显示设置
数据透视表
时间操作
时间序列操作
常用操作
常用操作函数
group操作延伸
字符串操作
索引进阶
Pandas绘图技巧
大数据处理技巧

可视化库-Matplotlib

Matplotlib概述
子图与标注
风格设置
条形图
条形图细节
条形图外观
盒图绘制
盒图细节
绘图细节设置
绘图细节设置2
直方图与散点图
3D图绘制
PIE图
子图布局
结合Pandas与Skleran

机器学习入门算法实战-K近邻

K近邻算法概述
模型的评估
数据预处理
sklean库介绍
多变量KNN模型

线性回归算法

线性回归算法概述
误差项分析
似然函数求解
目标函数推导
线性回归求解

梯度下降与逻辑回归算法

梯度下降原理
梯度下降方法对比
学习率对结果的影响
逻辑回归算法原理推导
逻辑回归求解

项目实战:信用卡欺诈检测

数据与任务概述
样本不均衡解决方案
下采样策略
交叉验证
模型评估方法
正则化惩罚
逻辑回归模型
混淆矩阵
逻辑回归阈值对结果的影响
SMOTE样本生成策略

决策树算法

决策树原理概述
衡量标准-熵
决策树构造实例
信息增益率
决策树剪枝策略

随机森林与集成算法

随机森林算法原理
特征重要性衡量
提升模型
堆叠模型

项目实战-基于随机森林的气温预测

随机森林回归任务
数据还是多点好
速度与精度的权衡
调参策略

贝叶斯算法

贝叶斯算法概述
贝叶斯实例推导
拼写纠错实例
垃圾邮件过滤实例
打造拼写纠错器

项目实战-基于贝叶斯的新闻分类任务

文本分析与关键词提取
相似度计算
新闻数据与任务简介
TF-IDF关键词提取
LDA建模
基于贝叶斯算法进行建模实战

无监督聚类-Kmeans算法

Kmeans算法概述
Kmeans工作流程
Kmeans建模可视化展示

无监督聚类-DBSCAN算法

DBSCAN聚类算法
DBSCAN工作流程
DBSCAN可视化展示
多种聚类算法概述
聚类案例实战

降维算法-PCA主成分分析

PCA基本概念
方差与协方差
PCA结果推导
PCA降维实例

降维算法-线性判别分析

线性判别分析要解决的问题
优化目标
线性判别分析求解
实现LDA算法
得出降维结果

支持向量机SVM

支持向量机要解决的问题
距离的定义
要优化的目标
目标函数定义
拉格朗日乘子法
SVM求解
支持向量的作用
软间隔问题
核函数效果
sklearn求解支持向量机
SVM参数选择

Xgboost提升算法

算法概述
模型构造
建模衡量标准

项目实战-Xgboost调参实战

Xgboost安装
保险索赔任务概述
Xgboost参数定义
基础模型定义
树结构对结果的影响
学习率与采样对结果的影响

探索性数据分析-赛事数据集

EDA简介
数据背景介绍
数据读取与预处理
数据切分
缺失值可视化
特征可视化
多特征之间的关系
报表可视化分析
红牌和肤色的关系

时间序列ARIMA模型

数据平稳性与差分法
ARIMA模型
相关函数评估方法
建立ARIMA模型
参数选择

时间序列实战

Pandas生成时间序列
Pandas数据重采样
Pandas滑动窗口
股票预测案例
使用tsfresh库进行分类任务
维基百科词条EDA

Reviews

Xueting
May 13, 2020
There are 2 really big issues for this course: (1) The Resources of this course can't be opened. I messaged the owner of the course for this issue, he asked me where I learn the course, I told him Udemy then he never responded me even though I tried to followed up 2 more times. (Personal feeling is the owner is very arrogant) Without the material such as the dataset, you can't really practice on your own. (2) Many mathematical explanations for the ML model is not clear. There are several instances the formula is not consistent.

Charts

Price

Python数据分析与机器学习实战 - Price chart

Rating

Python数据分析与机器学习实战 - Ratings chart

Enrollment distribution

Python数据分析与机器学习实战 - Distribution chart
1605684
udemy ID
3/19/2018
course created date
8/2/2019
course indexed date
Bot
course submited by