人工智能与数据挖掘。 本课程全面覆盖了人工智能与数据挖掘的核心知识点,从机器学习的基础概念到实际应用案例,内容丰富且系统化。 通过详细的章节划分,学员可以深入理解如K近邻算法、线性回归、逻辑回归及决策树等关键算法的原理与实现。 同时,课程结合了numpy、pandas、matplotlib和seaborn等工具的实际操作,帮助学员掌握数据分析与可视化技能。 丰富的实战项目(如Facebook位置预测、波士顿房价预测等)让理论知识得以实践,为学员打下坚实的AI与数据挖掘技术基础。 无论您是初学者还是希望进阶的数据科学爱好者,本课程都将为您提供宝贵的指导与启发。 ├── 01 阶段一 人工智能
├── 02 阶段二 数据挖掘
人工智能与数据挖掘13.95GB
01 阶段一 人工智能9.33GB
01 第一章 机器学习概述V2.1456.64MB
01 机器学习介绍456.64MB
01 01-0前置-机器学习科学计算库内容简介.mp413.83MB
02 01-1讲解-机器学习科学计算库内容简介.mp46.2MB
03 02-1讲解-人工智能概述.mp455.63MB
04 02-2点评-人工智能概述.mp422.46MB
05 03-1讲解-人工智能的发展历程.mp422.3MB
06 04-1讲解-人工智能主要分支.mp422.49MB
07 04-2点评-人工智能主要分支.mp424.87MB
08 05-1讲解-机器学习定义工作流程概述.mp49.47MB
09 05-2点评-机器学习定义工作流程概述.mp434.52MB
10 06-1讲解-机器学习工作流程各步骤解释.mp443.1MB
11 06-2点评-机器学习工作流程各步骤解释.mp412.75MB
12 06-3点评-机器学习工作流程各步骤解释.mp48.04MB
13 07-1讲解-机器学习算法分类介绍.mp431.2MB
14 07-2点评-机器学习算法分类介绍.mp46.31MB
15 08-1讲解-模型评估.mp420.06MB
16 08-2点评-模型评估.mp49.2MB
17 08-3点评-模型评估.mp45.88MB
18 09-1讲解-Azure机器学习平台实验演示1.mp455.5MB
19 10-1讲解-Azure机器学习平台实验演示2.mp425.04MB
20 11-1讲解-深度学习简介.mp418.43MB
21 11-2点评-深度学习简介.mp49.34MB
02 第二章 环境安装和使用V2.1155.99MB
01 环境安装及使用155.99MB
01 12-1讲解-基础环境安装.mp411.98MB
02 13-1讲解-jupyter notebook的基本使用1.mp447.42MB
03 13-2点评-jupyter notebook的基本使用1.mp432.15MB
04 14-1讲解-jupyter notebook的基本使用2.mp443.28MB
05 14-2点评-jupyter notebook的基本使用2.mp45.96MB
06 15-1讲解-matplotlib的基本使用.mp415.19MB
03 第三章 matplotlibV2.1263.71MB
01 matplotlib使用263.71MB
01 01-1讲解-实现基础绘图-某城市温度变换图.mp412.1MB
02 01-2点评-实现基础绘图-某城市温度变换图.mp426.19MB
03 02-1讲解-绘图辅助功能完善-某城市温度变换图.mp453.21MB
04 02-2点评-绘图辅助功能完善-某城市温度变换图.mp414.45MB
05 03-1讲解-在一个坐标系下绘制多个图像.mp425.87MB
06 03-2点评-在一个坐标系下绘制多个图像.mp46.76MB
07 04-1讲解-在多个坐标系下绘制多个图像.mp454.66MB
08 04-2点评-在多个坐标系下绘制多个图像.mp418.76MB
09 05-1讲解-常见图形绘制.mp430.69MB
10 05-2点评-常见图形绘制.mp421.02MB
04 第四章 numpyV2.1408.49MB
01 numpy使用408.49MB
01 06-1讲解-numpy介绍.mp426.39MB
02 06-2点评-numpy介绍.mp47.72MB
03 07-1讲解-ndarray介绍.mp49MB
04 07-2点评-ndarray介绍.mp416.13MB
05 08-1讲解-创建0,1数组,固定范围数组.mp424.14MB
06 08-2点评-创建0,1数组,固定范围数组.mp416.07MB
07 09-1讲解-创建随机数组.mp438.14MB
08 09-2点评-创建随机数组.mp414.89MB
09 10-1讲解-数组的基本操作.mp437.77MB
10 10-2点评-数组的基本操作.mp413.46MB
11 10-3点评-前面总结.mp413.96MB
12 10-4点评-回顾.mp439.68MB
13 11-1讲解-ndarray的运算.mp442.83MB
14 12-1讲解-数组间运算.mp424.13MB
15 11-2点评-ndarray的运算.mp411.91MB
16 12-2点评-数组间运算.mp414.18MB
17 13-1讲解-矩阵复习.mp427.99MB
18 13-2点评-矩阵复习.mp419.24MB
19 13-3点评-矩阵复习.mp410.86MB
05 第五章 pandasV2.11.02GB
01 pandas数据结构149.57MB
01 14-1讲解-pandas介绍.mp46.43MB
02 14-2点评-pandas介绍.mp44.06MB
03 15-1讲解-pandas数据结构-series.mp419.09MB
04 15-2点评-pandas数据结构-series.mp45.94MB
05 16-1讲解-pandas数据结构-DataFrame1.mp428.5MB
06 16-2点评-pandas数据结构-DataFrame1.mp411.42MB
07 16-3点评-回顾总结.mp422.41MB
08 17-1讲解-pandas数据结构-DataFrame2.mp419.44MB
09 18-1讲解-pandas数据结构-multiindex和panel.mp428.12MB
10 18-2点评-pandas数据结构-multiindex和panel.mp44.15MB
02 pandas基础使用496.26MB
01 01-1讲解-pandas中的索引.mp438.36MB
02 01-2点评-pandas中的索引.mp411.32MB
03 02-1讲解-赋值和排序.mp424.76MB
04 02-2点评-赋值和排序.mp47.09MB
05 03-1讲解-pandas中的算术运算和逻辑运算.mp424.24MB
06 03-2点评-pandas中的算术运算和逻辑运算.mp49.95MB
07 04-1讲解-pandas中的统计函数.mp422.49MB
08 04-2点评-pandas中的统计函数.mp47.92MB
09 05-1讲解-pandas中的累计统计函数和自定义函数.mp425.37MB
10 05-2点评-pandas中的累计统计函数和自定义函数.mp444.86MB
11 06-1讲解-pandas中绘图方式介绍.mp426.45MB
12 07-1讲解-pandas中文件的读取和写入.mp471.48MB
13 07-2点评-pandas中文件的读取和写入.mp416MB
14 07-3点评-pandas中文件的读取和写入.mp471.77MB
15 07-4点评-内容总结.mp494.2MB
03 pandas高级使用270.25MB
01 08-1讲解-缺失值的处理.mp461.25MB
02 08-2点评-缺失值的处理.mp416.2MB
03 09-1讲解-数据离散化.mp433.6MB
04 09-2点评-数据离散化.mp413.13MB
05 10-1讲解-数据表的合并.mp421.71MB
06 10-2点评-数据表的合并.mp410.75MB
07 11-1讲解-交叉表和透视表介绍.mp438.17MB
08 11-2点评-交叉表和透视表介绍.mp412.48MB
09 11-3点评-内容回顾.mp411.78MB
10 12-1讲解-分组聚合介绍.mp418.32MB
11 12-2点评-分组聚合介绍.mp49.83MB
12 13-1讲解-星巴克案例实现.mp419.61MB
13 13-2点评-星巴克案例实现.mp43.43MB
04 电影案例分析130.06MB
01 14-0前置-电影案例分析1.mp44.83MB
02 14-1讲解-电影案例分析1.mp432.83MB
03 14-2点评-电影案例分析1.mp412.77MB
04 15-1讲解-电影案例分析.mp448.8MB
05 15-2点评-电影案例分析.mp420.62MB
06 15-3点评-电影案例分析.mp410.22MB
06 第六章 seabornV2.1853.95MB
01 绘制统计图79.95MB
01 01-1讲解-绘制单变量分布.mp421.65MB
02 01-2点评-绘制单变量分布.mp47.3MB
03 02-1讲解-绘制双变量分布图形.mp441.63MB
04 02-2点评-绘制双变量分布图形.mp49.37MB
02 分类数据绘图173.44MB
01 03-1讲解-类别散点图的绘制.mp417.54MB
02 03-2点评-类别散点图的绘制.mp431.53MB
03 03-3点评-内容回顾.mp465.05MB
04 04-1讲解-类别内的数据分布和统计估计.mp439.4MB
05 04-2点评-类别内的数据分布和统计估计.mp419.91MB
03 NBA案例242.44MB
01 05-1讲解-NBA数据获取和相关性基本分析.mp44.83MB
02 05-2点评-NBA数据获取和相关性基本分析.mp414.27MB
03 06-1讲解-对数据进行分析-seaborn.mp455.31MB
04 06-2点评-对数据进行分析-seaborn.mp416.28MB
05 07-1讲解-衍生变量的可视化实践.mp445.34MB
06 07-2点评-衍生变量的可视化实践.mp49.08MB
07 08-1讲解-球队数据分析.mp487.16MB
08 08-2点评-球队数据分析.mp410.16MB
04 北京租房数据统计分析358.13MB
01 09-0前置-北京市租房数据获取和重复值与空值处理.mp431.14MB
02 09-1讲解-北京市租房数据获取和重复值与空值处理.mp429.06MB
03 09-2点评-北京市租房数据获取和重复值与空值处理.mp412.87MB
04 10-1讲解-数据类型转换(面积,户型).mp430.6MB
05 10-2点评-数据类型转换(面积,户型).mp46.86MB
06 11-1讲解-房源数量和位置分布分析.mp420.14MB
07 11-2点评-房源数量和位置分布分析.mp44.41MB
08 12-1讲解-户型数量基本分析.mp438.49MB
09 12-2点评-户型数量基本分析.mp419.37MB
10 12-3点评-户型数量基本分析.mp47.92MB
11 13-1讲解-平均租金基本分析.mp453.57MB
12 13-2点评-平均租金基本分析.mp425.19MB
13 14-1讲解-面积区间分析.mp48.61MB
14 14-2点评-面积区间分析.mp46.22MB
15 14-3点评-内容总结.mp463.69MB
07 第七章 K近邻算法V2.1997.82MB
01 k近邻算法介绍166.51MB
01 01-0前置-K-近邻算法简介.mp48.46MB
02 01-1讲解-K-近邻算法简介.mp431.54MB
03 01-2点评-K-近邻算法简介.mp48.2MB
04 02-1讲解-K近邻算法api初步使用.mp421.16MB
05 02-2点评-K近邻算法api初步使用.mp419.07MB
06 03-1讲解-机器学习中距离度量介绍.mp435.21MB
07 03-2点评-机器学习中距离度量介绍.mp416.36MB
08 04-1讲解-K值的选择介绍.mp413.99MB
09 04-2点评-K值的选择介绍.mp412.54MB
02 kd树134.91MB
01 05-1讲解-kd树和kd树的构造过程.mp427.69MB
02 05-2点评-kd树和kd树的构造过程.mp415.22MB
03 06-1讲解-kd树案例实现.mp441.83MB
04 06-2点评-kd树案例实现.mp418.38MB
05 06-3点评-内容回顾.mp411.95MB
06 06-4点评-kd树案例实现.mp419.84MB
03 数据集处理132.75MB
01 07-1讲解-数据集获取和属性介绍.mp450.71MB
02 07-2点评-数据集获取和属性介绍.mp421.16MB
03 08-1讲解-数据可视化介绍.mp418.62MB
04 08-2讲解-数据可视化介绍.mp47.3MB
05 09-1讲解-数据集的划分.mp425.96MB
06 09-2点评-数据集的划分.mp49MB
04 特征工程88.91MB
01 10-1讲解-特征预处理简介.mp410.77MB
02 10-2点评-特征预处理简介.mp43.43MB
03 11-1讲解-归一化和标准化介绍.mp443.38MB
04 11-2点评-归一化和标准化介绍.mp427.61MB
05 11-3点评-归一化和标准化介绍.mp43.73MB
05 KNN总结134.37MB
01 12-1讲解-鸢尾花种类预测.mp440.15MB
02 12-2点评-鸢尾花种类预测.mp49.35MB
03 12-3点评-内容总结.mp413.16MB
04 12-4点评-内容回顾.mp457.41MB
05 13-1讲解-KNN算法总结.mp49.53MB
06 13-2点评-KNN算法总结.mp44.77MB
06 交叉验证, 网格搜索63.19MB
01 14-1讲解-交叉验证、网格搜索概念介绍.mp418.35MB
02 14-2点评-交叉验证、网格搜索概念介绍.mp411.99MB
03 15-1讲解-交叉验证、网格搜索案例实现.mp424.25MB
04 15-2点评-交叉验证、网格搜索案例实现.mp48.61MB
07 案例 Facebook位置预测277.18MB
01 01-1讲解-案例-Facebook位置预测流程分析.mp421.89MB
02 01-2点评-案例-Facebook位置预测流程分析.mp413.11MB
03 02-1讲解-案例-Facebook位置预测代码实现1.mp456.53MB
04 02-2点评-案例-Facebook位置预测代码实现1.mp433.29MB
05 03-1讲解-案例-Facebook位置预测代码实现2.mp442MB
06 03-3点评-案例-Facebook位置预测代码实现2.mp48.46MB
07 04-1讲解-补充-数据分割和留出法.mp426.49MB
08 04-2点评-补充-数据分割和留出法.mp414.03MB
09 05-1讲解-补充-交叉验证法和自助法.mp443.45MB
10 05-2点评-补充-交叉验证法和自助法.mp417.93MB
08 第八章 线性回归V2.1500.23MB
01 回归介绍59.7MB
01 06-1讲解-线性回归简介.mp423.82MB
02 06-2点评-线性回归简介.mp44.59MB
03 07-1讲解-初始线性回归api.mp413.8MB
04 08-1讲解-数学:求导.mp411.99MB
05 08-2点评-数学:求导.mp45.5MB
02 损失优化111.99MB
01 09-1讲解-线性回归中损失函数的介绍.mp411.44MB
02 09-2点评-线性回归中损失函数的介绍.mp49.31MB
03 10-1讲解-使用正规方程对损失函数进行优化.mp423.42MB
04 10-2点评-使用正规方程对损失函数进行优化.mp420.67MB
05 11-1讲解-使用梯度下降法对损失函数进行优化.mp431.35MB
06 11-2点评-使用梯度下降法对损失函数进行优化.mp415.81MB
03 回归相关知识6.68MB
05 13-1讲解-线性回归api再介绍.mp46.68MB
03 回归相关知识321.86MB
01 12-1讲解-梯度下降法方法介绍.mp452.14MB
02 12-2点评-梯度下降法方法介绍.mp422.88MB
03 12-3点评-内容回顾.mp447.57MB
04 13-0前置-线性回归api再介绍.mp44.86MB
06 13-2点评-线性回归api再介绍.mp48.79MB
07 14-1讲解-波士顿房价预测案例.mp455.08MB
08 14-2点评-波士顿房价预测案例.mp47.77MB
09 15-1讲解-欠拟合和过拟合的介绍.mp423.99MB
10 15-2点评-欠拟合和过拟合的介绍.mp416.48MB
11 16-1讲解-正则化线性模型.mp413.51MB
12 16-2点评-正则化线性模型.mp411.99MB
13 17-1讲解-岭回归介绍.mp425MB
14 17-2点评-岭回归介绍.mp46.54MB
15 18-1讲解-模型保存和加载.mp421.74MB
16 18-2点评-模型保存和加载.mp43.52MB
09 第九章 逻辑回归V2.1328.26MB
01 逻辑回归328.26MB
01 01-1讲解-逻辑回归介绍.mp431.32MB
02 01-2点评-逻辑回归介绍.mp419.91MB
03 02-1讲解-逻辑回归api介绍.mp44.61MB
04 02-2点评-内容回顾.mp419.03MB
05 03-1讲解-肿瘤预测案例.mp443.08MB
06 03-2点评-肿瘤预测案例.mp416.55MB
07 04-1讲解-分类评估方法介绍.mp452.11MB
08 04-2点评-分类评估方法介绍.mp417.71MB
09 05-1讲解-roc曲线绘制过程.mp426.54MB
10 05-2点评-roc曲线绘制过程.mp416.16MB
11 05-3点评-roc曲线绘制过程.mp44.39MB
12 06-1讲解-补充-类别不平衡数据介绍.mp423.93MB
13 06-2点评-补充-类别不平衡数据介绍.mp46.35MB
14 07-1讲解-补充-过采样和欠采样介绍.mp432.28MB
15 07-2点评-补充-过采样和欠采样介绍.mp414.27MB
10 第十章 决策树V2.1954.51MB
01 信息增益448.75MB
01 08-1讲解-决策树算法简介.mp45.81MB
02 09-1讲解-熵的介绍.mp419.69MB
03 09-2点评-熵的介绍.mp487.16MB
04 09-3点评-内容回顾.mp451.75MB
05 09-3点评-熵的介绍.mp410.08MB
06 10-0前置-信息增益的介绍.mp48.86MB
07 10-1讲解-信息增益的介绍.mp430.28MB
08 10-2点评-信息增益的介绍.mp431.45MB
09 11-1讲解-信息增益率的介绍.mp432.23MB
10 11-2点评-信息增益率的介绍.mp425.83MB
11 12-1讲解-基尼指数的介绍.mp427.11MB
12 12-2点评-基尼指数的介绍.mp419.45MB
13 13-1讲解-决策树划分原理小结.mp416.1MB
14 13-2点评-决策树划分原理小结.mp47.1MB
15 14-1讲解-cart剪枝介绍.mp444.32MB
16 14-2点评-cart剪枝介绍.mp431.54MB
02 特征提取226.4MB
01 15-1讲解-字典特征提取.mp434.26MB
02 15-2点评-字典特征提取.mp411.82MB
03 16-1讲解-英文文本特征提取.mp424.98MB
04 16-2点评-英文文本特征提取.mp49.33MB
05 17-1讲解-中文文本特征提取.mp454.59MB
06 17-2点评-中文文本特征提取.mp443.08MB
07 18-1讲解-tfidf内容讲解.mp424.26MB
08 18-2点评-tfidf内容讲解.mp410.39MB
09 18-3点评-tfidf内容讲解.mp413.69MB
03 案例泰坦生存预测145.32MB
01 01-1讲解-决策树算法api介绍.mp44.89MB
02 01-2点评-决策树算法api介绍.mp416.48MB
03 02-1讲解-泰坦尼克号乘客生存预测.mp466.07MB
04 02-2点评-泰坦尼克号乘客生存预测.mp413.59MB
05 03-1讲解-树木可视化操作.mp431.31MB
06 03-2点评-树木可视化操作.mp412.99MB
04 回归决策树134.04MB
01 04-1讲解-回归决策树介绍.mp471.48MB
02 04-2点评-回归决策树介绍.mp428.56MB
03 05-1讲解-回归决策树和线性回归对比.mp430.81MB
04 05-2点评-回归决策树和线性回归对比.mp43.19MB
11 第十一章 集成学习V2.1592.01MB
01 集成介绍122.5MB
01 06-1讲解-集成学习基本介绍.mp48.47MB
02 07-1讲解-bagging和随机森林.mp462.34MB
03 07-2点评-bagging和随机森林.mp413.07MB
04 07-3点评-bagging和随机森林.mp48.21MB
05 07-4点评-内容回顾.mp430.41MB
02 随机森林案例295.99MB
01 08-1讲解-otto案例介绍以及数据获取.mp431MB
02 08-2点评-otto案例介绍以及数据获取.mp410.84MB
03 09-1讲解-otto数据基本处理.mp429.69MB
04 09-2点评-otto数据基本处理.mp419.47MB
05 10-1讲解-otto数据模型基本训练.mp435.45MB
06 10-2点评-otto数据模型基本训练.mp46.52MB
07 11-1讲解-模型调优和确定最优模型.mp482.7MB
08 11-2点评-模型调优和确定最优模型.mp49.55MB
09 11-3点评-模型调优和确定最优模型.mp412.98MB
10 12-1讲解-生成提交数据.mp440.56MB
11 12-2点评-生成提交数据.mp417.24MB
03 集成学习173.52MB
01 13-1讲解-boosting介绍.mp436.79MB
02 13-2点评-boosting介绍.mp473.84MB
03 14-1讲解-GBDT的介绍.mp418.55MB
04 14-2点评-GBDT的介绍.mp444.35MB
12 第十二章 聚类算法V2.1317.37MB
01 聚类算法317.37MB
01 01-1讲解-聚类算法介绍.mp47.06MB
02 02-1讲解-聚类算法api初步实现.mp423.82MB
03 02-2点评-聚类算法api初步实现.mp420.67MB
04 03-1讲解-聚类算法实现流程.mp415.7MB
05 03-2点评-聚类算法实现流程.mp411.49MB
06 04-1讲解-模型评估.mp431.57MB
07 04-2点评-模型评估.mp420.65MB
08 05-1讲解-算法优化介绍.mp434.43MB
09 05-2点评-算法优化介绍.mp426.22MB
10 06-1讲解-特征降维内容介绍.mp462.22MB
11 06-2点评-特征降维内容介绍.mp47.58MB
12 07-1讲解-pca降维介绍.mp44.59MB
13 08-1讲解-用户对物品类别的喜好细分案例.mp441.11MB
14 08-2点评-用户对物品类别的喜好细分案例.mp410.28MB
13 第十三章 朴素贝叶斯V2.1311.81MB
01 朴素贝叶斯311.81MB
01 09-1讲解-初始朴素贝叶斯.mp44.41MB
02 09-2点评-初始朴素贝叶斯.mp44.86MB
03 10-1讲解-概率内容复习.mp444.9MB
04 10-2点评-概率内容复习.mp48.48MB
05 11-1讲解-朴素贝叶斯计算案例.mp425.85MB
06 11-2点评-朴素贝叶斯计算案例.mp412.08MB
07 12-1讲解-朴素贝叶斯案例实现1.mp424.54MB
08 13-1讲解-朴素贝叶斯案例实现2.mp481.69MB
09 13-2点评-朴素贝叶斯案例实现2.mp47.98MB
10 13-3点评-内容回顾.mp413.01MB
11 13-4点评-内容回顾.mp446.75MB
12 14-1讲解-朴素贝叶斯内容总结.mp413.25MB
13 14-2点评-朴素贝叶斯内容总结.mp423.99MB
14 第十四章 SVM算法V2.1483.81MB
01 SVM算法483.81MB
01 01-1讲解-SVM基本介绍.mp428.56MB
02 01-2点评-SVM基本介绍.mp418.2MB
03 02-1讲解-SVM算法api初步使用.mp45.69MB
04 03-1讲解-SVM算法推导的目标函数.mp427.97MB
05 03-2点评-SVM算法推导的目标函数.mp419.07MB
06 04-1讲解-SVM目标函数推导过程及举例.mp442.32MB
07 04-2点评-SVM目标函数推导过程及举例.mp447.83MB
08 04-3点评-内容回顾.mp442.43MB
09 05-1讲解-SVM损失函数.mp414.7MB
10 05-2点评-SVM损失函数.mp49.12MB
11 06-1讲解-SVM的核方法介绍.mp434.17MB
12 06-2点评-SVM的核方法介绍.mp48.83MB
13 07-1讲解-SVM回归介绍.mp42.35MB
14 07-2点评-SVM回归介绍.mp46.35MB
15 08-1讲解-SVM算法api再介绍.mp417.27MB
16 08-2点评-SVM算法api再介绍.mp410.63MB
17 09-1讲解-数字识别器案例初步介绍.mp417.91MB
18 09-2点评-数字识别器案例初步介绍.mp48.31MB
19 10-1讲解-数字识别器-获取数据.mp427.29MB
20 10-2点评-数字识别器-获取数据.mp45.98MB
21 11-1讲解-数字识别器-数据基本处理和模型训练.mp460.61MB
22 11-2点评-数字识别器-数据基本处理和模型训练.mp410.05MB
23 12-1讲解-SVM总结.mp44.12MB
24 12-2点评-SVM总结.mp46.07MB
25 12-3点评-内容总结.mp47.98MB
15 第十五章 EM算法V2.1157.47MB
01 EM算法157.47MB
01 01-1讲解-初识EM算法.mp45.73MB
02 01-2点评-初识EM算法.mp45.91MB
03 02-1讲解-EM算法介绍.mp422.61MB
04 02-2点评-EM算法介绍.mp47.37MB
05 02-3点评-内容回顾.mp444.84MB
06 03-0前置-EM算法实例.mp49.45MB
07 03-1讲解-EM算法实例.mp442.03MB
08 03-2点评-EM算法实例.mp419.54MB
16 第十六章 HMM算法V2.1420.11MB
01 HMM算法420.11MB
01 04-1讲解-马尔科夫链的介绍.mp412.12MB
02 04-2点评-马尔科夫链的介绍.mp48.24MB
03 05-1讲解-HMM模型的简单案例.mp437.36MB
04 05-2点评-HMM模型的简单案例.mp416.85MB
05 06-1讲解-HMM模型三种经典问题举例求解.mp454.74MB
06 06-2点评-HMM模型三种经典问题举例求解.mp420.99MB
07 07-1讲解-HMM模型基础.mp445.89MB
08 07-2点评-HMM模型基础.mp417.02MB
09 08-1讲解-前向后向算法评估观察序列概率.mp410.08MB
10 08-2点评-前向后向算法评估观察序列概率.mp46.87MB
11 08-3点评-内容回顾.mp423.43MB
12 08-4点评-前向后向算法评估观察序列概率.mp433.56MB
13 09-1讲解-维特比算法解码隐藏状态序列.mp443.51MB
14 09-2点评-维特比算法解码隐藏状态序列.mp419.59MB
15 10-1讲解-鲍姆-韦尔奇算法简介.mp44.75MB
16 11-1讲解-HMM模型api介绍及案例代码实现.mp447.76MB
17 11-2点评-HMM模型api介绍及案例代码实现.mp417.37MB
17 第十七章 集成学习进阶V2.11.28GB
01 XGBoost算法347.24MB
01 01-1讲解-xgboost最优模型构建方法.mp410.26MB
02 01-2点评-xgboost最优模型构建方法.mp47.53MB
03 02-1讲解-目标函数确定和树的复杂度介绍.mp424.4MB
04 02-2点评-目标函数确定和树的复杂度介绍.mp418.21MB
05 03-1讲解-XGBoost目标函数的推导.mp432.23MB
06 03-2点评-回顾.mp468.62MB
07 03-2点评-XGBoost目标函数的推导.mp435.35MB
08 04-1讲解-XGBoost的回归树构建方法.mp417.14MB
09 04-2点评-XGBoost的回归树构建方法.mp410.39MB
10 05-1讲解-XGBoost和GBDT的区别.mp431.6MB
11 05-2点评-XGBoost和GBDT的区别.mp46.52MB
12 06-1讲解-xgboost算法api与参数介绍.mp428.11MB
13 06-2点评-xgboost算法api与参数介绍.mp430.85MB
14 07-1讲解-xgboost简单案例介绍.mp426.05MB
02 otto案例161.82MB
01 08-1讲解-otto案例xgboost实现-数据基本处理.mp469.49MB
02 08-2点评-otto案例xgboost实现-数据基本处理.mp413.78MB
03 08-3点评-otto案例xgboost实现-数据基本处理.mp43.28MB
04 09-1讲解-otto案例xgboost实现-模型基本训练.mp417.48MB
05 10-1讲解-otto案例xgboost实现-模型调优.mp416.55MB
06 10-2点评-otto案例xgboost实现-模型调优.mp45.94MB
07 10-3点评-内容回顾.mp47.53MB
08 11-1讲解-otto案例xgboost实现-最优模型运行.mp427.77MB
03 lightGBM算法235.99MB
01 01-1讲解-lightGBM简单介绍.mp427.61MB
02 01-2点评-lightGBM简单介绍.mp49.64MB
03 02-1讲解-lightGBM算法原理介绍.mp432.15MB
04 02-2点评-lightGBM算法原理介绍.mp434.9MB
05 03-1讲解-lightGBM算法api参数介绍.mp419.17MB
06 03-2点评-lightGBM算法api参数介绍.mp427.61MB
07 04-1讲解-lightGBM算法简单案例介绍.mp448.19MB
08 04-2点评-lightGBM算法简单案例介绍.mp48.05MB
09 05-1讲解-pubg案例简介.mp422.89MB
10 05-2点评-pubg案例简介.mp45.79MB
04 绝地求生案例561.22MB
01 06-1讲解-获取pubg数据.mp431.54MB
02 06-2点评-获取pubg数据.mp44.06MB
03 07-1讲解-数据缺失值处理和查看每场比赛人数.mp444.86MB
04 07-2点评-数据缺失值处理和查看每场比赛人数.mp45.46MB
05 07-3点评-内容回顾.mp459.06MB
06 08-1讲解-规范化输出部分数据和部分变量合成.mp434.52MB
07 09-1讲解-异常值处理1.mp463.2MB
08 09-2点评-异常值处理1.mp412.92MB
09 10-1讲解-异常值值处理2.mp449.77MB
10 10-2点评-异常值值处理2.mp47.73MB
11 11-1讲解-类别型数据处理.mp441.83MB
12 11-2点评-类别型数据处理.mp49.68MB
13 12-1讲解-数据截取、确定特征值和目标值、分割数据集.mp417.74MB
14 13-1讲解-使用RF进行模型训练.mp457.58MB
15 13-2点评-使用RF进行模型训练.mp410.6MB
16 14-1讲解-lightGBM对模型调优1.mp445.77MB
17 14-2点评-lightGBM对模型调优1.mp47.15MB
18 15-1讲解-lightGBM对模型调优2.mp451.14MB
19 15-2点评-lightGBM对模型调优2.mp46.6MB
02 阶段二 数据挖掘4.62GB
01 第一章 SparkMllib数据挖掘+SparkGraphX4.62GB
01 1-SparkMllib机器学习理论基础详解425.15MB
01 01-机器学习和大数据的区别(一).mp427.46MB
02 02-机器学习和大数据的区别和联系(二).mp434.79MB
03 03-机器学习和大数据的区别和联系(三).mp426.25MB
04 04-人工智能和机器学习的区别.mp436.52MB
05 05-数据分析和数据挖掘联系.mp415.29MB
06 06-什么是机器学习问题.mp429.83MB
07 07-基于规则的学习和基于模型的学习方式.mp424.42MB
08 08-机器学习数据集概述1.mp419.66MB
09 09-机器学习数据集概述2.mp425.69MB
10 10-机器学习数据集概述3.mp427.34MB
11 11-机器学习问题分类.mp457.62MB
12 12-机器学习三要素强化.mp419.07MB
13 13-构建机器学习模型的流程.mp414.93MB
14 14-模型选择.mp426.87MB
15 15-交叉验证及经验和结构风险.mp439.4MB
02 2-SparkMllib库特征工程基础与实战(一)739.54MB
01 01-SparkMllib的功能.mp433.11MB
02 2-SparkMllib的版本.mp417.59MB
03 3-SparkMllib架构.mp420.9MB
04 4-环境搭建及RDD、DF、DS的转换实践.mp462.06MB
05 5-如何利用SparkMllib构建机器学习推荐架构.mp431.6MB
06 6.SparkMllib算法分类及应用场景.mp418.4MB
07 7-SparkMllib基础数据类型-localvector.mp445.63MB
08 8-SparkMllib基础数据类型-labelpoint.mp420.59MB
09 9.SparkMllib基础数据类型-libsvm数据读取.mp434.81MB
10 10.SparkMllib基础数据类型-localmatrix.mp422.26MB
11 11.SparkMllib基础数据类型-分布式行矩阵和行索引矩阵.mp449.11MB
12 12.SparkMllib基础数据类型-分块矩阵.mp456.24MB
13 13.SparkMllib均值和方差.mp449.91MB
14 14-SparkMllib相关系数.mp446MB
15 15-SparkMllib假设检验的卡方验证.mp453.83MB
16 16-SparkMllib假设检验和随机数的产生.mp465.55MB
17 17-特征提取tf-ifd.mp461.09MB
18 18-特征提取-word2vec实践.mp425.72MB
19 19-特征提取CountVector.mp425.16MB
03 3-SparkMllib库特征工程基础与实战(二)553.47MB
01 20-特征转化的二值化操作.mp44.29MB
02 21-特征转换-PCA操作.mp456.88MB
03 22-特征转换-类别型数据和数值型数据转换.mp419.07MB
04 23-特征转换-OneHot编码方式.mp417.36MB
05 24-特征转换-VectorIndexer转换操作.mp45.94MB
06 25-正则项.mp439.58MB
07 26-数值型数据处理的方法.mp435.19MB
08 27-Bucketizer分箱.mp421.74MB
09 28-ElementWise与SQLTransform实践.mp433.18MB
10 29-特征转换VectorAssemble.mp451.11MB
11 30-特征转换-QuantileDiscretizer.mp418.55MB
12 31-特征选择VectorSlicer.mp425.08MB
13 32-RFormula和卡方验证选择特征方法.mp443.44MB
14 33-卡方验证案例补充.mp445.61MB
15 36-案例实践2-Iris统计初步实践.mp429.24MB
16 37-案例实践2-Iris的rdd相关系数实践.mp415.62MB
17 38-案例实践2-iris的Dataframe数据统计.mp440.68MB
18 39-案例实践2-iris的SParkMllib特征工程实践.mp450.92MB
04 4-SparkMllib决策树算法基础与实战642.65MB
01 1-了解什么是决策树.mp423.43MB
02 2.基于规则建树.mp442.78MB
03 3-信息熵的理解.mp411.91MB
04 4-ID3算法步骤详解.mp419.05MB
05 5-ID3算法举例和C4.5算法改进.mp436.99MB
06 6-决策树的剪枝方式.mp431.73MB
07 7-电商购买数据集ID3算法对比实践.mp418.83MB
08 8-Cart树的回归树原理理解.mp440.6MB
09 9-Cart树算法案例讲解.mp49.47MB
10 10-Cart分类树原理及Gini系数.mp429.3MB
11 11-Cart分类树的案例.mp415.67MB
12 12-SparkMllib实战libsvm数据建模.mp494.66MB
13 13-SparkMl实战libsvm数据全流程讲解实战.mp475.64MB
14 14-SparkMllib相亲数据建模分析.mp453.48MB
15 15-SparkMllib实战iris鸢尾花实战.mp469.19MB
16 16-SparkMl实战Iris特征工程及建模实战1.mp469.91MB
05 5-SparkMllib高级模块与线性回归基础及实战670.39MB
01 1-SparkMllib的pipeline简介.mp416.87MB
02 2-Dataframe组件.mp440.75MB
03 3-Pipeline原理.mp428.14MB
04 4-通过set方法和ParamMap方法赋值超参数的选项.mp443.83MB
05 5-通过pipeline完成案例的代码编写.mp442.27MB
06 6-如何对模型选择与优化.mp412.08MB
07 7-超参数的网格搜索.mp461.95MB
08 8-简单交叉验证及模型选择.mp443.49MB
09 9-简单线性回归.mp430.62MB
10 10-最小二乘法解决简单线性回归原理.mp419.68MB
11 11-多元线性回归简介.mp410.6MB
12 12-最小二乘推导补充(补充).mp433.56MB
13 13-线性回归的变体及各适用场景.mp435.24MB
14 14-SparkMl实战脂肪数据集的案例.mp471.77MB
15 15-SparkMl实战运输时间的预测分析.mp434.03MB
16 16-SparkMllib基于RDD结构实战线性回归实例.mp436.23MB
17 16-SparkMl实战libsvm数据的形式.mp422.4MB
18 17-Sparkml完成房价预测分析实战.mp486.89MB
06 6-SparkMllib聚类算法基础与实战602.87MB
01 1-什么是聚类.mp415.62MB
02 2-关于多种距离的度量简介.mp424.45MB
03 3-聚类算法核心思想.mp425.52MB
04 4-KMeans的举例.mp427.88MB
05 5-Kmens算法性能指标分析.mp420.92MB
06 6-KMeans特点及注意事项.mp421.45MB
07 7-SparkMLIB实战KMEans算法.mp443.28MB
08 8-SparkMLLIB实现药品数据得简单聚类.mp429.78MB
09 9-SparkMl实现基本数据的聚类分析实战.mp427.09MB
10 10-SparkMl和parkSql实现经纬度数据聚类分析实战.mp476.3MB
11 11-k-medoids了解.mp422.66MB
12 12-其他聚类思路-层次聚类方法.mp427.07MB
13 13-基于密度的聚类DBSCAN.mp432.41MB
14 14-GMM模型原理.mp436.95MB
15 15-聚类算法的总结:.mp49.13MB
16 16-SparkMllib实现对于层次聚类的分析.mp429.82MB
17 17-SparkMllib完成对于GMM高斯混合模型实践分析.mp426.45MB
18 18-SparkLDA实现了主题的提取实战.mp470.59MB
19 19-SparkML实现IRis鸢尾花的聚类算法实战.mp435.52MB
07 7-SparkGraphX理论基础与实战639.09MB
01 1-图基本概念以及图计算应用【耗时整理‖免费分享 】.mp418.42MB
02 2-SparkGraphX简介【耗时整理‖免费分享 】.mp417.3MB
03 3-SparkGraphX图算法【耗时整理‖免费分享 】.mp414.53MB
04 4-SparkGraphX抽象是RDPG---弹性分布式属性图.mp49.83MB
05 5-SparkGraphX架构层面及存储方式简介.mp419.79MB
06 6-SparkGraphX定义顶点操作.mp451.14MB
07 7-SparkGraphX构件图及查询的操作.mp450.71MB
08 8-图的基本数据结构.mp436.98MB
09 9-图的类型和图的存储方式简介.mp442.42MB
10 10-构建图的方法原理及源码了解创建过程.mp468.66MB
11 11-构建图的操作代码.mp466.34MB
12 12-社交网络数据的创建部分代码实战.mp457.45MB
13 13-图的基本信息--顶点、边、入度、出度.mp450.66MB
14 14-图的转换操作:mapVertices、mapEdges、mapTriplet.mp44.29MB
15 15-图的结构操作:reverse、subgraph、mask、groupGraph.mp457.59MB
16 16-图的关联操作.mp425.08MB
17 17-图的聚合以及图的操作API总结.mp447.91MB
08 8-SparkGraphX与SparkMllib综合实战460.77MB
01 1-PageRank算法的基本假设和理解.mp414.24MB
02 2-PageRank算法思想.mp439.18MB
03 3-PageRank算法深入.mp422.74MB
04 4-SparkGraphX通过社交网络数据完成重要节点的选择.mp459.35MB
05 5-通过wiki数据达到网页重要性的pagerank度量.mp431.57MB
06 6-通过PageRank算法得到网页排名的重要性.mp433.11MB
07 7-广度优先遍历.mp452.29MB
08 8-SparkGrphX实现最短路径.mp444.76MB
09 9-连通图和强联通图.mp451.14MB
10 10-SparkGraphx实战三角关系网络发现.mp444.86MB
11 11-SVD++原理.mp441.08MB
12 12-SVD++实战推荐算法预测.mp426.45MB