Python数据分析系列课程:学习数据挖掘
体系课

Python数据分析系列课程:学习数据挖掘

  • 数据挖掘与分析

全面掌握数据挖掘的关键数据模型,通过多项训练,提升数据建模能力

¥199.9
本课程包括
  • 11小时24分钟的视频随时观看
  • 课程包含 5 道测试题
  • 可在APP随时观看
  • 结业证书
你将收获
  • 掌握Python机器学习与数据挖掘相关技术
  • 提升专业的数据预处理
  • 学会特征的筛选与信息浓缩
  • 掌握多种模型的训练、集成与参数优化

数千家企业正在使用三节课企业版学习

无限制学习5000+门课程,200+精选学习专题

免费申请体验>
课程介绍

本课程以CRISP-DM为理论指导,系统介绍了sklearn在数据挖掘/机器学习各个环节的功能实现,从数据挖掘实战的角度出发详细介绍如何在sklearn中完成数据预处理、数据降维、数据建模、模型评估等各种操作,并突出特征选择、模型调参,模型集成等在数据挖掘实战环境中的重要课题。

课程弱化了各种统计模型的基本原理,强化其具体操作及衍生模型 。学习完本课程后,学员将能够独立使用sklearn完成数据挖掘或机器学习实际项目。

适合人群
  • 转行大数据处理的小伙伴
  • 想要深入学习数据挖掘的同学
  • 适合企业中高级数据分析师提升数据挖掘硬技能
  • 适合Python数据分析师掌握数据挖掘能力
讲师介绍
博士,数据分析与挖掘专著的作者
擅长领域:
  • 数据挖掘与分析
张文彤老师拥有20+年数据分析/统计软件商业培训经验,精通业内广泛使用的SAS、SPSS、Modeler、R、Tableau、Python等数据分析/挖掘工具,曾作为SPSS官方培训师,从2001年起一手协助SPSS中国建立其培训体系 。
课程大纲
共0节 时长0分钟 全部收起
第1章 python机器学习与数据挖掘概述
共4节 | 48分钟
  • 1-1 如何用python做机器学习或数据挖掘?
    10分钟
  • 1-2 课程内容介绍
    9分钟
  • 1-3 使用sklearn的样本数据集
    10分钟
  • 1-4 sklearn基本操作入门
    19分钟
第2章 数据的预处理
共6节 | 55分钟
  • 2-1 连续变量的标准化
    18分钟
  • 2-2 考虑异常分布的标准化
    10分钟
  • 2-3 分类变量的预处理
    14分钟
  • 2-4 缺失值的填充
    5分钟
  • 2-5 生成多项式特征
    5分钟
  • 2-6 自定义转换器
    3分钟
第3章 特征选择与信息浓缩
共5节 | 41分钟
  • 3-1 特征筛选概述
    8分钟
  • 3-2 基于简单统计特征进行筛选
    8分钟
  • 3-3 基于统计误差进行筛选
    6分钟
  • 3-4 基于建模结果进行筛选
    5分钟
  • 3-5 数据降维与信息浓缩
    14分钟
第4章 回归类模型的训练
共10节 | 1小时48分钟
  • 4-1 回归类模型概述
    21分钟
  • 4-2 回归类模型的种类
    11分钟
  • 4-3 线性回归的sklearn实现
    6分钟
  • 4-4 多项式回归
    5分钟
  • 4-5 岭回归的基本原理
    8分钟
  • 4-6 岭回归的实现
    14分钟
  • 4-7 LASSO回归与弹性网络
    14分钟
  • 4-8 最小角回归
    13分钟
  • 4-9 梯度下降法的基本原理
    10分钟
  • 4-10 随机梯度下降回归
    6分钟
第5章 类别预测模型的训练
共9节 | 1小时47分钟
  • 5-1 类别预测模型概述
    10分钟
  • 5-2 类别预测模型的实现原理
    15分钟
  • 5-3 类别预测模型的种类
    10分钟
  • 5-4 logistic回归
    13分钟
  • 5-5 神经网络的基本原理
    16分钟
  • 5-6 神经网络的实现
    12分钟
  • 5-7 树模型的基本原理
    15分钟
  • 5-8 树模型的实现
    12分钟
  • 5-9 随机梯度下降分类
    4分钟
第6章 聚类模型的训练
共5节 | 1小时9分钟
  • 6-1 聚类分析概述
    15分钟
  • 6-2 聚类分析的种类
    10分钟
  • 6-3 K均值聚类
    14分钟
  • 6-4 birch聚类
    16分钟
  • 6-5 DBSCAN聚类
    14分钟
第7章 评估模型效果
共8节 | 1小时12分钟
  • 7-1 类别预测模型的评价
    11分钟
  • 7-2 分类模型评价:混淆矩阵
    7分钟
  • 7-3 分类模型评价:准确率与召回率
    12分钟
  • 7-4 分类模型评价:结果的汇总
    5分钟
  • 7-5 分类模型评价:ROC曲线
    5分钟
  • 7-6 回归模型的评价
    7分钟
  • 7-7 聚类模型的评价
    18分钟
  • 7-8 将模型结果与随即预测结果相比较
    8分钟
第8章 数据的拆分
共4节 | 42分钟
  • 8-1 数据拆分方法概述
    17分钟
  • 8-2 二分法的sklearn实现
    6分钟
  • 8-3 交叉验证的sklearn的实现1
    11分钟
  • 8-4 交叉验证的sklearn实现2
    8分钟
第9章 模型参数优化
共5节 | 52分钟
  • 9-1 如何改进数据挖掘模型的效果
    13分钟
  • 9-2 参数的网格搜索
    12分钟
  • 9-3 参数的随机搜索
    10分钟
  • 9-4 验证曲线
    6分钟
  • 9-5 学习曲线
    11分钟
第10章 模型集成
共7节 | 1小时29分钟
  • 10-1 用模型集成改进效果的基本思路
    11分钟
  • 10-2 投票分类器
    12分钟
  • 10-3 模型集成的基本原理
    13分钟
  • 10-4 Bagging方法的sklearn实现
    11分钟
  • 10-5 随机森林
    15分钟
  • 10-6 adaboost方法
    12分钟
  • 10-7 GBDT方法
    16分钟
测试题
共5题
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。