Python数据分析实战:统计模型
体系课

Python数据分析实战:统计模型

  • 数据挖掘与分析

全面掌握统计模型,通过多项训练,提升数据建模能力

¥299.9
本课程包括
  • 19小时13分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
你将收获
  • 学习掌握各种统计/数据挖掘模型
  • 同时可以掌握学习这些模型在sklearn和statsmodels中的实现
  • 提升专业的数据处理能力

数千家企业正在使用三节课企业版学习

无限制学习5000+门课程,200+精选学习专题

免费申请体验>
课程介绍

系统介绍方差分析模型、回归模型、logistic回归等各种经典统计模型,以及树模型、神经网络、支持向量机、最近邻方法等各种现代数据挖掘模型的算法原理,模型优缺点,适用条件及考查方式,并学习这些模型在sklearn和statsmodels中的具体实现方法。

本课程为统计原理与操作并重,在详细阐明各种模型算法特点的基础上,再对这些方法的python实现进行学习。

学习完本课程后,学员将能够独立使用sklearn和statsmodels拟合各种统计模型,满足实际研究工作或数据挖掘项目中的建模需求。

适合人群
  • 转行大数据处理的小伙伴
  • 想要深入学习数据建模的同学
  • 适合企业中高级数据分析师提升硬技能
讲师介绍
博士,数据分析与挖掘专著的作者
擅长领域:
  • 数据挖掘与分析
张文彤老师拥有20+年数据分析/统计软件商业培训经验,精通业内广泛使用的SAS、SPSS、Modeler、R、Tableau、Python等数据分析/挖掘工具,曾作为SPSS官方培训师,从2001年起一手协助SPSS中国建立其培训体系 。
课程大纲
共0节 时长0分钟 全部收起
第1章 统计模型课程概述
共4节 | 48分钟
  • 1-1 课程内容介绍
    14分钟
  • 1-2 statsmodels基本操作入门
    7分钟
  • 1-3 使用sklearn的样本数据集
    8分钟
  • 1-4 sklearn基本操作入门
    19分钟
第2章 方差分析模型
共7节 | 1小时53分钟
  • 2-1 一般线性模型概述
    15分钟
  • 2-2 简单一般线性模型的拟合
    16分钟
  • 2-3 均数两两比较方法的选择
    18分钟
  • 2-4 均数两两比较法的实现
    11分钟
  • 2-5 多因素方差分析模型的基本框架
    22分钟
  • 2-6 多因素方差分析的实现
    12分钟
  • 2-7 模型框架下的自定义检验
    19分钟
第3章 线性回归模型
共9节 | 2小时5分钟
  • 3-1 线性回归模型概述
    16分钟
  • 3-2 线性回归模型的适用条件
    15分钟
  • 3-3 线性回归标准建模步骤
    23分钟
  • 3-4 用statsmodels拟合回归模型
    17分钟
  • 3-5 残差分析
    8分钟
  • 3-6 回归模型的多变量筛选方法
    19分钟
  • 3-7 多变量筛选的具体操作
    8分钟
  • 3-8 最小角回归
    13分钟
  • 3-9 线性回归的sklearn实现
    6分钟
第4章 线性回归衍的生模式
共11节 | 2小时15分钟
  • 4-1 曲线直线化
    9分钟
  • 4-2 多项式回归
    8分钟
  • 4-3 强影响点的识别与处理
    15分钟
  • 4-4 稳健回归
    11分钟
  • 4-5 共线性的识别与处理
    17分钟
  • 4-6 岭回归
    22分钟
  • 4-7 LASSO回归与弹性网络
    14分钟
  • 4-8 方差不齐的识别与处理
    11分钟
  • 4-9 加权最小二乘法
    10分钟
  • 4-10 残差非独立的识别与处理
    8分钟
  • 4-11 自回归模型
    9分钟
第5章 logitsic回归
共7节 | 1小时35分钟
  • 5-1 Logistic回归模型的基本概念
    17分钟
  • 5-2 Logistic回归模型的适用条件
    12分钟
  • 5-3 两分类logit的statsmodels实现
    12分钟
  • 5-4 logistic模型中的检验方法
    13分钟
  • 5-5 哑变量的使用-1
    14分钟
  • 5-6 哑变量的使用-2
    10分钟
  • 5-7 多分类因变量的Logistic回归模型
    17分钟
第6章 决策树模型
共7节 | 1小时34分钟
  • 6-1 树模型的基本概念
    15分钟
  • 6-2 树模型的信息量计算
    9分钟
  • 6-3 树模型的各种算法
    16分钟
  • 6-4 树模型的sklearn实现
    12分钟
  • 6-5 随机森林
    15分钟
  • 6-6 Aboost方法
    12分钟
  • 6-7 GBDT方法介绍
    16分钟
第7章 神经网络
共6节 | 1小时19分钟
  • 7-1 神经网络的基本原理
    16分钟
  • 7-2 神经网络的算法实质
    11分钟
  • 7-3 神经网络的sklearn实现
    12分钟
  • 7-4 RBFN、RNN、LSTM与与CNN网络
    14分钟
  • 7-5 SOM与RBM网络
    7分钟
  • 7-6 神经网络的超参数调整
    19分钟
第8章 支持向量机
共7节 | 1小时22分钟
  • 8-1 SVM的基本原理
    14分钟
  • 8-2 SVM的核函数设定
    18分钟
  • 8-3 SVM的分类操作
    9分钟
  • 8-4 SVM回归
    9分钟
  • 8-5 异常值检测的基本理论
    12分钟
  • 8-6 新奇值发现
    9分钟
  • 8-7 模型参数的优化
    12分钟
第9章 主成分分析与因子分析
共6节 | 1小时29分钟
  • 9-1 主成分分析的基本原理
    17分钟
  • 9-2 主成分分析的statsmodels实现
    14分钟
  • 9-3 主成分分析的sklearn实现
    11分钟
  • 9-4 因子分析的基本原理
    23分钟
  • 9-5 因子分析的statsmodels实现
    12分钟
  • 9-6 因子旋转
    12分钟
第10章 聚类分析
共9节 | 1小时48分钟
  • 10-1 聚类分析概述
    15分钟
  • 10-2 聚类分析的方法分类
    10分钟
  • 10-3 聚类分析的注意事项
    10分钟
  • 10-4 K均值聚类
    14分钟
  • 10-5 均值偏移聚类
    9分钟
  • 10-6 层次聚类
    13分钟
  • 10-7 birch聚类
    16分钟
  • 10-8 DBSCAN聚类
    14分钟
  • 10-9 聚类结果的验证
    7分钟
第11章 最近邻分析
共3节 | 27分钟
  • 11-1 KNN的基本原理
    14分钟
  • 11-2 KNN分类的操作
    6分钟
  • 11-3 KNN回归与无监督KNN
    7分钟
第12章 生存分析
共7节 | 1小时32分钟
  • 12-1 生存分析的基本概念
    16分钟
  • 12-2 生存率的计算与曲线绘制
    18分钟
  • 12-3 生存曲线的比较
    12分钟
  • 12-4 风险函数与风险比
    9分钟
  • 12-5 Cox模型的基本概念
    13分钟
  • 12-6 Cox比例风险模型的实现
    11分钟
  • 12-7 生存分析中的分层变量
    13分钟
第13章 关联分析
共6节 | 1小时6分钟
  • 13-1 关联分析的基本概念
    8分钟
  • 13-2 关联分析的数据格式与结果格式
    15分钟
  • 13-3 Apriori算法的原理与实现
    16分钟
  • 13-4 Apriori算法分析实例
    8分钟
  • 13-5 FP-Growth算法
    12分钟
  • 13-6 关联分析的参数调整与具体应用
    6分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。