Python数据分析系列课程:学习Pandas
体系课

Python数据分析系列课程:学习Pandas

  • 数据采集与处理
  • 数据工具
  • 数据挖掘与分析
  • 数据可视化

从实际案例数据的可视化需求出发,在实战中学习pandas的使用方法

¥199.9
本课程包括
  • 11小时16分钟的视频随时观看
  • 课程包含 5 道测试题
  • 可在APP随时观看
  • 结业证书
你将收获
  • 可以在实战中学习Pandas包的使用,掌握Pandas使用技巧
  • 学员将学习独立使用Pandas包完成数据读入、数据清理、数据准备、图表呈现等工作
  • 为继续学习数据建模和数据挖掘打下坚实基础
  • 了解数据分析实际应用的场景,结合现实需求综合发展方向

数千家企业正在使用三节课企业版学习

无限制学习5000+门课程,200+精选学习专题

免费申请体验>
课程介绍

Pandas包是基于Python平台的数据管理利器,已经成为了Python进行数据分析和挖掘时的数据基础平台和事实上的工业标准,学习其使用方法,是使用Python进行数据分析和数据挖掘的必备条件。

本课程将从中国高校综合排名和北京PM2.5实测数据两个实际案例出发,在实战中学习Pandas包的使用方法。

课程亮点

  1. 实战导向:课程结合大量实际案例,让学员在实战中掌握Pandas的使用技巧。

  2. 系统全面:从基础到高级,涵盖Pandas的各个方面,帮助学员建立完整的知识体系。

  3. 深度解析:对Pandas的核心概念和功能进行深入剖析,帮助学员理解其原理与实现。

  4. 互动性强:课程提供丰富的练习题和实战项目,让学员在互动中巩固所学知识。

学习完本课程后,学员将能够独立使用Pandas包完成数据读入、数据清理、数据准备方面的工作,学习如何使用统计图表工具进行数据信息呈现,为后续进一步进行数据分析建模和数据挖掘打下坚实基础。

适合人群
  • 有一定编程基础的同学,希望了解Python在数据分析的应用
  • 对数据分析及可视化感兴趣的同学
  • 希望成为Python工程师和数据分析师的跨界人才
讲师介绍
博士,数据分析与挖掘专著的作者
擅长领域:
  • 数据挖掘与分析
张文彤老师拥有20+年数据分析/统计软件商业培训经验,精通业内广泛使用的SAS、SPSS、Modeler、R、Tableau、Python等数据分析/挖掘工具,曾作为SPSS官方培训师,从2001年起一手协助SPSS中国建立其培训体系 。
课程大纲
共0节 时长0分钟 全部收起
本课程数据资料——课程导读
图文
第1章 工欲善其事:工具准备
共4节 | 55分钟
  • 1-1 why胖哒?
    16分钟
  • 1-2 IDE简介
    11分钟
  • 1-3 Anaconda的安装与配置
    16分钟
  • 1-4 Notebook演示
    12分钟
第2章 数据的导入与导出
共12节 | 1小时43分钟
  • 2-1 手工输入数据并建立数据框
    17分钟
  • 2-2 读取文本格式的数据文件
    12分钟
  • 2-3 读取excel格式的数据文件
    6分钟
  • 2-4 读取统计软件的数据文件
    11分钟
  • 2-5 如何完美读取SPSS数据文件
    9分钟
  • 2-6 读取数据库
    11分钟
  • 2-7 Pandas数据读入/保存命令总结
    10分钟
  • 2-8 实战作业
    5分钟
  • 2-9 保存数据至外部文件
    7分钟
  • 2-10 保存为SPSS数据文件
    5分钟
  • 2-11 保存数据至数据库
    4分钟
  • 2-12 将数据框直接保存为外部文件
    6分钟
第3章 变量列的基本操作
共5节 | 37分钟
  • 3-1 对数据作简单浏览
    3分钟
  • 3-2 重命名变量列
    5分钟
  • 3-3 筛选变量列
    7分钟
  • 3-4 删除变量列
    5分钟
  • 3-5 变量类型的转换
    16分钟
第4章 胖哒黑魔法:索引
共5节 | 40分钟
  • 4-1 建立索引
    11分钟
  • 4-2 指定某列为索引
    4分钟
  • 4-3 将索引还原为列
    8分钟
  • 4-4 引用和修改索引
    9分钟
  • 4-5 强行更新索引
    8分钟
第5章 案例行的基本操作
共5节 | 57分钟
  • 5-1 案例排序
    16分钟
  • 5-2 按照实际位置进行筛选
    7分钟
  • 5-3 按照索引值进行筛选
    13分钟
  • 5-4 列表筛选与条件筛选
    14分钟
  • 5-5 用类SQL语句筛选
    6分钟
第6章 变量变换
共6节 | 46分钟
  • 6-1 计算新变量(上)
    7分钟
  • 6-2 计算新变量(下)
    8分钟
  • 6-3 对应数值的替换
    7分钟
  • 6-4 指定数值范围的替换
    12分钟
  • 6-5 哑变量变换
    5分钟
  • 6-6 数值分段
    6分钟
第7章 文件级别的数据管理
共6节 | 1小时5分钟
  • 7-1 数据拆分
    12分钟
  • 7-2 数据分组汇总
    14分钟
  • 7-3 长形格式与宽形格式的互相转换
    12分钟
  • 7-4 数据的纵向合并
    8分钟
  • 7-5 数据的横向合并
    14分钟
  • 7-6 concat命令介绍
    5分钟
第8章 数据清洗
共5节 | 38分钟
  • 8-1 读入PM2.5实战案例数据
    6分钟
  • 8-2 缺失值的设定
    8分钟
  • 8-3 如何处理缺失值
    11分钟
  • 8-4 数据查重
    6分钟
  • 8-5 直接比较数据框/变量列
    7分钟
第9章 处理日期时间变量
共4节 | 31分钟
  • 9-1 建立Timestamp类
    5分钟
  • 9-2 将数据转换为Timestamp类
    6分钟
  • 9-3 使用DatetimeIndex类
    8分钟
  • 9-4 对时间序列做基本处理
    11分钟
第10章 数据的图形显示
共3节 | 25分钟
  • 10-1 配置pandas绘图环境
    10分钟
  • 10-2 各类统计图的具体绘制(上)
    10分钟
  • 10-3 各类统计图的具体绘制(下)
    6分钟
第11章 数据特征的分析探索
共3节 | 18分钟
  • 11-1 变量特征的基本描述
    7分钟
  • 11-2 分类变量的交叉表描述
    4分钟
  • 11-3 常用假设检验方法的实现
    7分钟
第12章 北京PM2.5数据分析
共3节 | 31分钟
  • 12-1 数据准备
    7分钟
  • 12-2 数据的基本分布特征
    11分钟
  • 12-3 回答研究问题
    13分钟
第13章 如何优化Pandas
共6节 | 1小时1分钟
  • 13-1 优化pandas时的一些基本原则
    9分钟
  • 13-2 学习使用各种计时工具
    9分钟
  • 13-3 超大数据文件的处理
    16分钟
  • 13-4 加速!加速!再加速!
    7分钟
  • 13-5 如何进行多列数据的计算
    12分钟
  • 13-6 各种Pandas外挂加速
    7分钟
第14章 基于Pandas的图形化工具
共4节 | 1小时9分钟
  • 14-1 基于Pandas的图形化工具概述
    12分钟
  • 14-2 请给我一个偷懒的数据检索方法
    17分钟
  • 14-3 器如其名:PandasGUI
    18分钟
  • 14-4 重量级神器:Dtale
    21分钟
课程总结
图文
课程资料
图文
课后测试
共5题
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。