全球软件开发大师课:数据科学:基于Python和R语言实现
体系课

全球软件开发大师课:数据科学:基于Python和R语言实现

  • 数据挖掘与分析
  • Python
  • R语言

学习谷歌Colab记事本进行数据科学编程、学习数据科学中使用的Python的基本子集等

¥169
本课程包括
  • 7小时6分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
课程合作品牌
机械工业出版社
你将收获
  • 学会使用Anaconda和Jupyter notebooks
  • 了解开放数据科学概念、角色和工作流

数千家企业正在使用三节课企业版学习

无限制学习5000+门课程,200+精选学习专题

免费申请体验>
课程介绍

用Python数据科学和R LiveLessons是为了定制的初学者数据科学家寻求使用Python或R数据科学。本课程包括数据准备基础、数据分析、数据可视化、机器学习和交互式数据科学应用。学生们将学习如何建立预测模型,以及如何使用Anaconda平台为他们的业务线创建交互式可视化应用程序。本课程将介绍数据科学家如何使用Python和R来构建一个由数百种高性能开源工具组成的系统。

这些活动的笔记可以在https://anaconda.org/datasciencepythonr上找到。

适合人群
  • Python数据科学初学者
  • 使用Python或者R做数据科学相关工作的学员
  • 对Python感兴趣的相关学员
讲师介绍
Continuum Analytics的计算科学家
擅长领域:
  • 数据挖掘与分析
是Continuum Analytics的计算科学家,从一开始就在该公司工作,是Collaboration component ofAnaconda Enterprise的团队领导。lan的重点领域之一是与Continuum客户合作,利用开放数据科学来满足他们的分析需求。在加入Continuum Analytics之前,lan是哈佛医学院和工程学院计算科学的讲师和研究者。他还在哈佛医学院、牛津大学和欧洲分子生物学实验室教授过一系列入门和高级科学计算课程。lan在牛津大学获得了博士学位,他为数千名工程师和科学家提供了数百小时的商业数据建模和web服务架构方面的行业培训课程
传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升
擅长领域:
  • 智能制造
  • 企业创新与商业模式
  • 数字化思维与认知
  • 数字化领导力
机工社先后获评“全国优秀出版社”“全国百佳出版单位”“中国500最具价值品牌”“世界媒体500强”“国家文化出口重点企业”“中国版权最具影响力企业”“中国图书海外馆藏影响力出版100强”和“教育部教材出版基地”。机工旗下出版物曾获得全国科学大会奖、国家图书奖、中国出版政府奖、全国优秀科技图书奖、中国好书、全国教材建设奖等众多国家奖项。机工社新世纪的快速发展,在业界引起广泛关注,2014年其改革发展实例被收录进哈佛大学案例库应用于教学实践,并通过哈佛大学的出版网络向全球发行,成为中国文化产业战略管理“走出去”第一家。 传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升,是机工社的使命与追求。愿与各界机构、各界人士携手同行,集知播识,再铸辉煌。
课程大纲
共0节 时长0分钟 全部收起
第1课 使用Python和R的数据科学:简介
5分钟
第1课 面向所有人的开放数据科学
共7节 | 29分钟
  • 1.0学习目标
    1分钟
  • 1.1使用Anaconda代码仓库进行数据科学工件
    3分钟
  • 1.2使用Anaconda Navigator开发环境打开
    2分钟
  • 1.3执行基本的Jupyter操作
    3分钟
  • 1.4用Pandas摄取、分析和清理数据
    7分钟
  • 1.5使用Bokeh可视化数据
    4分钟
  • 1.6使用Scikit Learn创建机器学习和预测建模
    10分钟
第2课 开放数据科学的背景概念
共4节 | 17分钟
  • 2.0学习目标
    1分钟
  • 2.1了解开放数据科学的概念
    2分钟
  • 2.2确定开放数据科学团队中的不同角色
    6分钟
  • 2.3了解开放数据科学工作流程
    8分钟
第3课 使用Pandas进行数据清洗
共10节 | 1小时26分钟
  • 3.0学习目标
    1分钟
  • 3.1加载、查看和绘制Pandas数据框
    10分钟
  • 3.2修改内容和创建新列
    10分钟
  • 3.3使用boolean masks进行数据选择
    9分钟
  • 3.4从磁盘读取数据
    11分钟
  • 3.5数据分组
    9分钟
  • 3.6连接到数据库
    16分钟
  • 3.7使用时间序列数据
    7分钟
  • 3.8读写Excel文件
    10分钟
  • 3.9将代码发布到Anaconda Cloud
    3分钟
第4课 Anaconda
共7节 | 34分钟
  • 4.0Anaconda环境管理器概述
    1分钟
  • 4.1描述Anaconda发行版本
    4分钟
  • 4.2 熟悉Conda工具的用途
    3分钟
  • 4.3关联Anaconda企业组件
    10分钟
  • 4.4熟悉核心技术组件
    5分钟
  • 4.5描述典型的数据科学工作流
    2分钟
  • 4.6与团队一起在Anaconda企业版中创建项目
    8分钟
第5课 使用Bokeh
共7节 | 43分钟
  • 5.0使用Bokeh创建交互式可视化
    1分钟
  • 5.1描述Bokeh
    5分钟
  • 5.2用boke .charts绘制Pandas数据
    6分钟
  • 5.3用bokeh.plotting管理绘图
    10分钟
  • 5.4使用小部件和绘图链接进行交互性
    14分钟
  • 5.5创建web绘图
    3分钟
  • 5.6使用Bokeh服务器创建数据应用程序
    5分钟
第6课 Conda
共11节 | 1小时13分钟
  • 6.0Conda包管理工具
    1分钟
  • 6.1从Navigator安装软件包
    9分钟
  • 6.2从Navigator添加channels
    4分钟
  • 6.3从Navigator中升级、降级和删除包
    3分钟
  • 6.4从Navigator创建一个新环境
    6分钟
  • 6.5选择Conda环境和Jupyter内核
    8分钟
  • 6.6从命令行使用Conda
    11分钟
  • 6.7了解pip和conda之间的区别
    13分钟
  • 6.8保持pip和conda最新
    2分钟
  • 6.9导出、保存和共享Conda环境
    9分钟
  • 6.10在Anaconda Cloud和Conda-Forge上查找包
    7分钟
第7课 课程中的数据处理和可视化
共7节 | 1小时13分钟
  • 7.0学习目标
    1分钟
  • 7.1配置一个R分析环境
    5分钟
  • 7.2使用dplyr和tidyr访问和处理数据
    10分钟
  • 7.3使用ggplot创建可视化效果
    22分钟
  • 7.4使用线性模型进行预测分析
    15分钟
  • 7.5使用rBokeh和Shiny创建交互式可视化
    9分钟
  • 7.6用rpy2搭建R和Python之间的桥梁
    11分钟
第8课 构建统计和预测模型
共5节 | 22分钟
  • 8.0 学习目标
    1分钟
  • 8.1使用Scikit-Learn创建一个预测模型
    6分钟
  • 8.2用模型生成预测
    5分钟
  • 8.3评分模型
    8分钟
  • 8.4可视化模型性能
    3分钟
第9课 Anaconda Fusion的Excel和Python
共4节 | 11分钟
  • 9.0学习目标
    1分钟
  • 9.1了解Fusion解决了哪些问题
    2分钟
  • 9.2安装并启动Fusion
    4分钟
  • 9.3连接电子表格到编码表
    4分钟
第10课 使用Mosaic的数据库和分布式数据
共4节 | 8分钟
  • 10.0学习目标
    1分钟
  • 10.1了解Mosaic解决的问题
    2分钟
  • 10.2 安装并启动Mosaic
    1分钟
  • 10.3 使用Mosaic注册数据集和创建数据视图
    5分钟
第11课 Dask的分布式和并行计算
共4节 | 22分钟
  • 11.0 学习目标
    1分钟
  • 11.1 描述Dask与Dasks的关系
    6分钟
  • 11.2 描述Dask数据框的创建
    10分钟
  • 11.3 分析和绘制Dask数据
    5分钟
使用Python和R的数据科学:总结
3分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。