大数据前沿技术:基于CDC的数据捕获
知识小课

大数据前沿技术:基于CDC的数据捕获

  • 大数据系统

结合代码演示,认识CDC的实现机制与FlinkCDC

¥39.9
本课程包括
  • 56分钟的视频随时观看
  • 课程包含 5 道测试题
  • 可在APP随时观看
  • 结业证书
你将收获
  • 掌握CDC工作原理
  • 厘清CDC与大数据间的关系
  • 能够结合代码进行CDC数据收

数千家企业正在使用三节课企业版学习

无限制学习5000+门课程,200+精选学习专题

免费申请体验>
课程介绍

在进行数据抽取时,你是否考虑过需要抽取哪部分数据加载到数据仓库? 是完全抽取还是变化数据捕获? 如果数据量很小,则采取完全源数据抽取;如果源数据量很大,则抽取变化的源数据,这种数据抽取模式叫做变化数据捕获,简称CDC。 当你能够识别并获得最近发生变化的数据时,抽取及其后面的转换、装载操作显然都会变得更高效,因为要处理的数据量会小很多。 遗憾的是,很多源系统很难识别出最近变化的数据,或者必须侵入源系统才能做到。 变化数据捕获是数据抽取中典型的技术挑战。

因此掌握CDC在一定程度上提升了效率,具有较强的适用性。本课程的目的在于结合代码实现CDC,并在此基础上完成高质量的数据采集工作。

适合人群
  • 软件、编程学习者
  • 大数据分析人员
讲师介绍
曾任京东大学大数据学院院长 曾任Oracle中国有限公司高级技术顾问
擅长领域:
  • 大数据系统
  • 数据库
  • 数据挖掘与分析
  • 数据可视化
  • Java
  • Docker
  • K8S
擅长领域:大数据、数据库、云原生、容器技术
课程大纲
共0节 时长0分钟 全部收起
一、课程概述
5分钟
二、CDC技术概述
共3节 | 34分钟
  • 1.概述
    6分钟
  • 2.基于查询的CDC技术:Sqoop
    16分钟
  • 3.基于binlog的CDC技术:Canal
    11分钟
三、CDC与大数据
15分钟
四、课程总结
1分钟
课后测试
共5题
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。