数千家企业正在使用三节课企业版学习
无限制学习5000+门课程,200+精选学习专题
为了提高机器学习的准确性和泛化性能,我们需要结合很多上下文”信息,就像人们常常根据“上下文”来做出更好的决策一样。 人们不仅仅使用直接的数据样本,还使用周围的环境来帮助我们改善预测。(这里所说的“上下文”不仅仅指是狭义的文本问题中的上下文,而是指代时间结构和空间结构上的一种存在一定潜在规律的关系,比如word2vec中的上下文的概念,时间列中的事件发生的先后顺序,图结构中的近邻关系等)
机器学习算法擅长处理静态的、特定的信息,但是难以处理不断变化的信息,例如文本分类中,词的上下文关系,如果要抽取出词的共现关系为新特征,则需要更多的更加准确细致的规则,比如词附近的n个单词(即ngram),或者是时间序列中使用时间窗口来抽取不同时间区间的特征,比如过去一个月XXX,过去三个月XXX之类的统计特征,然而实际情况要复杂的多,我们难以仅仅通过一些特定的规则来对这类不断变化的信息进行充分的提取,这个时候,我们就需要借助于其它的手段。
在风控问题中,用户的离散序列数据常常使用nlp领域的一些方法来进行处理,例如经典的app2vec,针对app使用时间间隔对word2vec进行损失函数的魔改来应对实际的业务问题,而用户的连续序列数据则常常基于一些时间序列预测领域的方法来进行处理,典型的如时间窗算子,差分,滞后算子等等,而在风控领域中,尤其是一些具有强社交属性的业务场景里,例如欺诈检测,则常常涉及到另外一种独特的数据--图数据。这个时候就涉及到图算法来对相应类型数据进行精耕细作了。
本次课程针对图计算感兴趣想要应用到实际的比赛或者业务中的同学,主要目的是帮助大家了解图分析、图机器学习和图深度学习相关知识,并且能够应用到实际的业务中去,课程中不同章节会有相应的代码demo以供学习和使用。
课程有效期:
自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。
上课模式:
课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。
注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。