从事风控工作所需知识技能大全.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

从事风控工作所需知识技能大全

风控体系是一个庞杂的系统,不同金融机构的风控部门关注的重点不同,其组织架构差异也

较大,对应所需要的技能和知识也就不同。在相同金融机构的风险架构,不同部门不同岗位的职

责和所需要的技能、知识也是各不相同的。

传统金融机构,银行、证券、基金的风控,更多需要的是偏信用风险、市场风险、流动性风

险、政策风险方面的知识,一般不会涉及太复杂的量化模型或者计量分析。

互联网风控不同于传统风控的地方主要在于,依托大数据和机器学习算法,用线上的实时风

险审批和监控来代替传统的人工授信,这大大节约了成本的同时还能有效的控制风险。

下面以大数据风控为方向,分析从事风控算法工程师所需知识技能。

01

业务知识

熟悉业务知识是基本功。

了解业务才能够建立实际可用的模型,目前还不存在解决所有问题万能算法,还是回到现实

从业务学习开始。

互联网金融领域有着非常丰富的业务场景,同时它和传统银行业务场景差别非常大,用户没

有面签不直接见面,依赖的数据是弱数据、大数据,是数据和技术驱动的业务场景,但这并不代

表你不需要去理解业务的内涵。

每一个现实场景就是一个应用题,作为算法人员需要理解题干,从场景中抽象出需要解决问

题,将它翻译成算法问题,然后再使用合适的算法。

很多时候对业务问题的理解和抽象,相当于在设定模型开发的大纲。比如在白条场景中,我

们想要预测授信用户的信用风险,我们首先就需要考虑以下问题:

—1—

我们要观察多久的订单?逾期多少天才算坏用户?逾期定义中是否需要考虑金额限制?好用

户怎么定义?需不需要考虑样本不均衡的问题?为了保证模型的稳定性如何进行窗口验证比较科

学?针对业务的一些变动,比如订单制和账单制的调整,我们如何去修正模型的目标变量?

总之基本的信贷概念和业务模式是必须去了解的,有助于你设计开发大纲。

除了大纲,风控模型的开发也需要知道业务细节。这在Y变量定义,X变量加工,模型评估

都会涉及。

以Y变量定义为例,一般金融行业会把样本分为四部分:G(好用户);B(坏用户);I(不确

定用户);E(剔除用户)。

实操中对这四个群体通常会有不同定义的微调。有的时候是从算法角度考虑,但更多时候是

从业务需求角度考虑。预测用户未来的白条消费金额,止付用户就会被划入E类用户;预测欺诈

用户,因为样本很少,信用风险用户也被划入了B类坏用户。X变量除了根据业务知识挑选数据

源外,更多时候业务知识指导特征构造。

这里我插一句,不要轻视特征工程,特征工程仍然是非常重要的内功,不是搞一个深度学习

框架就可以解决一切。

金融行业的业务复杂通常和时间挂钩,必须掌握业务概念的细节。对于白条业务,就有下单,

到账,应还款,实际还款,最低还款,逾期,退款等一系列细节概念,它们都是在一个时间轴上

的,特征加工很讲究这些细节。只有清楚这些概念,而且知道这些行为如何产生和被记录,才能

够构造相关的有效特征。好的特征不但可以提高模型效果,也便于从业务上把握模型的跨时间有

效性。

业务场景很多时候还决定了你模型效果评估的方式,因为业务很灵活,可以做到有取有舍。

有些场景需要模型是为了在误杀尽可能少的情况下抓住更多的坏人;有些场景需要模型需要有更

好的排序能力但并不注重绝对值预测;有些场景需要模型需要有很准确的数值预测。

—2—

了解场景,挑选合适的评估方式,才能够构造出合适的模型,当然争辩是免不了的。

02

算法理论

首先,算法很多,没有人能够面面俱到,重在基本功。

对于转行的同学,推荐两本入门的基础读物:周志华“西瓜书”和李航的“蓝皮书。

作为算法工程师,对算法本身在公式的层面并不一定像考试那样需要死记硬背。

比如工作中不会有人问你LBFGS算法对于海森矩阵是怎么估计的的(即便在面试中背出来都

未必是加分项)。但是,LR的基本公式,SVM的基本原理还是需要去熟练掌握。

文档评论(0)

158****2068 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档