{{item.label}}

风控入门知识?

177****2309
风控模型专利
提问时间:2022-03-23 20:23:07
提示:以下回答均以本问题为中心,仅供参考;如需更多帮助,请咨询早鸽顾问。 去咨询
回答 | 共1个
李欣洋
李欣洋
从业11年
软著申请著作权转让
所在地区:贵阳市
咨询解答:451
咨询TA

对风控感兴趣,想从 0 开始学的人,我的经验文章可能并没有什么用,那我试试写一篇基础逻辑,看看能不能让这些朋友们看到骨架。

1.风控的范围很大

只要有交易就有风险。想想别人找你借钱时你的心路历程吧,可太怕了。人都不喜欢和自己不了解的人交朋友,更不喜欢和不知道的人做交易。

“有内鬼,终止交易”。内部人尚且如此,陌生人不能不防。

互联网业务中你从来不知道你服务的对象是什么人,它天然就需要做风控。ToB 的业务如果是大客户,你可能还会线下有过往来接触,ToC 的根本就不可能。

可以说互联网的业务有多大,风控的范围就有多大。

以我在的互联网金融业务为例,业务上肯定希望吸引更多的用户,给更多的人授信,提供更高的额度,最后又能有更低的逾期,从而有最大的收益。但规模要大,就要下沉,额度高的,风险又更高。风控就是要在各个环节上,例如,市场营销—>申请审批—>账户管理—>催收处置等,把高风险用户识别出来特殊对待。

不仅信贷,营销活动要拦截“羊毛党”,刷单控评的行为要拦截,黄牛党也要防控,垃圾注册刷访问、关注的要防控,就现在这篇文章,也要被检测看看符不符合原创,有没有涉政、涉黑、涉黄。无所不包。

2.个体不重要,群体才重要

做风控的目标不是为了 0 风险。你不能把所有存在风险的客户都拒绝掉,你也做不到这一点,因为每个人每笔交易都存在风险,程度问题。

你不能说一个芝麻分 600 分的人,比一个 800 分的人差,个体符合测不准原理。但是你可以说,六百多分的这群人没有八百多分的那群人好,这是对的,群体是测得准的。

风控不关注个体,1w 个人申请,你通过了 3k 人,不是说这 3k 里的每个人都是会准时还款的。实际上是,你把这 1w 人按风险排序分成 10 组,每个群组里计算收益率,风险排序足够好的话,这 10 组的收益率是单调的,收益率为 0 作为分界线,你取出了其中前 3 组。实操中,不必真的算收益率,逾期率好算得多,也不必用 0 作为分界线,取一个业务上合理的阈值就可以了。

你从来没有关注过个体,而这却是对的。

所以你常常会见过,风控把一些正常行为拦截了,例如反复让你校验验证码、刷脸失败、交易被拒绝、投保被拒等。

3.最重要的是数据

主流银行贷款是需要提供很多很多信息的,在哪工作、收入、学历、家庭情况、征信记录等等,银行对你的了解比你的亲朋好友还多得多。如果你有贷款买房经历就知道了。

移动互联网改变了世界。你的客户是不是人你都说不准,你的客户就是数据。y=f(x),你只有 x,没有 y。

那么你需要什么数据呢?你想知道一个人会不会还钱,显然需要知道他想不想还钱,需要知道他有没有能力还钱。

离这些信息越近的数据越有效。而几乎所有的数据都是有效的,又一个程度问题。收入高不高、学历怎么样、安装了哪些 app、跟什么人通话,等等,几乎一切都有用。

我们不需要 y 标识每个人,我们不是用 X 来预测用户的身份证号,我们只需要评估一个人会不会还钱。

4.因果关系很难,但相关关系很容易

上面随意列出的数据,你都不敢说因为怎么样所以怎么样。这个人收入很高,所以不会逾期,这个逻辑如果是对的,那高收的人都要通过,低收的人都要拒绝。是收入高的这群人,整体风险偏低。

前者说的是因果关系,后者是相关关系。我们从来不能很好地解释,这群人逾期的原因是什么。我们擅长计算,这群人具备这些特性,他们的逾期水平比较高。

用数据去定义一个人,尤其是移动互联网时代,用海量的数据去定义一个人,我们找的是相关关系。数据维度非常多,数据分布非常稀疏,但因为你找的是一个相关关系,问题就变得可解,或者说容易解。

1000 个相关变量找出来的风险度量,就很可靠,不容易被攻击。而不是捏造一个高收数据,就可以获得一笔贷款。

世界上不是所有有道理的事情都是因果关系的。

5.策略模型的工作其实很简单

选择一批样本,也就是历史用户,定义出他们的好坏标签,也就是打上 label,关联到他们的数据信息,也就是匹配特征,选用一个成熟的算法,也就是 xgb,训练一个模型,输出一个概率对用户进行排序。建模工作就完成了。

图像分类的经典问题猫狗识别,是识别一张图片是猫是狗,我们也是用一个人的数据信息,识别一些东西。当然,我们不是识别是人非人,而是识别是不是一个“好人”。

应用时,获取用户申请时的那些数据信息,用训练得到的模型,计算出用户的风险概率,参考历史用户的风险水平,做出拒绝还是通过的决策。这就是策略应用了。

模型开发时我们总在关心模型效果,但当模型开发完后,最重要的是稳定性。没有策略会盯着模型分的变动反复调整阈值的。有问题的信息千万不要用。监控一切容易,响应一切难。

简而言之,言而简之,风控就是用你能拿到的信息综合计算出一个风险度量。

所以风控的这些工作,无非是去拿信息、去加工信息、去计算风险、去找到一个尽可能优的方程式。


最好情况是到这儿时,你发现风控就是这么回事了,然后你会去想:

y 需要怎么定义呢

能接入哪些数据呢

风控模型怎么建呢

有哪些模型要建呢

策略又怎么制定呢

什么时候做风控呢

等等。而这些,其实,我都已经写过了。

知识体系的构建,就跟盖房子是一样的,框架形成后,往里面填充必备的组件,忽然就变得容易又可控。

希望上面的一些逻辑思考,能给一些朋友一点启发。当然了,我自己也是小白,认知不可能全面,互相学习而已。

2022-03-23 21:37:08
没有符合您的答案?立即联系 “在线顾问"
顾问推荐
{{item.label}}
{{item.desc}}
相关资讯 换一批
注册商标分类表中的书签商标的优点是什么
在当今社会,书签已经成为人们阅读书籍中不可或缺的一部分,不仅可以帮助读者标记重要的章节或位置,还可以为阅读增添趣味性和美观性。
书签商标
550次浏览
2023-12-11 10:02:13
注册商标分类表中的书签商标的优点是什么
公司注册资本是实缴的还是认缴的
有注册资本的,以出资金额支付公司事务有限责任;无注册资本的,支付公司事务无限责任。需要注意的是,在工商局年报中可以看到股东的实缴资本和认缴资本。此外,还有一些行业,规定必须一次性足额缴纳注册资本。如银行、当铺、保险、贷款等。这是因为这些行业容易出现金融风险。有了认缴制,注册公司真的变得越来越容易了。根据公司经营情况和个人风险承受能力,结合自身情况合理选择注册资本,才能更好地助力公司发展。
公司注册资本
970次浏览
2022-04-13 16:42:40
公司注册资本是实缴的还是认缴的
义乌商标的转让流程和转让事项
义乌作为中国的小商品市场中心,以不断扩大的市场规模,成为世界五金制造业中心。在义乌可以买到便宜的商品,也可以进行商标买卖转让。那么,什么是义乌商标转让,义乌商标转让有哪些流程和需要注意的地方呢?
义乌商标转让
894次浏览
2023-06-12 11:38:49
义乌商标的转让流程和转让事项
商标注册申请书的填写指南
商标注册申请书上要填写申请人名称、申请人地址、类别和商品/服务项目、商标图样。下面,是早鸽网顾问准备的相关知识,希望对你有所帮
商标注册申请书
858次浏览
2023-03-02 16:18:02
商标注册申请书的填写指南
非关系型数据库系统有哪些优势
非关系型数据库系统是一种新型的数据库管理系统,与传统的关系型数据库系统不同,具有更高的灵活性和可扩展性。在当今的数字化时代,非关系型数据库系统已经成为许多应用领域的重要选择。
非关系型数据库系统
736次浏览
2023-11-07 17:55:51
非关系型数据库系统有哪些优势
谢世华
谢世华顾问
擅长:版权登记,公司注册
执业3年
咨询专业顾问
最新问答
2023-06-19 06:34:24
北京海丰益商贸中心基本介绍?
北京海丰益商贸中心基本介绍?
2023-06-19 06:33:56
北京佳兴源装饰有限公司第一分公司公司大概情况
北京佳兴源装饰有限公司第一分公司公司大概情况
2023-06-19 06:33:29
北京君燕环保设备有限公司是多久时候成立的?
北京君燕环保设备有限公司是多久时候成立的?
2023-06-19 06:32:19
北京市华盛业石材经营部是多久时候成立的?
北京市华盛业石材经营部是多久时候成立的?
2023-06-19 06:31:54
北京市四季永芳石材经营部基本介绍?
北京市四季永芳石材经营部基本介绍?