2.3.1 目标定义

在评分卡模型中,逾期的定义即为模型学习的目标,不同的逾期定义会导致模型适用的场景发生变化。对于银行来说,通常M3+(历史最大逾期天数超过90天)会被定义为逾期。而对于互联网金融机构来说,由于贷款产品普遍期限较短,客户的逾期表现就会暴露得更早,因而需要通过滚动率分析(Roll Rate Analysis)找出最适合的逾期定义。滚动率分析通过观察客户在各个贷款状态间的转移概率提前找出稳定的逾期定义。

以某互联网金融平台现金贷产品为例,观察2017年7月至2017年12月期间每个月借据单的逾期状态分布,如表2-5所示。

表2-5 某互联网金融平台逾期状态分布表

根据每个月的逾期状态,可以计算出每个月借据单的滚动率,如表2-6所示。例如2017年7月M1—M2的滚动率为2017年8月M2笔数除以2017年7月M1笔数,即252/1470=17.14%;2017年7月M2—M3滚动率为2017年9月M3笔数除以2017年8月M2笔数,即153/252=60.71%。

表2-6 某互联网金融平台滚动率分析表

从表2-6可知,该互联网金融平台客户M2—M3和M3—M3+的滚动率均超过50%,说明一旦客户逾期超过30天,很大概率会转化为逾期超过90天,可以考虑将M1+(历史最大逾期天数超过30天)定义为逾期。