如今,几乎每天都有媒体提及银行或消费者信贷领域的人工智能(AI)与/或机器学习。鉴于你所阅读文章的作者观点各异,这项技术给人的感觉不是全球金融普惠的灵丹妙药,就是即将成为掌控全球金融的霸主。那么,这些新技术工具在消费者信贷方面的实际使用情况如何?近期到中期我们可以预期发生什么?哪些是宣传的噱头,哪些才是事实,哪些又是可以付诸实践的部分?

 

消费者信贷行业大背景

 

要回答这些问题,不妨以讨论全球消费者信贷的现状和行业机制为开端。了解和管理消费者风险是该行业的核心差异,历来都是企业亟需解决的重点问题。企业解决这一问题的方法是,遵循可预测未来的过往消费者行为普遍原则,并根据期望保持在定价区间内的风险阈值进行相应操作。这使得银行和监管机构创建了追踪消费者行为的共享数据资源。这些共享的数据存储库或“征信局”会整理消费者信贷信息。有了这些信息以及银行自身获得的信息,就可以建立预测“风险”的定量信用评分。这些评分通常使用各种能显著区分消费者风险的变量。通过使用回归模型得出评分,而回归模型已成为业界的事实标准。

 

 

过去10年间消费者信贷行业发生的变化

 

数据量的增长和相对低廉的计算资源使得消费者信贷行业在过去十多年内发生了巨大变化。此外,在此期间,监管机构还大力推动金融普惠。这些转变共同为AI的运用提供了肥沃的土壤。将这些要素纳入到大背景下,以亚太地区为例,在该地区42亿人口中,只有约12亿人拥有借贷历史,由此可见金融普惠更趋提上议程。然而,电信、电子商务和电子支付钱包的发展已经共同造就了涵盖约35亿人口的超大数据集。与此同时,摩尔定律在过去十年间使数据存储和数据计算的成本呈指数级下降。所有这些因素都为各种AI工具提供了用武之地。

 

 

AI如何助力消费者信贷?

 

AI带来的前景,是能够应用其计算能力发现变量之间复杂而微妙的关系,从而利用这些关系建立模型,将良好信用与不良信用区分开来。AI可以运用“机器学习”方法,再结合额外输入的数据,对这些模型进行优化,以进一步帮助创建一个良性循环。AI模型与常规回归方程的区别在于,AI模型在解释消费者数据方面所能实现的复杂程度更高。一个常规回归方程可能会使用8-10个输入变量来建立方程,以区分良好信用和不良信用,而AI算法往往会使用一个更丰富的变量集。它们还能够持续观察这些变量,并发现不断变化的关系,通过这些关系可模拟人类使用附加数据制定决策的思维方式。

 

将机器学习应用于消费者信贷的方法是,让一个以人脑为模型的“神经元网络”观察大量数据,然后用(通常)已知的结果对其进行训练。该算法对数据进行处理,并迭代形成一个模型,由其提供区分信用表现优劣的最佳界限。然后将此初始模型用于新的消费者申请数据,以预测客户信用是好是坏。这种学习模型的优势在于,它可以保持反馈回路的活跃性,在判断新消费者信用表现优劣的过程中酌情采纳附加数据。然后,该学习算法将增量学习整合到模型中,就像人脑建立学习的良性循环一样。

 

所有这些听起来都相当棒,那么这个方法有什么问题吗?这是否实际上只是“更好的诱饵”呢?答案仍一如既往,虽然上述场景在理论上表现出色,但AI在迈向消费者信贷决策的实际应用过程中,仍有一些问题亟待解决。

 

可解释性——更好诠释决策

 

我们当前看到的消费者信贷模型经过银行系统多年打造,是一个相当透明的体系,几十年来消费者都是在这个体系中接受规范的,监管机构也习惯于基于此模型管理系统风险。被纳入此模型的普通消费者通常对影响他们信用状况的行为有所了解,也知道他们有权要求获得银行系统掌握的个人信息。同样监管机构也有方法理解现有模型,并计算出系统风险以对其进行管理。

 

AI模型打破了现有模型的秩序,使其决策过程成为一个“黑箱”,在这个黑箱中,变量及其间的相互作用令人费解,而信贷决策便在此状况下产生。因此,该模型的输出是“不可解释”的,这是在消费者信贷决策领域使用AI所亟待解决的一个关键问题。幸运的是,这个问题并非无解。我们可用多种方法让这些模型可解释。虽然这是一个方法多元的复杂领域,但可以肯定的是,发展模型的“可解释性”正迅速成为AI并行研究的一个关键领域。实际上,将解释模型的过程作为AI模型开发活动的关键部分非常有必要。不过,也可能存在一些对可解释性不太敏感的运用领域,我们将稍后对此进行讨论。

 

偏差

 

消费者信贷模型经过不断演进,已经剔除了那些携带固有偏差的变量。这意味着信贷模型目前不使用诸如性别、种族等会造成系统偏差固化趋势的变量。人类以直观方式理解这些变量,并且有充分时间来发展他们对于这种偏差的理解。

 

例如,有鉴于男女薪酬不平等的历史,如果我们还使用性别作为决定信贷的变量,那我们所做的一切就是在帮助延续这种不平等。因此,我们在开发回归模型时一般就会剔除这些变量。但机器学习缺乏这种对历史的“理解”。它会使用所有可用变量来区分信贷。此外,我们前面提到过“黑箱”的比喻,这意味着我们在得到模型结果之前,很难觉察到这种偏差。因此,开发方法来阻止这些可能带来偏差的变量,对于信贷决策领域AI的发展过程非常重要。同样,有多种方法可以解决这个问题。一种简单的方法是引入预处理流程,以确保阻止那些带来偏差的变量。此外,可能需要在模型实际投入使用时引入进一步的核查。

 

应用领域

 

对AI在消费者信贷领域的应用加以考量的另一种方式,是清晰界定应用这些模型的领域,同时充分了解其所采用方法论的优缺点。例如,可解释性方面的问题可能不会对欺诈检测领域产生重大影响。作为银行业的一个核心领域,欺诈检测通常有一套非常规管理流程。该领域的学习算法可确保我们能够运用常见、可获得的大量数据流。消费者也可能更理解这种方法带来的系统性得益,因为他们最终将从更准确的欺诈检测中获益。其他更容易被消费者接受的应用领域为预测消费者生命周期事件,从而更好地开展直接营销活动。同样地,只要重视隐私问题,消费者可能会对这一领域的AI运用更为认同。

 

综上所述,虽然AI在消费决策领域的应用可能还会有其他问题需要加以考虑,但上述提到的问题是目前亟待解决的关键所在。鉴于AI的应用可以通过运用消费者数据来解决金融普惠问题,从而带来不可否认的收益,所有这些付出都值得我们投入。因此,问题不在于AI能否用于消费者信贷,而在于我们多久才能有效驾驭这些能力,以解决我们这个时代最大的问题之一——金融普惠。