联邦学习“导演”金融界新篇章

联邦学习“导演”金融界新篇章

欧洲金融界的困境

3月26日, Feedzai(致力于用AI解决金融欺诈问题的数据科学企业)的银行解决方案副总裁 Andy Renshaw道出了现在欧洲金融界的困境:“It crosses borders but doesn’t have a passport. It’s meant to protect people but can make them angry. It’s competitive by nature but doesn’t want you to fail. What is it?”

在欧洲,PSD2(Revised Payment Services Directive)对支付服务和支付服务提供者(一般是一些金融机构,financial institutions ,FIs)进行监管,保证欧洲各地区的金融安全。基于此,PSD2也制定了很多的规定,SCA( Strong Customer Authentication)就是其中之一。Andy Renshaw指的困境就是由SCA这些制度造成的。

PSD2希望欧洲能够在一个金融安全的环境下进行活动,于是制定了一条条的规定,但是这些繁杂的规定降低了让欧洲的金融活动效率。金融服务提供者想要摆脱SCA的限制提高交易效率,就必须达到PSD2限制的欺诈率要求。下表就是相关的阈值规定如下:

联邦学习“导演”金融界新篇章

在金融界这样的领域上面的阈值设置是成熟的,但是想要在欧洲范围内,让单独的金融服务提供方达到上述要求就比较困难了。

机器学习也许可以成为可靠帮手

金融活动中每个事务都有数百个数据点,称为实体。实体包括时间、日期、地点、设备、卡片、无卡、发送者、接收者、商人、客户年龄——这些可能性几乎是无穷无尽的。当数据被清理和连接时,这意味着它不存在于孤立的系统中,机器学习在数据上提供可操作的洞察能力在历史上是前所未有的。

健壮的机器学习技术使用规则和模型,并从事务中几乎每个数据点或实体的历史和实时配置文件中学习。当机器被提供的数据越多,它在学习欺诈模式方面就越好。随着时间的推移,机器学会在不到一秒钟的时间内准确地对交易进行评分,而无需客户身份验证(SCA)。

而在真正的交易过程中这样的设想面临着两个显著的问题。首先是数据的来源与处理问题。一定程度上,机器学习的数据量越大,其模型准确率越高。但是数据如何进行收集?在数据隐私安全被提到一个新高度后(多国相继出台数据隐私政策),如何确保数据隐私的情况下保证数据安全和有效?


联邦学习“导演”金融界新篇章

其次就是面对实时交易的模型响应速度。数据量的增加确实会一定程度上带来模型效果的提升,但同样伴随着模型训练时间的延长。例如在面临即时支付的场景中,每秒钟进行的事务(transaction)数量都是惊人的,如何利用这么惊人的数据量进行机器学习模型训练,并且进行实时的事务判断?

这两个问题将传统机器学习方式打入了神坛,那么实时判断金融欺诈真的是不可能的吗?


联邦学习让机器学习进入新篇章

联邦学习是近年来各大数据科技平台的研究热点。其特点是将个人数据保留在本地,并在和其他方(无论是服务器方还是对等的其他个人方)联合建模时,通过加密的数据梯度传输完成模型训练。

Federated learning (aka collaborative learning) is a machine learning technique that trains an algorithm across multiple decentralized edge devices or servers holding local data samples, without exchanging their data samples. This approach stands in contrast to traditional centralized machine learning techniques where all data samples are uploaded to one server, as well as to more classical decentralized approaches which assume that local data samples are identically distributed.

为什么说联邦学习可能解决上文提及的问题呢?

首先联邦学习对数据的安全和隐私问题的处理几近完美。个人数据在建模时仍然保留在数据拥有方本地,并不进行数据的传输,很好的保障了数据隐私性。而在训练过程中进行同态加密,确保数据安全的同时,能够很好的保证模型效果。

面对模型实时训练的问题时,联邦学习可以很好的利用分布在数据拥有方的计算资源,将模型训练的任务分布在与数据同量级的用户计算资源上。数据拥有方的本地计算结合服务器方计算,可以很好的完成模型实时训练和实时监测的任务。

结语

数据已然成为这个时代的主角。而这个主角参演的最重要的剧本——金融,迫切的需要一位能够充分发挥主角特点的导演。联邦学习也许能成为最好的导演,导出最具时代特色的新篇章。


联邦学习“导演”金融界新篇章

END


本文为联邦学习原创文章,转载请联系小编获得授权

投稿或寻求报道:[email protected]


联邦学习“导演”金融界新篇章

Federated Learning

长按上方二维码

关注【联邦学习】头条号


分享到:


相關文章: