數據安全|金融科技企業扎堆聯邦學習熱潮

數據安全|金融科技企業扎堆聯邦學習熱潮


打破數據孤島的前提是,數據安全,隱私安全。


多年前,在安全計算領域有個知名的小案例:兩個百萬富翁在街頭邂逅,他們都想小炫富一把,比比到底誰更有錢。但出於隱私,都不想讓大家知道自己到底有多少財富,在尊重隱私的情況下,如何知道他們誰更有錢?加密算法此刻就派上用場了。


節前,央行發佈了《金融數據安全數據安全分級指南》金融行業標準,給出了金融數據安全分級的目標、原則和範圍,以及數據安全定級的要素、規則和過程。


節後,備受關注的個人信息保護法草案提請十三屆全國人大常委會初次審議。其中,明確個人信息定義,用戶可要求平臺不推送個性化廣告等要點都頗為引人關注。


可以預見的是,未來無論是個人還是機構,信息數據安全問題都被日益重視。數據安全,是解決數據孤島的重要前提,這也是為何近兩年來聯邦學習大熱。作為可同時兼顧數據共享和隱私問題的技術,越來越多金融科技機構重視研發聯邦學習及相關業務應用。


此前,也已有騰訊安全、富數科技、星雲clustat、微眾、京東數科等提供技術服務的聯邦學習金融業務應用案例落地。但未來,聯邦學習、邊緣計算等能幫助金融機構在“開放”的路上走多遠,依然是個未知數。

1

安全,是“開放”的前提

下載個APP,不同意隱私條款則被強制退出;金融服務類APP被要求獲取通訊錄、短信、相機圖片等權限已經見慣不慣,信息收集“最少”原則的邊界難界定,也難靠業內自律解決;搜索了某個產品後繼而連三被各平臺“精準”推送同類型廣告,看個房子馬上“精準”接到更多中介的電話……類似的場景,舉不勝舉。


隨著雲計算和大數據技術的不斷進步,無論是機構和個人,每天都會源源不斷地產生大量數據。然而,在享受信息時代便利的同時,任何人都不想被信息裹挾。各類包含用戶行為軌跡的數據、包含商業機密的算法,其中往往都會涉及大量個人隱私,如果機構之間要實現“開放”或交換學習,首先面臨的,就是數據安全問題。


眼下,各類金融機構鏈接產業服務的動力十足,然而數據豐富度、服務能力卻依然有待提升。以被提及多年的開放銀行為例,根據中國人民大學金融科技研究所《開放銀行全球發展報告》,目前“開放銀行”接受程度最高的是諮詢公司Gartner的定義,即是一種與商業生態系統共享數據、算法、交易、流程和其他業務功能的平臺化商業模式。


簡而言之,開放銀行是指一種銀行向第三方開放數據和服務的模式。在這種模式之下,銀行和其他各方能夠在共享信息服務資源的基礎上進行協調合作,最終給客戶帶來更加高效貼合的服務體驗。

然而,多方研究認為,目前數據安全依然是“開放”面臨的重要問題。


畢馬威在系列研究“開放銀行,中國銀行業發展必然路徑”中指出,法律的監管是不可缺失的。開放銀行“開放”的核心是數據,涉及隱私。


普華永道在2018年進行的一項調查顯示,面對開放銀行這個概念時,95%的受訪者擔心自己的個人信息將會被洩露;68%的受訪者第一印象是個人隱私將會受到一定影響。


在安永2018年的調查中,71%的受訪公司認為取得用戶授權同意是實施開放模式過程中的巨大挑戰,超過半數的公司更是將其列為“首要考慮”的問題。


因此,開放銀行的構建,需要法律和監管充分保障數據的安全性、採用可信且規範化、標準化的程序和模式。

而在安全有效的數據開放機制落地之前,業務能力仍需提升,數據的生產力也在不斷釋放,如何兼顧數據開放的安全與效率,依然是銀行、消費金融等機構面臨的現實問題。

2

金融科技公司扎堆聯邦學習研發

從目前聯邦學習的應用案例來看,解決業務問題、提高業務效率,才是各方關注的焦點。目前,越來越多銀行已開始在利用外部數據源提升業務能力,互聯網聯合貸款、信用卡業務等往往是此類合作的“試金石”。


作為一種新型人工智能技術,目前還有螞蟻金服、騰訊安全、京東數科、富數科技、華控清交、星雲clubstar、微眾銀行等金融科技頭部企業入局聯邦學習應用。


根據微眾銀行發佈的《聯邦學習白皮書V2.0》披露,通過合規的多維度聯邦數據建模,風控模型效果通常約可提升12%,消費金融類企業機構有效節約了信貸審核成本,整體成本預計下降5%-10%,並因數據樣本量的提升和豐富,風控能力進一步增強。


而對合作方信貸機構而言,信貸風控能力也大幅度提升,通過初審篩選掉黑名單和不可能轉化貸款客戶,在“信審漏斗第一步”減去無效客戶,從而在信貸預審階段使單接口調用成本預計節省20%-30%,信貸審核成本得以有效控制。


同樣地,在信用卡業務領域,也有多家公司給出了應用案例,其中包括騰訊安全、京東數科、富數科技等。


以騰訊安全及江蘇銀行的合作案例來看,雙方擁有的數據特徵是不一樣的,一個偏金融特徵,一個可能偏社交特徵。兩種不同特質的數據交換學習,同時又要保障用戶隱私安全,通過聯邦學習可實現。江蘇銀行數據顯示,其去年新增髮卡

142.11萬張,位列城商行新增髮卡量前列。


而從富數科技和某銀行卡中心的營銷案例來看,銀行在保證後端轉化數據(如進件樣本、核卡樣本、逾期樣本等數據)不出域的前提下,實現與外部數據聯合建模,進一步提升用戶轉化率,從而提升進件率和核卡率。


近期,京東數科也已推出一款“聯邦模盒”的聯邦學習產品,並在近期公開招聘算法工程師(聯邦學習),充實隊伍。


自去年開始,馬上消費金融也在研發自己的邊緣計算智能算法,以實現客戶隱私保護的同時,精準把控營銷和風控效率。


去年12月剛完成C輪融資的我來數科,也將隱私計算列為集團目前的三大戰略目標之一,並在研發自己的邊緣計算、聯邦學習可操作平臺系統。


此前,周觀新金融已經在系列聯邦學習商用觀察的文中提及,在數據安全被日益重視的大背景之下,聯邦學習解決問題的能力將會被機構們日益重視。很快,我們也將有最新的應用案例分析,敬請期待。


分享到:


相關文章: