無標準不協作,一場改變生產關係的多方合作

無標準不協作,一場改變生產關係的多方合作

一份標準的出臺,便是一個技術發展前景的指明燈。

今年3月份,聯邦學習IEEE標準草案完成並通過標準工作組表決,預計年中將正式出臺。這預示著首份中國企業牽頭推動的IEEE聯邦學習國際標準即將落地;同時也意味著聯邦學習提出三年之後,其在解決數據孤島和保護用戶隱私方面的作用已得到國際認可。

作為一種人工智能協同技術,聯邦學習標準的出臺對接下來的AI落地也將有著舉足輕重的意義。這一標準從提出到表決出臺,這中間發生了什麼?這樣一個國內企業主導的標準範式,對中國有哪些具體的意義?

數據聯盟:技術標準發起的原因

無標準不協作,一場改變生產關係的多方合作

(雷鋒網)

聯邦學習這項大規模分佈式學習人工智能技術, 簡單來說,即一種數據不出本地,就可完成機器學習多方協作建立模型的技術。其應用領域可以分為: 1) 用於保護用戶隱私的,面向個人消費者市場的場景; 2) 同時面向個人客戶和企業或者政務部門的業務場景。

微眾銀行和谷歌分別在不同方向領導著研究的重心,同時微眾銀行等中國企業引領了大部分的技術創新, 業界標準制定及應用市場。

谷歌於2016年利用聯邦學習解決安卓手機終端用戶在本地更新模型的問題,也即能夠基於本地小數據進行不斷機器學習訓練。而聯邦學習在國內興起的主要原因卻是:這種數據不出本地的聯合建模技術,正是解決國內企業數據孤島現狀的“良藥”。

例如,在醫療領域,每個醫院都有不少患者健康狀況的信息,由於隱私保護等問題,醫院之間的數據不能夠取長補短。如何克服醫院之間的這種數據孤島問題?

讓機器學習在尊重隱私保護的前提下集成各方數據進行訓練。顯然,能夠讓參與方在數據不出本地的基礎上聯合建模的聯邦學習給予了答案。

也就是說,它對To C端((消費者))有吸引力,對於To B端(企業)則更有吸引力。這從聯邦學習的中文名字變化也可以看出。在早期國內將「Federated Learning」大多翻譯為「聯合學習」,現多稱為「聯邦學習」。

其中的區別是,如果用戶是個人,確實是把他們的模型「聯合」起來學習;而如果用戶是企業、銀行、醫院等大數據擁有者,這種技術則更像是將諸多「城邦」結合起來,「聯邦」一詞則更為準確。

這一名字的變化,也反映著聯邦學習的研究主體從理論轉向實際應用的變化趨勢。那麼數據如何聯合?如何使用?如何激勵更多的成員參與進來?

顯然,需要有一個標準來評判大家應用體系的好壞。既然是標準,能夠有權威的國際標準組織背書當然更有公信力。於是一觸即燃,2018年底由微眾銀行等企業帶頭向IEEE標準協會遞交了聯邦學習關於聯邦學習架構和應用規範的標準P3652.1。

過程:多方參與

2018年12月,IEEE標準協會批准這一標準的立項。

2019 年2月份,由微眾銀行楊強教授擔任工作組主席的IEEEP3652.1(聯邦學習基礎架構與應用)標準工作組第一次開啟,參會人數30餘位。這次會議也是聯邦學習歷史上的首次會議,會上確定了聯邦學習標準的基本框架。

4個月後,標準工作組的第二次會議在美國洛杉磯開啟,這次會議成員增添了Eduworks、doc.ai等國外企業。在會上,各工作組成員梳理並添加了各自領域內的聯邦學習典型案例。

第三次標準工作組會議是在澳門召開,不同於前兩次,這次會議重點聚焦聯邦學習各項指標的評估如何量化。值得一提的是,這次是在 IJCAI 2019 大會上,與之相伴而生的還有聯邦學習國際研討會的第一次召開,標誌著聯邦學習有了國際社區,“聯邦學習er”有了專門討論學習的地方。

第四次會議開始於11月份,著重對聯邦學習的安全測評與評級進行規劃,細化了聯邦學習在To B(企業端)、To C(用戶端)以及To G(政府端)不同情境下的場景分類。其中, 微眾銀行,騰訊雲,京東,華為,中國電信,小米,華大基因,中電科大數據, Eduworks等企業機構, 分別貢獻了聯邦學習在金融,市場營銷,城市交通,通訊與設備,醫療,教育及政府服務等方面的應用場景。

而第五次會議是採取了線上的方式,共有三十餘家海內外頭部企業與研究機構共同參與,反覆而細緻的討論之後,也完成了標準草案的撰寫。目前正提交IEEE標準協會(StandardAssociation, SA)投票表決。五次標準工作會議,歷時一年多,期間輾轉多地,即使遇疫情也沒有落下進度。

一項標準的成文涉及細節非常多,其中定義、概念、分類、算法框架規範、使用模式和使用規範等都需要反覆斟酌。不僅涉及到技術範式,如何在不同的場景下激勵各方積極參與的激勵機制也非常重要。

正如微眾銀行人工智能首席科學家範力欣博士在接受AI 科技評論採訪時候談到:“每個人的貢獻都不容忽視,雖然在討論過程中,大家討論很激烈,但是都希望標準更加完善,更加成體系,最後也達成了很好的結果”。所以,聯邦學習標準的“成文”,集成了“各家所長”,也是一次“聯邦學習”的過程。

意義:改變生產關係

無標準不協作,一場改變生產關係的多方合作

(雷鋒網)

聯邦學習標準的制定不僅影響生產力,更多的是影響生產關係。聯邦學習標準具體內容包括兩部分:一是技術體系,涉及如何在保護隱私的前提下,通過引入各方數據的參與來提高模型性能, 二是激勵機制,涉及如何通過分配公平合理的回饋給數據貢獻方, 來吸引更多的數據擁有方參與聯邦學習的聯盟。

簡而言之, 提高模型性能,無疑是提高了生產力。而激勵機制,則定義了數字經濟中的生產關係。具體來說, 激勵機制多采用經濟學原理和博弈論知識,其中理性人假設,嘗試對各個參與方定性,根據其利益最大化的“性格”,激勵讓更多的人參與。帕累托最優標準評判利益分配方式是否符合各方博弈最優解。通過不損失其他人利益同時增加系統中某些人利益的標準,讓各個參與方“心服口服”。

而“利益標準”不是唯一的衡量指標,對於聯邦學習來說,一個好的體系必須考慮到社會效益。將政府行為納入評價、激勵機制,在考慮個體效益的同時,平衡社會福利,借力福利經濟學的內容促進社會生產關係,提升社會福利的同時讓參與方承擔相應的社會責任。

所以,聯邦學習標準的激勵機制一方面讓更多人參與,另一方面, 也協調優化了參與方的利益關係,提升了整體的經濟效益及社會福利。由微眾銀行牽頭,海內外多家企業和研究機構合作參與制定的聯邦學習IEEE標準,與其他諸多國際標準的不同之處在於, 國外企業並沒有在標準的制定和決策中佔據主導地位。恰恰相反, 本著公平、公正、公開原則制定的聯邦學習標準, 吸引了眾多中國頭部和中小企業的積極參與.

而會隨著該標準在國際上的廣泛應用, 中國企業的影響力也會逐步外溢, 並提升中國企業在全球化環境中的話語權。

正如範力欣博士所談到的那樣:“微眾銀行之所以能夠領導聯邦學習的標準制定,除了楊強教授的個人學術魅力外,更重要的是在於微眾銀行所倡導的公平、公正、公開的聯邦學習技術開源平臺, 能夠吸引更多的國內外機構參與。”

下一步:克服困難

標準的好壞,重點還在於能否讓大家去遵守。

聯邦學習的國際標準是由中國企業牽頭髮起,國外企業和研究機構對聯邦學習標準的認識和接受會滯後一些。比如, 谷歌因為其本身只是面向C端,在自身數據充足的情況下,暫時沒有意識到B端業務應用的巨大前景, 也就沒有加入到標準制定的行列中。

但如Intel,IBM等國外企業都已積極參與到聯邦學習標準化的討論中來。進一步來看,與Facebook、谷歌、蘋果這些有“數據壟斷”意味的企業合作,讓其接受一項對大小企業都一視同仁的技術標準,這顯然是也是標準發起的願景之一。另一方面,聯邦學習的安全性, 也是該標準重點規範的一個方面。

無標準不協作,一場改變生產關係的多方合作

(雷鋒網)

對於存在個別參與方不誠實或者欺詐的行為, 聯邦學習標準不僅僅是從技術上檢測/預防這些惡意行為, 而且通過設計激勵機制來從動機上杜絕惡意行為。更加系統的後續配套工作如何推進?

範力欣博士談到:“有三個方向,第一個是國內的行業推廣,讓更多的國內有相關應用的企業首先加入行列;其次是面向國外,歐洲因為有GDPR法規的頒佈,對數據隱私保護更加規範,所以國際標準的推廣,會對歐洲重點關注; 最後是吸納更多To B、To C、To G的案例,讓測評體系更加完善”。

打鐵還需自身硬,標準制定公平、公開、公正的同時,吸納更多應用案例,增強標準公信力,才能讓更多企業加入進來。


分享到:


相關文章: