2020-03-12 17:25:00 聯邦學習

引言：為何要建立聯邦激勵機制？

隨著國內外對數據隱私的愈加重視，隱私條例的增訂，數據共享變得更加困難。於是，聯邦學習這一可以打破“數據孤島”的機器學習技術架構，逐漸被人們所熟知。

現有的工作大多樂觀地假設，當客戶端被邀請時，所有的參與方都將無條件地參與到聯合學習中。然而，這在現實世界中是不現實的，因為模型訓練會產生資源成本。具體來說，參與者加入聯邦需要對聯邦做出貢獻，把加密後的數據貢獻給聯邦，會產生數據成本和資金成本，且不同質量的數據方加入聯邦、不同時間節點加入聯盟的成本和效益可能不完全相同。因此，自私的參與方會不願意參與聯邦學習或者不願提供真實有效的數據。

此外，任務發佈者與參與方還存在以下信息不對稱問題：I)任務發佈者不知道參與模型訓練的各端可用計算的資源數量和數據大小；II)由於缺乏經驗，任務發佈者不知道各端的本地數據質量。

那麼，如何解決降低信息不對稱的影響，如何尋找一種適合聯邦學習的分配方案來吸引各方積極主動地加入聯邦學習呢？答案是激勵機制。

真實案例

FedEx聯邦快遞公司在初創階段時，為了打敗競爭對手，努力提升包裹的運送效率。然而他們遇到了一個巨大的難題，就是夜班的效率總是提不起來。管理層為此想了很多的辦法，對員工進行各種各樣的培訓，說教，甚至上升到道德高度，然而全都不奏效，為此傷透了腦筋。在種種努力全都失敗之後，他們突然意識到夜間的工作是按照小時計費的，員工並沒有任何動機去提升效率。於是，管理層很快把工資改為計件制，只要完成任務可以提早下班回家休息。問題瞬間解決了！大家爭先恐後的提前完成任務，或者早下班，或者幹更多的工作賺更多的錢。管理層看到這一結果，後悔為什麼沒能早一點想出來呢！

這個案例告訴我們，當我們能有辦法把自己的利益和別人的利益統一的時候，會產生出巨大的效應。比如激勵機制，一定要找到真正的痛點，方案才能奏效。因此，努力找到利益的統一結合點，是我們深度思考的方向。

多方實現“共同富裕”

而對於聯邦學習來說，數據聯盟模型中的核心問題是如何公平地對待參與者，通過綜合考量數據方對聯盟的貢獻以及參與聯盟的代價，評估收益分配能否補齊成本，即評估公平度目標。

因此，聯邦學習的解決方案是基於排隊系統為公平度目標來建模，通過保證排隊系統穩定，保證參與者等候全額補償的時間有限。另外，模型的公平性維度有三個：一是參與者所貢獻的數據為聯邦模型帶來的邊際效益越高，他所應得得補償也越高；二是“遺憾”度及等待時長應在所有參與者間儘量均勻分佈；三即在不同時間點之間，“遺憾”度及等待時長的變化儘量不要太劇烈。通過優化目標函數，實現最大化公平度。

基於此，聯邦學習激勵機制的利益分配方案是最大化數據聯盟的整體效用，同時最小化參與者之間在“遺憾”和等待時長兩個維度的不均衡。

相關論文選讀

在《Incentive Design for Efficient Federated Learning in Mobile Networks: A Contract Theory Approach》這篇論文中，作者就利用契約理論（Contract Theory）設計了一個有效的激勵機制。將本地數據的精度作為相關參數加入模型中，具有更高精度和提供更多數據資源的參與方可以獲得更多的獎勵。

在作者提出的場景中，具有無線通廣泛分佈的通信基礎設施(例如基站)可以充當具有聯邦學習任務的任務發佈者，而移動設備則是學習任務的數據所有者。具有先進計算和通信功能的移動設備不僅可以從移動應用程序中生成多種用戶數據，而且可以收集大量的傳感數據。並且，每個任務發佈者都設計契約項，以激勵具有高質量數據的移動設備加入聯邦學習。每個數據所有者都使用使用其本地數據生成的本地模型，更新迭代地訓練共享的全局模型。然後，數據所有者將其本地模型更新上載到任務發佈者，以更新全局模型。重複這個訓練過程，直到全局模型的精度達到一個預定義的、理想的值。

綜上所述，一個數據聯盟的可持續發展取決於其能否持續吸引高質量的個人機構數據持有人的參與。所以，如何建立一個長久有效的激勵機制，現如今也是聯邦學習研究中的一個重要課題，有待大家進一步的探究。

--END--

投稿或尋求報道：[email protected]