通過聯合機器學習保護隱私數據

這些步驟可確保考慮每個數據源的偏差,並準確地說明問題所在。例如,對來自世界各地衛生機構的心臟病數據進行聯合模型的訓練可以消除在對一個國家的國內數據進行訓練的模型中發現的種族和性別偏見。

通過聯合機器學習保護隱私數據

保護隱私的需要

如今,對隱私的需求從未像現在這樣迫切,數據的價值可比作石油,被認為是個人最重要的資產。個人生成的數據類型從看似無害的細節(如零售偏好)到高度敏感的信息(如病歷),甚至是可能會影響的政治觀點。

呼籲提高數據安全性的一種可能的答案(越來越受到關注)是隱私保護機器學習(也稱為聯合學習,或聯盟學習)的發展。在較高的層次上,聯合學習是一種機器學習方法,可以協同訓練模型,並旨在通過使用差異隱私和分散數據來防止數據洩漏。因此,聯合學習允許個人數據保持匿名,同時幫助建立強大的模型。

用最簡單的術語來說,聯合學習不會將您的數據發送給第三方,而是在加密每個步驟的同時將模型引入了數據中。


專欄

深度學習入門系列講解

作者:AI火箭營

199幣

309人已購

查看


機器學習的未來是協作

隱私並不是使用聯合學習來解決的唯一問題。它也消除了目前阻礙我們構建更高精度模型的障礙。這樣的問題之一是,沒有中央資源可以提取訓練這些模型所需的所有數據。訓練覆蓋整個情況的模型將需要一系列數據類型,通常分佈在各個機構中。

例如,為了捕獲個人的財務狀況並提供洞察力,必須對在多個銀行和信貸服務,在線零售行為和付款習慣中發現的數據進行訓練。為了增加複雜性,同一公司各部門之間的數據傳輸可能會面臨與管理或隱私相關的問題。

通過聯合機器學習保護隱私數據

聯合學習為各方面各不相同的各方提供了機會,以協作方式訓練比在單一數據源上訓練的模型更準確的模型。

聯合學習

高層次的聯合學習可以分為三個步驟:

1. 共享的全局機器學習模型在可用數據上進行訓練,並部署在分散的平臺上。

2. 將模型下載到邊緣設備,可以是智能手機,筆記本電腦或其他智能設備,然後使用其包含的數據更新模型。

3. 更新(例如,計算出的梯度)將被加密併發送回服務器,在該服務器上,來自多個設備的更新將被平均並用於改善主要共享模型。

4. 然後,共享模型由邊緣設備下載,從而使模型的數據貢獻者和策展人受益。

通過聯合機器學習保護隱私數據

這些步驟可確保考慮每個數據源的偏差,並準確地說明問題所在。例如,對來自世界各地衛生機構的心臟病數據進行聯合模型的訓練可以消除在對一個國家的國內數據進行訓練的模型中發現的種族和性別偏見。


專欄

機器學習From Zero to All

作者:AI火箭營

199幣

164人已購

查看


聯合學習的組成部分

創建一個圖表,以非常高的層次說明組成聯合學習的各種元素:

通過聯合機器學習保護隱私數據

構成聯合學習基礎的三點是:

隱私,數據結構和模型類型。隨著不斷變化的景觀,增加複雜性和增加深度的新研究進一步擴展了這些觀點。

1. 隱私 -隱私是聯合學習的最重要方面。無論數據的提供者是公司還是個人,隱私保護都可以增進協作的信任度,保護敏感數據,並確保個人的合法權利。

2. 數據結構 -聯合學習根據模型在其上訓練的數據結構進行分類。數據結構類別有以下三種類型:水平聯合學習、垂直聯合學習和遷移學習。這些結構描述了數據的組織方式,特別是數據集是否共享相同的特徵空間,或者它們是否共享相同的樣本。這兩個描述分別涉及水平學習和垂直學習。

3. 模型類型 -簡單來說,要訓練的模型是神經網絡還是統計學習模型。這將取決於數據類型,數據量和所需的預測結果。

通過聯合機器學習保護隱私數據

聯合學習數據結構圖

未來發展方向

儘管聯合學習可能成為解決跨多個設備的大量數據的問題的解決方案,但仍然存在一些障礙。

1. 資源瓶頸-這些問題包括在訓練期間連接的IoT設備的電池壽命不同的情況,這可能導致某些設備掉線。設備無法連接wifi,3G或4G網絡等通信差異將影響網絡。最後,網絡上的設備之間的硬件規格(例如內存和CPU)可能會有所不同。

2. 數據差異—每個設備上的數據在質量,數量和一致性上都會有所不同。例如,如果收集用於人臉識別的圖像數據,則圖片中的照明,面部的多樣性以及所貢獻的數據量將影響本地訓練的模型。這些局部模型的質量差異很大,最終會影響全局模型的整體質量和準確性。


專欄

基於深度學習的目標檢測

作者:AI火箭營

599幣

21人已購

查看


分享到:


相關文章: