萬向區塊鏈大會正式開展——白碩老師講解背靠背數據協同

備受關注的上海區塊鏈周--“萬向區塊鏈大會”於9月7日晚19點正式拉開帷幕,區塊鏈第一人、阡尋科技董事長白碩、以太坊創始人Vitalik Buterin、比特大陸CEO吳忌寒等行業知名大咖出席了本次大會。11日在峰會現場的演講上,白碩老師結合就職上海證券交易所CTO與中國科學院計算技術研究所時的經歷,分析了區塊鏈技術的發展形勢與遠景,對區塊鏈技術與人工智能技術的應用做了深入淺出的解析,並重點介紹了“背靠背協同機制”如何解決“數據孤島”問題。

萬向區塊鏈大會正式開展——白碩老師講解背靠背數據協同


在當前環境下,數據之間的藩籬造成了“數據孤島”的格局,阻礙了數據的流通。如何在實體信息不洩露的情況下,實現信息的無礙流通,成為目前的一個難點。對此,白碩老師提出了“背靠背協同機制“的解決方案,並運用“背靠背求交集”與“背靠背訓練模型”兩個案例來闡述該機制的實際應用。

萬向區塊鏈大會正式開展——白碩老師講解背靠背數據協同

痛點案例1:兩個機構合作,一個機構是廣告商,一個機構是手機商。廣告商希望跟手機商合作,手機商希望和廣告商合作,如何把雙方共有客戶的手機號碼求出來,同時每一方不知道對方手機號碼的全集。

解決方案:

進行某種擾動或者加擾。A先加擾,給對方,對方加擾,給智能合約。B也是,先加擾,再給A加擾,再給智能合約,由智能合約來求加擾之後的數據交集。大家會問,加前後的順序是不是有問題呢?我們說,只要加擾的算子在數學上叫做可交換的,其實它就是成立的。用這種方法的時候,只要算子足夠安全、足夠可靠的時候,就可以利用它做背靠背求交集的工作。這種方法,可以支持一些不希望透露全集的雙邊和多邊合作,各自只要部署各自的智能合約節點,部署各自的加擾軟件模塊就可以把這個事做下來。

痛點案例2:多家醫院之間,每個醫院各自有某種病的影像數據,這些影像數據合在一起,會訓練出一個更好影像識別模型。但是各醫院把影像數據當寶貝不願拿出來,在不拿出來的情況下,傳統辦法看起來,就沒有辦法做相當於數據匯聚效果的模型訓練。

解決方案:

利用生成假數據的方法,把假數據和對方真數據混合的方式。白碩老師以聯合中科院計算所開展的課題為例,對簡單數據集數碼0到9的識別。把0到9分成兩組樣本,一組只有0到4的訓練數據,另一組只有5到9的訓練數據。初始大概是這個樣子的識別率。當我們進行傳播之後,假樣本傳播之後,把對方擅長、自己不擅長的部分全學出來了。自己0到4是90%的樣本,5到9是10%的樣本,這樣的狀態很差。經過學習,會學得很好。在這個學習過程當中看數據傳輸的量,比較了一下,傳模型的方式和全過程傳假樣本,就是不停地生成假樣本、傳假樣本的方式相比較。最後一種,用一個樣本池固定了,樣本池後面只做它的標籤變化部分的傳輸。這裡面可以看到,就是最後樣本池的方法,用非常少的數據量,就可以學到相當高的精度。

白碩老師總結道:數據在藩籬裡面分佈並不可怕。只要我們有一個可以信任的東西,就可以把數據通過信任的服務,把它給組織成一個假裝數據聚合的場景。雖然不聚合,但是假裝聚合,這個假裝聚合的場景和真聚合的場景是非常接近,背靠背協同是一個真實的需求,它在人工智能、神經網絡訓練領域可以起到很好的作用,這也為我們今後在區塊鏈的實踐中增添了一種新的選擇。

智子社區秉承白碩老師用技術讓情懷落地的理念,利用人工智能與區塊鏈技術打造了集投資者教育、智能投顧、區塊鏈項目評級排名於一體的一站式數字資產服務的智慧平臺,目前智子社區已經與加勒比自由貿易區籤立戰略合作協議,成為了其數字資本市場監管的唯一指定官方技術合作方,未來智子社區將在投資者保護和教育上投入更多的力量,助力鏈圈生態的健康發展。


分享到:


相關文章: