圓桌共話:如何衝破數據高牆,連線“數智未來”?

自從數據正式被納入生產要素,聯邦學習、區塊鏈隱私計算等新算法湧現,業界圍繞算法數據的討論不絕於耳。如何尋求數據安全與隱私保護的平衡點?如何把握智能數據與區塊鏈的融合趨勢?

8月25日,SIGKDD·SDBD2020 第二屆智能數據和區塊鏈應用國際研討會在線上圓滿舉辦。圓桌會議作為重要劇目壓軸登場,上下半場,集結業內知名專家學者,熱議前沿話題。


圓桌共話:如何衝破數據高牆,連線“數智未來”?


1

如何衝破高牆,實現數據價值共享

圓桌會議上半場主題為“數據賦能場景,如何驅動產業創新?”由新加坡管理大學終身教授 朱飛達主持,特邀科大訊飛大數據研究院執行院長 譚昶、普元信息大數據產品線經理 臧一超、上海萬向區塊鏈股份公司副總經理、萬向區塊鏈實驗室負責人 杜宇、鍩崴科技創始人 王爽 展開深入探討。

朱飛達教授表示,數據經濟經歷了三個階段。第一階段數據只是商業活動的副產品,人們更多用數據理解過去。第二階段是大數據與數據經濟的興起,數據被少部分企業壟斷而得利。第三階段則是數據驅動經濟,數據成為驅動所有機構組織的共享資產。

從聯邦學習、遷移學習到區塊鏈隱私計算,算法也未曾放慢腳步。那麼,究竟是數據先行還是算法先行?

在實踐層面 譚昶表示算法和數據同等重要,原始數據的獲取是進行有效算法的基礎,反向數據依賴高質量算法加工得到結果才能落地應用場景。

臧一超認為數據和算法並駕齊驅,基於數據質量的重要性,我們會進行數據應用全生命週期管理。過程中,通過數據治理結合算法構建數據服務平臺,形成企業內部的數據生產力。

杜宇從企業自身角度出發,認為在工業板塊中數據更為重要,各類工廠也在積極進行數字化轉型;站在金融投資視角,算法更為重要,人工智能加上人類智能才能做好投資。投資數據基礎單薄的創新型企業,考量的是基於算法解決實際問題的產品服務能力。

王爽持有的觀點是數據和算法同等重要,但是不同場景下的醫療場景重要程度有所不同。如新藥研發領域,美國FDA批准通過現有的真實世界證據研究的數據支撐推進新藥研發,數據重要性不言而喻;如智慧嬰兒輔助診斷領域,ImageNet的引入帶來分析精度的提高,但模型的精度離不開數據支撐,需要隱私計算技術打通各方數據源,二者缺一不可。

與此同時,未來創新型企業的算法優勢受到數據共享、大廠開源工具代碼的衝擊。開源代碼使開發者們得以站在巨人肩膀上前進,而初創公司原有的技術能力或失去市場優勢。

與會嘉賓分別就開源潮流及其對數據生態和技術未來發展的影響展開對話。

大廠將核心的能力開源是推動產業創新的非常好的手段,如果說是有競爭的話,也是非常良性的競爭。臧一超表示公司本身大量引入開源的架構並基於開源的架構做自主創新,形成標準的產品後加入開源的組織。商業化公司利用開源補技術短板,商業化包裝行業解決方案回饋開源社區,起到相互促進的作用。

專業的人做專業的事,譚昶坦言開源本身對於專業人員是好事,從業人員應積極為開源社區貢獻代碼。作為IT、 AI企業,源於開源又高於開源,將數據加工成專業化商業化的軟件投入市場,可構建良好的商業生態。

王爽對於開源是非常擁護的。他認為開源可以建立信任的,內部架構對於外界是透明的,外界可以充分信任隱私保護構架的源起數據保護的,這是建立信任的過程。此外開源可以幫助技術普及,更快深入客戶。涉及具體的應用場景,需要商業化運作或專業團隊進行定向的優化支持。

參與者共同加入、做大社區,開源代碼與區塊鏈的精神氣質最為相符。杜宇積極擁抱開源。他表示區塊鏈從比特幣一開始都是開源的,極大推進行業發展週期,通過技術方式建立信任實質都是源自開源的基礎,受到專業人士的歡迎。商業角度而言,開源消除了行業技術壁壘,企業可將精力轉移在解決商業問題和商業模式探索上。

綜合來看,對於計算機行業,大家共同關注的問題是如何讓數據治理使用更加高效;而在非計算方面,數據使用成本等方面鮮有關注,這也引起更全面深入的思考。我們在行業間或公司間,或者個人用戶與商業團體之間數據的流通、分享、租賃真正的障礙在哪裡?

杜宇表示目前而言數據孤島是最大問題。區塊鏈倡導開放共享,從公有鏈開始所有的交易記錄全部開放透明,而實際落地,企業、金融機構不會將真正的交易記錄與商業機密暴露出來,個人隱私數據不願公開。政府不同部門、政企之間豎起數據高牆,痛點在於如何打通。區塊鏈加隱私計算技術可以實現產業上下游的數據有效協同共享。

臧一超以智慧園區為例,為中小企業提供數據服務必然涉及稅務等個人隱私與數據安全問題,那麼,基於目前技術理念如何豐富數據服務生態是關鍵所在。

譚昶認為數據作為新的生產要素,國內相關法律法規以及數據市場的基礎設施亟待完善。只有這樣,企業才能實現互信條件下的數據交換。

王爽則認為技術層面區塊鏈加隱私計算能夠實現醫藥領域的數據溯源,法律法規層面積極推動個人隱私保護法、食品安全法及相關國家標準制定,共同實現數據安全有序流動。

2

跨洋巔峰對話,緊跟數智融合趨向

圓桌會議下半場主題為“釋放數據價值,區塊鏈有何妙用”,由算力智庫創始人 燕麗主持,KILT Protocol 創始人Ingo Rübe、Phala Network CEO佟林、樹圖區塊鏈Conflux聯合創始人 伍鳴、 Chainlink中國社區總監 Philip 共同參與。

遠在德國的Ingo Rübe開啟跨洋對話,他介紹道,團隊三年前啟動波卡生態項目KILT Protocol,並專注基於區塊鏈的“可驗證數字憑證”功能開發,實現信任的傳遞

佟林介紹團隊基於波卡的跨鏈協議、集成跨鏈協議後,為很多的區塊鏈和平行鏈來提供隱私計算的服務。簡言之幫助區塊鏈打上馬賽克,並且實現數據的可用不可見。

伍鳴表示團隊主要通過設計創新的賬本結構及共識新解決現有公鏈性能、共識算法瓶頸的問題,提升以太坊吞吐率,縮短交易確認時間;通過生態兼容,減少或者解決以太坊開放擁堵問題。

Philip希望將預言機(中間件)部分做到去中心化,因為數據源分散,從多個數據源多個節點獲取數據上傳到區塊鏈,保證去中心化應用的安全可靠,並且不會被攻擊。

在區塊鏈和數據的結合層面,嘉賓從各自所在的領域就變化和認知的作了闡述。具體來看,區塊鏈和數據未來可能產生何種內在聯繫,協作的業務場景端本身如何發揮作用和連接。

伍鳴認為區塊鏈本身是可靠的分佈式賬本,可以作為可靠數據的載體,承載具有最大價值的數據,如金融信用數據,因此區塊鏈和數據密不可分,區塊鏈承載的數據還能實現通證化。

佟林則指出,目前鏈上的數據種類和數量遠小於鏈下數據。鏈上數據的特點是可見即可用,不可見(加密數據)則不可用,但利用隱私安全計算可以實現鏈上數據的可用不可見。

Philip表示以太坊為代表的第二代區塊鏈,實現了圖靈完備的智能合約,它讓區塊鏈從數據結構變為世界計算機。團隊希望推動智能合約的落地應用,為外部數據準備,可使區塊鏈行業和外部數據結合更為緊密。

Ingo Rübe認為區塊鏈未來應用面臨的最大挑戰是數據保密性,如Google或Facebook的互聯網巨頭形成大數據孤島,數據洩露風險推動監管完善。另外數據高牆林立,對創新型企業服務能力提出更高要求。

實際上,區塊鏈在處理數據或是提煉數據價值的過程中面臨多維度挑戰挑戰與難點在哪裡?與會嘉賓各抒己見。

Philip認為儲存、傳輸、挖掘隱私,對於提煉數據價值都很重要,數據的傳輸是要優先於其他方法去實現,所以挑戰是在保障數據的安全性以及隱私性前提下,將數據準確上鍊。

Ingo Rübe則從法理上思考了區塊鏈的數據安全性——到底怎樣才算安全?GDPR在2012年制定時並未考慮到區塊鏈,但區塊鏈上的數據加密歸根結底是數學問題,終究可以解決,因此仍應先聚焦立法問題。


文章所載觀點僅代表作者本人

且不構成投資建議

敬請注意投資風險


分享到:


相關文章: