數據“黑市”流轉,加密算法如何解痛?

數據“黑市”流轉,加密算法如何解痛?

文|武旭升

你並沒有買房需求,房屋銷售的電話動不動就打進來,話筒裡的甜美聲音直接叫出了你的名字。

你連澳門都沒去過,號稱要“改變你人生”的博彩推廣短信就發到了你的手機上。

你只是在淘寶上瀏覽過一條碎花洋裙,登陸微博時,各種裙子的熱賣信息出現你的瀏覽頁裡。

大數據時代下,信息洩露和數據畫像下的精準營銷,時不時讓人有一種隱私被侵犯的危機感,無可奈何又無處躲藏。

徐茂桐也經常會被垃圾電話和短信騷擾,成為區塊鏈項目ARPA的創始人之前,他曾在復星銳正資本擔任高級投資經理,參與過很多金融科技和大數據領域的投資。

相比普通人,他更瞭解數據交易市場供需不平衡的痛點,這一痛點催生了獲取暴利的“中間商”。而牟利的刺激下,可複製的數據極有可能在“黑市”中流轉,成為不法人員的賺錢工具。

當區塊鏈技術成為熱點時,徐茂桐最先想到的應用方向就是數據交換,“有沒有一種算法可以與區塊鏈結合,讓數據不曝光。”

MPC密碼協議讓他們看到了可能性,它是一種專門針對數據安全的多方計算解決方案,不斷迭代下,ARPA誕生,試圖結合區塊鏈來解決數據隱私的問題。

數據交易市場的偽命題

“在一家星級賓館的套房裡,幾個男人看著一小堆被徹底砸爛的計算機硬盤,露出了輕鬆的笑容,這意味著他們的任務已經徹底完成。”

2018年1月,《財經》在報道中國數據交易被黑市壟斷的現象時,用上述文字描述了國內一家互聯網電商公司和一家保險公司交易大數據的場景。

雙方在交易完成後,對於包含源數據的硬盤,不僅做格式化數據刪除,還要當著彼此的面進行物理損壞,互相見證拷貝出的數據僅一次性使用,不可能再外洩。

這樣的場景在徐茂桐看來,並非數據交易市場上的高頻行為,“更普遍的情況是大多數公司不願意將自己的數據拿出來交易,更不可能共享。”

在創立ARPA之前,徐茂桐在VC投資基金復星銳正擔任高級投資經理,從業過程中看過很多做科技金融和大數據方面的初創公司和項目,深知數據對於不少互聯網企業來說已經成了基本命脈。

數據“黑市”流轉,加密算法如何解痛?

“比如我們之前投的做現金貸的公司,他們有自己的數據,也有風控需求,希望跟其他公司做數據交換,不過他們不能把自己的黑名單(數據)分享給別人。”徐茂桐介紹,這種“不能”既有法律的要求,也有行業競爭的考慮。

2017年6月1日,《網絡安全法》正式施行,單獨成章(第四章)為保護用戶信息提供法律依據,以法條的方式規定,“任何個人和組織不得竊取或者以其他非法方式獲取個人信息,不得非法出售或者非法向他人提供個人信息”。

而人們在使用一些互聯網產品時,手機號、身份證號等個人信息和消費記錄等等都成了企業的數據。按照法律規定,這些帶有個人信息的數據禁止交易。

企業雙方無法交易數據,但又存在市場需求,數據中介順勢而期。既有如數據堂這樣的數據服務提供商,也有如貴陽大數據交易所這樣的政府部門和國資背景的平臺。中間機構對數據做處理後供有需求的企業獲取。

“我們瞭解,像貴交所每年可能有幾千萬的抽成收入,從這個數字看,數據交易是個偽命題。”徐茂桐認為,當企業不願拿出自己的數據時,合法途徑下的數據流通就無法完成,數據交易的商業模式也就無法成立。

另一大痛點是數據價格不菲,“比如,數據交易中介公司會把收集來的黑名單拿過來整合,提供給有需求的B端客戶,客戶需要數據時都過來找他們查,他們不產生數據,但是從中獲取很大一部分利潤,1毛錢的一條信息可能會買到1塊錢。”

高額交易費用也讓數據交易形成黑色產業鏈,包含個人隱私的數據具有“可複製”的特點,它們在黑產中一次又一次被轉賣。

貴陽大數據交易所執行副總裁朱國輝在接受《財經》採訪時表示,“如果說我們正規軍提供一條身份證驗真服務成本就要一塊錢,那麼數據黑產從業者的報價只有幾毛錢,切走了很大一部分市場。”

“多方加密計算”打通數據流通

徐茂桐認為,數據無法自由流通起來的原因是的所有權和使用權無法綁定在一起,“數據可見即所得。”

痛點之下,他的思考是“怎麼才能讓你只用一次這個數據,但你又看不到這個數據,或者說你沒有辦法來複制傳播”。

2017年,區塊鏈突然被業內捧出了“技術革命”的意味。徐茂桐注意到它時,第一個想法是能否用來做數據交換,“重點是用區塊鏈技術來解決數據安全的問題。”

這個設想在區塊鏈創業領域並不新鮮,用區塊鏈技術做數據安全嘗試的項目諸多。

徐茂桐也注意到了這些項目,“當時看到行業裡的項目都沒有從根本上解決問題,無論在傳輸的過程中怎麼加密,但是使用者只要拿到數據,他就可以看到別人的隱私,能複製後在鏈下分享。”

2017年底,他團隊開始嘗試各種加密算法,試圖尋找“數據流通但不曝光”的解決方案。

數據“黑市”流轉,加密算法如何解痛?

去年4月,MPC密碼協議(Secure Multi-Party Computation)開始作為一種嘗試。這一秘密學解決方案翻譯過來叫做安全多方計算,這是一種保護數據安全隱私的算法,使用這種算法加密數據後,任何第三方都無法查看,但是可以分析和調用數據。

MPC密碼協議也就成了區塊鏈項目ARPA“最硬核”的技術實力。

徐茂桐解釋,MPC協議的運算過程是分佈式的密文計算,“整個過程不解密,作為結果只給到某一方,可以保證數據源的隱私。”

今年2月,MPC的測試網絡上線,並在工程意義上完成了場景驗證。

徐茂桐舉了一個具體的場景案例。比如,一家銀行想要查詢張三在不在別家銀行的黑名單裡,在隱私保護的要求下,張三這個名字不能暴露,如果他真的在兩家銀行的黑名單上,銀行的名字也不能暴露。

這一場景下,多家銀行可以聯合在一起,利用MPC來做一次密文搜索,“整個過程中,數據不需要提供給任何一方,都在銀行自己的服務器上。我們會用一個密雲分享的方式,將要搜索的內容和被搜索的庫做一個數據預處理,這些處理是密文的,以碎片的方式進行運算,得出他們最終想要的結果——張三在黑名單上。”

在大數據時代下,數據即權利的趨勢已經越來越明顯。徐茂桐認為,ARPA的MPC密碼協議可以實現數據所有權和使用權的分離。

當前,ARPA正在幫中國信通院,制定安全多方計算MPC的國家標準,協作方中有百度、阿里巴巴的螞蟻金服,“最近騰訊也加入進來了。”

在商業規劃上,徐茂桐和團隊的規劃是先2B再2C。“目前的應用是企業級的,比如金融行業的黑名單共享,銀行、保險行業的聯合徵信等等。”

ARPA更長遠的打算是讓普通人能通過他們的產品實現個人的數據保護和利用,“比如有廣告主想要一個人數據,他需要向用戶支付Token才能獲取數據調取的權利,當然,這個數據仍然是加密的。”


分享到:


相關文章: