超1000份谷歌助手錄音信息遭洩露,語音識別再臨安全拷問

你是否想過,入主客廳的智能音箱正在悄悄記錄你的一言一行?又是否想過這些不被隱瞞的數據被心懷不軌的黑客利用?對於隱私安全洩漏的問題,我們真的無法避免了嗎?

智能音箱正藉助AI的力量入主我們每一個人的家庭,可最近,它卻惹出了不少麻煩。7月12日消息,據華爾街日報、比利時廣播公司VRT NWS等外媒報道,超1000個Google Assistant錄音信息遭到洩露,部分信息甚至能定位到個人。最令人不安的是,其中一些錄音是在Google Assistant根本沒有被“Hey,Google”激活短語激活的時候錄製的。谷歌在早間的一篇博文中證實了這一消息。同時,谷歌表示其安全和隱私響應團隊已經開始著手調查此事,並將對此採取行動。

超1000份谷歌助手錄音信息遭洩露,語音識別再臨安全拷問

這已經不是智能語音助手第一次洩露用戶個人信息,此前亞馬遜Alexa也被爆洩露用戶個人信息,且根據信息能夠知道用戶身份及賬戶。入主客廳的智能音箱正悄悄記錄用戶的一言一行,沒有築起安全堡壘的語音數據成為心懷不軌的黑客手中的利劍,也不知會在哪個毫無徵兆的瞬間刺向人們。

智能音箱自出現起就在接受重重考驗,先是百箱大戰,而後是隱私安全,智能音箱能成為萬物互聯的入口嗎?在智能互聯的時代來臨之前,重要的是如何將隱私安全問題提上日程。

語音識別漏洞頻出,個人隱私保護迫在眉睫

據知名調研機構IDC預估顯示,2019年全球智慧家庭設備出貨量將會增長至8.41億臺,2023年出貨量還會再度攀升至14.64億臺。2019年第一季度,全球智慧家庭出貨量增長37.3%,達1.69億臺。其中,智能音箱類設備的出貨量增長最快,達2320萬臺。

德勤年初發布的報告認為,2019年將有1.64億臺智能音箱出售,總營收同比增長63%;Canalys數據則顯示,年底全球智能音箱安裝量將達到2.079億臺,增幅82.4%。

雖然不同的機構預測數據略有出入,但都體現了同一個趨勢:智能音箱正在成為和智能手機一樣的通用智能設備,是最有可能開啟智能生活的入口。

亞馬遜的Echo系列與谷歌Google Home系列是全球出貨量最高的前兩大智能音箱設備,合計近1000萬臺。谷歌語音助手作為市場上較為成熟的語音助手之一,出現了此次的錄音洩露事件堪比業內的一大丑聞。

此前,大受歡迎的亞馬遜智能音箱Echo也被爆出類似問題。亞馬遜公司在世界各地僱傭了數千名員工,幫助改進Alexa語音助手,為其Echo系列音箱系列提供動力。這個龐大的團隊聆聽在Echo業主家中和辦公室捕捉到的錄音。這些錄音被轉錄、註釋,然後反饋到軟件中,亞馬遜團隊目的是消除Alexa對人類語言理解的空白,並幫助它更好地響應消費者的語音命令。

超1000份谷歌助手錄音信息遭洩露,語音識別再臨安全拷問

對此,亞馬遜的解釋是:他們嚴肅對待安全和隱私,只聽取了Alexa錄音的“極小樣本”。這些隨機樣本有助於培訓其產品的語言理解系統,從而提高Alexa的理解能力。谷歌的回應也大致相同:所有的錄音中只有0.2%會被審查且不與用戶賬號關聯,此舉同樣是為了改進算法。

2018年穀歌就已經為此付出了代價。據谷歌去年第四季度的財報顯示,谷歌的控股母公司Alphabet去年遭遇的歐盟監管方的罰款,比全年預計應繳的所得稅還要多。7月13日,美國聯邦貿易委員會要求Facebook支付約50億美元解決Cambridge Analytica數據醜聞引發的調查,這筆隱私違規罰款堪稱歷史之最。

任何搭載了人工智能語音識別功能的產品,用人工在某些節點上收聽並註釋信息,以便弄清楚發生了哪些類型的錯誤無可厚非。不管是智能音箱、兒童陪伴陪伴機器人還是帶攝像頭的掃地機器人,想要給予用戶智能體驗,促進產品智能升級迭代,需要結合數據調優模。於是,又回到了老問題,智能便捷的體驗與個人隱私之間矛盾應該如何平衡?

魚與熊掌難以兼得?智能體驗與個人隱私的雙向平衡

IDC報告顯示,2019年第一季度,中國智能音箱市場的出貨量達到1122萬臺,同比增長787.2%。Canalys報告顯示,2019年第一季度,中國市場智能音箱出貨量全球佔比51%,首次反超美國成為全球最大的智能音箱市場,今年底中國大陸智能音箱安裝數量將超過5990萬臺,將以166%的增速領先全球。

除卻谷歌與亞馬遜,中國的智能音箱設備聯接數量逐漸攀升,用戶體量也在逐漸提高。智能音箱的市場競爭根本就不是技術的競爭,而是它作為出口,企業如何在5G大規模商用之前提前佈局IoT的競爭。智能音箱雖生於客廳,但必定不會“屈居於”客廳。未來,連接智能音箱的語音交互還會發生在車裡、酒店、商業場所等空間,IoT設備的大規模爆發,語音交互的需求會更大,保護數據安全就變得更加重要。

人工智能技術的發展離不開數據的支撐,智能設備的智能化體驗的提升需要數據的最大化利用,因此數據採取以及數據徵用成為亟待解決的難題。在數據採集層面需要數據採集的合法化,對數據來源加以監管,或採取合法化手段如向用戶購買數據來源等等。

很多時候,用於人工智能模型訓練的數據可能會是敏感信息。例如人工智能在金融行業的技術應用,金融行業的安全重要性決定了用戶數據保管將至於最高級別,雲計算等技術將在實現數據的高級別保密的同時發揮數據的最大價值,以確保用戶的醫療數據不被洩露和濫用。

超1000份谷歌助手錄音信息遭洩露,語音識別再臨安全拷問

從法律層面講,讓合規應用有章可循或許是最切實可行的辦法。在沒有完善的技術能解決問題之前,使用法律法規以保護隱私和個人信息安全,是全球最普遍的做法。

2018年5月,歐盟頒佈了被稱為”史上最嚴”的《通用數據保護條例》(GDPR),對企業獲取及使用數據的方式進行了嚴格的限定。並且,GDPR對違法企業的懲處力度也是空前的。我國的《個人信息保護法》目前仍處於制訂中,無論是人工智能研發者、服務提供者還是使用者,都還對應用邊界有著不夠清楚的認知。

在加快立法的同時,還應該保護我國人工智能的發展土壤。保護個人隱私安全是基本要求,同樣也不能忽略人工智能對數字經濟增長的巨大貢獻。因為,人工智能專家學者、倫理學者、監管人員、公眾代表都應該積極參與,儘快制定符合國情的法律法規。

人工智能技術的落地實屬不易,放眼國內,人臉識別技術早在2014年就已經超過人類,直到2018年才算實現大規模應用場景的落地,語音識別以及交互亦是如此。有多少廠商能拒絕得了用戶數據的誘惑?又有多少消費者能保證自己絕不會被黑客攻擊?只希望不寒而慄的數據侵犯不會在現實中發生。


分享到:


相關文章: