大數據時代,如何防止數據丟失、隱私洩露

大數據時代,如何防止數據丟失、隱私洩露

什麼原因導致數據丟失

數據丟失一般是指由於人為的、自然的、軟件的、硬件的原因導致原來可以讀取、可以訪問的數據不再可以訪問了。數據丟失也是金融系統大數據安全的重要敵人。

(1)人為原因

人為原因主要是指由於使用人員的誤操作造成的數據被破壞。如誤格式化或誤分區、誤克隆、誤刪除或覆蓋、環境的潮溼、經常不正常退出、人為地摔壞或磕碰硬盤等。

人為原因造成的數據丟失現象一般表現為操作系統丟失、無法正常啟動系統、磁盤讀寫錯誤、找不到所需要的文件、文件打不開、文件打開後亂碼、硬盤沒有分區、提示某個硬盤分區沒有格式化、硬盤被強制格式化、硬盤無法識別或發出異響等。

(2)自然原因

自然原因主要指由於自然災害造成的數據被破壞,如水災、火災、雷擊、地震等造成計算機系統的破壞,導致存儲數據被破壞或完全丟失,或由於操作時斷電、意外電磁干擾造成數據丟失或破壞。

自然原因造成的數據丟失現象一般表現為硬盤損壞、硬盤無法識別、磁盤讀寫錯誤、找不到所需要的文件、文件打不開、文件打開後亂碼等。

(3)軟件原因

軟件原因主要是指由於受病毒感染、零磁道損壞、硬盤邏輯鎖、系統錯誤或癱瘓造成文件丟失或破壞,對數據的破壞等造成數據丟失或破壞。

軟件原因造成的數據丟失現象一般表現為操作系統丟失、無法正常啟動系統、磁盤讀寫錯誤、找不到所需要的文件、文件打不開、文件打開後亂碼、硬盤沒有分區、提示某個硬盤分區沒有格式化、硬盤被鎖等。

(4)硬件原因

硬件原因主要是指由於計算機設備的硬件故障(包括存儲介質的老化、失效)、磁盤劃傷、磁頭變形、磁臂斷裂、磁頭放大器損壞、芯片組或其他元器件損壞等造成數據丟失或破壞。

硬件原因造成的數據丟失現象一般表現為系統不認硬盤,常有一種“咔嚓咔嚓”或“哐當、哐當”的磁阻撞擊聲,或電機不轉、通電後無任何聲音、磁頭定位不準造成讀寫錯誤等現象。

大數據時代,如何防止數據丟失、隱私洩露

如何防止隱私洩露

隱私洩露是一個老生常談的問題,自從有信息系統開始,就有各種各樣的隱私數據被洩露的事件出現。2017年6月2日,智聯招聘的兩名內部人員被檢方指控利用公司漏洞向某公司人事經理私自出售個人簡歷信息15.5萬餘條,涉嫌侵犯公民個人信息罪。

如果說智聯招聘的數據洩露是赤裸裸的隱私信息被販賣,很容易界定並確定法律問題,那麼在大數據年代,還有許許多多表面沒有隱私的隱私被洩露。2018年3月16日,Facebook 被曝在2014年有超過5000萬名用戶(接近Facebook美國活躍用戶總數的三分之一,美國選民人數的四分之一)資料遭“劍橋分析”公司非法用來發送政治廣告,部分媒體將其視為 Facebook 有史以來遭遇的最大型數據洩露事件,但 Facebook 方面否認這是一起數據洩露事件。Facebook的點贊行為可以透露出博主很多連家人朋友都不知道的隱藏信息。Facebook內部就一直通過分析點贊行為來實現廣告的精準投放。劍橋大學心理測量學中心可以從用戶點贊哪些帖子和新聞,分析出每個人的性別、性向、宗教信仰、性格是外向還是內向、政治理念是自由開明還是偏保守、是不是種族主義者、會給哪個黨的候選人投票等。

大數據時代,如何防止數據丟失、隱私洩露

或許你認為Facebook洩密事件與咱們沒有多大關係,但是另一個叫反向身份識別的技術,國內更多的稱為技術實名制,可能會讓你覺得隱私的洩露就在眼前。2006年8月,美國在線(AOL)公佈了大量的舊搜索數據以供社會研究。這些數據被作了精心的匿名化即用戶姓名和地址等個人信息都採用特殊的數字符號代替。儘管如此,《紐約時報》還是在幾天之內通過對搜索記錄綜合分析後,發現數據庫中的“4,417,749號”代表的是佐治亞州利爾本的一位62歲寡婦塞爾瑪·阿諾德。由此引起了公憤,導致美國在線的首席技術官和另外兩名員工被開除。由此是否可以得出這樣的結論:單純的匿名化對大數據可能是無效的。

大數據時代,如何防止數據丟失、隱私洩露

法律要求數據的收集者隱去資料提供者的姓名等信息,比如醫學研究中收集的患者資料,遵循慣例都略去了患者的姓名、年齡和性別,但反向身份識別技術使這種慣例失去了意義。有關研究表明,僅需根據郵政編碼、生日和性別,87%的美國公民可以被準確地識別身份。(文/龔才春)


分享到:


相關文章: