用交叉驗證識別謠言,可能你都做錯了!

我們本來就處在一個信息爆炸的時代,加上最近進入全球抗疫的非常時期,雖然國內疫情控制較為穩定,但我們仍然密切關注國外疫情的變化。在緊張的氛圍中,接收的信息量更是大幅暴增。

每天盯著手機,被各路信息密集轟炸,肺倒是沒拉警報,視力衰減也不打緊,但是感到腦子已接近宕機,被“百家爭鳴”的信息擊打得昏天黑地,辨不清真偽,顛倒了黑白,甚至開始懷疑人生。這樣下去,簡直懷疑自己沒染上肺炎,卻先得了“腦炎”。

在持續密集的信息轟炸中,如何保護大腦的“安全”?

用交叉驗證識別謠言,可能你都做錯了!

除了筆者在《如何識破謠言?區分是觀點還是事實》一文提到的第一件武器“區分觀點和事實”外,加強裝備的其他武器還有什麼?

以信息論為理論基礎提煉出的一件利器可以幫你識破謠言,或者防止被信息誤導,它能利用信息,讓你看清真相。

這件利器就是——交叉驗證。


關於交叉驗證,你可能會說:這沒什麼稀奇的啊,不就是同一件事獲取它不同緯度的信息來進行相互檢驗佐證嘛。

如果你認為這件利器很容易上手,那麼你可能只練了個皮毛,甚至都練錯了!

  • 那麼,真正的交叉驗證是什麼?
  • 如何正確使用交叉驗證識別謠言?
  • 交叉驗證還能用來幹什麼?


【什麼是交叉驗證?】

交叉驗證,簡單說來就是為了核實一個事物,而從多個維度獲取信息進行相互驗證的方法。

交叉驗證的理論基礎來自信息論。

用交叉驗證識別謠言,可能你都做錯了!

信息論由香農博士在1948年創立,他提出了利用信息消除不確定性。信息論被人們稱為隨後的半個多世紀裡,特別是今天,最重要的方法論。如今熱門的大數據思維,從本質上講,就是這種方法論的一個應用。

信息論的相關要點:

信息可以衡量,但不是用重要性,而是用信息量。

當“信息量”覆蓋“不確定性”時,“不確定性”就消失了。

【為什麼交叉驗證是件利器?】

相同的信息使用兩次,不會產生兩倍的效果,甚至第二次使用它就沒有用了,也不會因為你使用一萬次,而改變結果。

而且,絕大部分時候,一個維度的信息是很難消除所有不確定性的, 而解決這個問題最好的辦法,不是把那個維度的信息搞得更準確,而是要用其它維度的信息進行交叉驗證。

就好比解方程,要檢驗一道題是否做對了,如果順著原來的思路把解題的過程再檢查一遍,通常是很難查出錯誤的,最有效的方法是把方程的解代回到原來的方程中,如果方程兩邊相等,就說明解對了。

這就是交叉檢驗的原理和優勢所在。

【如何使用交叉驗證識別謠言?】

一、常見誤區

【誤區1:以為“大量數據”就是“大數據”】

信息量的大小不在於長短,而在於提供了多少新的內容,或者消除了多少不確定性。

就好比最近包括權威媒體在內的各種媒體都在頻繁提醒民眾“不要信謠傳謠”,如果沒有告訴我們哪些是謠言,或者不教我們如何識別謠言,那這樣的信息即使發送得再多,對我們來說也沒有什麼信息量。


【誤區2:以為不同維度的信息都是等效的】

如果兩種不同緯度的信息雖然可以交叉,但不正交,重合面積大,那麼這兩種信息交叉驗證的作用就降低了。

比如微信群裡看到了這樣一則文字消息:

用交叉驗證識別謠言,可能你都做錯了!

為了核實信息的真假,我們還收集到了其他微信群轉發的一張藥店張貼告示的照片:

用交叉驗證識別謠言,可能你都做錯了!

照片和文字這兩種信息能做一個有效的交叉驗證,達到我們想要的效果嗎?

明顯不行,因為這兩種信息其實來源渠道都是微信群,無法驗證出處,依然“重合面積”較大。

而這時,微信群內的個別群友去附近的藥店實地觀察,反饋的信息對我們就很有參考價值,用這個維度的信息進行交叉驗證,效果就會提高很多。

用交叉驗證識別謠言,可能你都做錯了!

【誤區3:忽略了信息源的質量】

信息源質量差,信息的準確度就低,那麼這樣交叉驗證效果也會大打折扣。

最近網傳的謠言很多都是一些自媒體發佈的,如果用於交叉驗證的信息也是來自於這些媒體,那驗證結果可想而知。現在是一個人人都是自媒體的時代,這確實給我們甄別信息源的質量帶來了一定的困難。不過有一個簡單的辦法,就是要對那些社交個人賬號,尤其是沒有個人信息或使用痕跡的三無賬號保持高度警惕。雖然大機構發佈的信息也不能保證永遠正確,但是遠比這些三無賬號要靠譜得多。

另外,也要避免過於依賴“專家”提供的信息。最近聽到很多人建議,非常時期專業的事就該交給專業的人,就該多聽專家的話。但是,我們也要學會區分,少聽甚至不聽那些“非權威”專家的話,因為這類專家提供的信息準確率就比較低,非但沒有提供能夠減少“不確定性”的“信息量”,甚至還會產生誤導,進一步增大不確定性。


二 、使用最優信息組合

交叉驗證的最優信息組合是垂直正交的信息。

因為當兩個不同維度的信息正交時,它們的共同作用能夠最大程度地降低不確定性。直觀來看,就是兩個正交的信息的重合面積最小,不同維度的信息發揮的作用最大。

用交叉驗證識別謠言,可能你都做錯了!

如何找到正交的信息?

1、要從不同的信息源獲取信息

比如:

今天我們驗證一個信息的真偽,不是去看不同媒體的信息,因為很多媒體的文章也是相互抄襲,相當於仍然是同一緯度的信息。

2、要避免使用相互嵌套的信息

即使這些信息是從不同的信息源獲取的,但因為這些信息相互嵌套或相互包含,可能會形成“貪吃蛇”的死循環,失去相互驗證的作用。

比如:

“瑞幸咖啡遭渾水89頁做空”的新聞引發熱議,”渾水研究“直指瑞幸財務、數據造假。我們不對這個事件進行評論,僅對如何驗證財務、數據是否造假進行探討。假設你是一名審計師,有機會審計瑞幸咖啡財務數據的真實性,如果只將其財務報表和內部財務憑證進行交叉檢驗的話是肯定不行的,因為財務報表中絕大部分的信息本來就來自內部財務憑證,而且這些都屬於內部佐證資料,本身就有大部分信息是相互嵌套的。所以,審計人員通常還要獲取外部佐證資料,比如實施外部函證(向上下游等外部單位發函核實信息)等程序,以實現更有效的交叉檢驗。


用交叉驗證識別謠言,可能你都做錯了!


3、要站在不同視角獲取信息

人類視野和思維有天然侷限性,所以在進行交叉驗證的時候,從不同的視角獲取信息就顯得尤為重要。我們要努力克服這種侷限,時時提醒自己換個角度看待同一事物。

比如:

一個朋友邀你投資入夥他的餐飲生意,聲稱他的生意很賺錢。你查閱了他生意的賬務資料,也測算了利潤率這些盈利指標後,發現確實是個賺錢的生意。但你還可以換一個角度,將這些指標和當地的行業平均水平進行比較,或者去這個餐廳實地觀察生意情況,也許就能發現異常或不合理的地方。


三、避免被“病毒”信息誤導

“病毒”信息的三大特徵:

1、聳人聽聞,信息不一致

比如:

今天隨處可見掛羊頭賣狗肉的標題黨文章,標題與內容缺乏一致性,沒有多少有效信息量,甚至是“病毒”信息。尤其標題裡有“驚爆、驚呆,速看,必須轉,馬上刪,轉瘋了,最高機密”等短語的文章,就可以判斷是比較拙劣的標題黨,應當屏蔽這類信息。



2、沒有出處,或者出處無法驗證

比如:

抗疫時期盛傳的各種陰謀論。這些陰謀論都有一個共同的特點,聽起來言詞鑿鑿,看起來都是一些生動鮮活的事件,但是幾乎找不到內容的出處,或者出處根本無法驗證。等過幾天你再查看這篇文章的時候,還會發現:


用交叉驗證識別謠言,可能你都做錯了!


3、無頭無尾

一些無頭無尾的截圖、文章,要麼本身就是造謠者傳播的,要麼很容易讓接收信息的人斷章取義,浮想聯翩,以訛傳訛。


【交叉驗證的用武之地】

交叉檢驗的理論支撐既然來自於信息論,信息論既然被稱為應對不確定性最重要最有效的方法論,那麼交叉檢驗的用途自然很廣,比如:

醫療診斷:通過驗血和CT來確認病情;

人才招聘:HR通過簡歷、面試、背景調查等方式核實應聘者情況;

信貸風控:筆者在小微信貸風控領域工作多年,在我們這個細分領域,風控技術的核心邏輯就是交叉驗證。比如銀行獲取借款人的賬務記錄、資金賬戶交易流水、報稅信息等交叉檢驗其收入狀況。

除此之外,交叉驗證還可以用在你工作和生活的方方面面,甚至可以說無處不在。

不過,說到這裡我一定要給你個風險提示:

交叉驗證固然好用,但切忌用於自己親近的人,畢竟生活還是需要睜一隻眼閉一隻眼的。

參考文獻:吳軍《信息論40講》


分享到:


相關文章: