大數據時代要求我們重新審視精確性的優劣

傳統的樣本分析師們很難容忍錯誤數據的存在,因為他們一生都在研究如何防止和避免錯誤的出現。在收集樣本的時候,統計學家會用一整套的策略來減少錯誤發生的概率。

大數據時代要求我們重新審視精確性的優劣

在結果公佈之前,他們也會測試樣本是否存在潛在的系統性偏差。這些策略包括根據協議或通過受過專門訓練的專家來採集樣本。但是,即使只是少量的數據,這些規避錯誤的策略實施起來還是耗費巨大。

大數據時代要求我們重新審視精確性的優劣

尤其是當我們收集所有數據的時候,這就行不通了。不僅是因為耗費巨大,還因為在大規模的基礎上保持數據收集標準的一致性不太現實。就算是不讓人們進行溝通爭吵,也不能解決這個問題。

大數據時代要求我們重新審視精確性的優劣

大數據時代要求我們重新審視精確性的優劣。如果將傳統的思維模式運用於數字化、網絡化的21世紀,就會錯過重要的信息。執迷於精確性是信息缺乏時代和模擬時代的產物。在那個信息貧乏的時代,任意一個數據點的測量情況都對結果至關重要。所以,我們需要確保每個數據的精確性,才不會導致分析結果的偏差。


分享到:


相關文章: