戴玉:如何更有效地找到可靠數據


今天我想和大家分享三個方面的內容:

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

中國不同數據源的數據公開策略

中國的數據大致分為六類:

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

◆ 第一個是互聯網企業的數據:數據多、結構化、較開放

有些公司也自帶了生產數據新聞的功能。是的,我說的就是今日頭條媒體實驗室。我覺得他們給媒體提供的數據後臺還是不錯的,對於時事熱點的監控挺有用。

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

◆ 第二種是傳統企業的數據:結構化不理想、披露謹慎、數據理解力較好

傳統行業發展了很多年,他們的數據結構化和開放策略雖然都不夠理想,但他們對行業的駕馭力比較好。

◆ 第三個是政府的公共數據:公共性較強、公共所有、公佈方式較雜、結構化較弱

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

拿到政府數據的難點在哪裡?

  • 第一個是政府數據本身結構化的問題,公共數據的風險評級也沒有做完,所以很多數據的開放可能還需要時間。

  • 第二個是政府數據的開放形式各種各樣,不同部委不同性質單位公佈數據的時間節點、公佈方式、數據格式都不一樣。瞭解不同政府數據的公佈特點,可能是比較難的地方。做的比較好的可以隨時下載歷史數據,數據更新得也很快。但我之前也見過,還有靠印刷和出版來公佈數據的,你得花錢去買那本書,才能拿到這份數據。

◆ 第四個是研究諮詢機構的數據報告:魚龍混雜、認準口碑

瞭解報告的發佈方特別重要。現在國內的報告發布機構特別多,他們的數據可靠性涉及到資金來源、背靠單位、往日口碑,還有擅長的領域等等。有時候一份報告或一個排行榜的發佈,後面的利益鏈比較複雜,所以要分辨出哪些是口碑比較好的數據報告。

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

社科文獻出版社的中國評書網有比較多的權威數據。各高校老師發佈的數據,他們的數據其實質量挺高,但往往缺乏特別理想的統一發布渠道。這些好的數據就需要到中國知網和核心期刊裡面去翻,裡面真的有很多數據乾貨。

◆ 第五種是外國機構發佈的數據:結構化且公開透明、體貼的數據服務、機構細分、不夠本土化,須留意政治傾向

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

外國機構發佈的數據有自己的特點:

  • 第一個特點是他們是統一公開的,像聯合國、世界銀行、歐盟等等都有專門的網站網頁去公佈數據,可以檢索下載。各國的統計局也會有很多數據,尤其是美國的數據公佈得非常詳盡。

  • 第三個特點就是專業細分特別發達。一個你從沒聽過名字的外國諮詢公司,可能是這個細分行業的領頭羊。但不同外國機構有著不同政治立場,這個方面大家需要注意一下。外國機構發佈的報告數據不錯,國際視野很好,但主要問題是對中國的解讀不夠本土化。

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

如何明確哪些數據能解決你的問題、拿到相匹配的數據

我知道自己想要什麼數據,但就是找不到,可能想要的數據跟問題並不匹配,或者可以用其它數據來替換,這種情況經常發生。

如何判斷數據的可靠性

我之前自己總結過判斷信源的十原則:

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

這是一個什麼級別、具有何種聲譽的發佈者?

在以什麼身份,經過了哪些控制流程之後,可能因為何種利益驅動在哪種場合發佈了自己專業權威領域之內或之外的信息?

這些信息經過了幾次傳遞,是否曾公開出版過?是否經過時間檢驗

數據的判斷有四個特殊的地方:

數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據

第二個是最好有交叉印證。比如說之前有一次統計局公佈過登記失業率降低的數據,正好在它公佈之前,我看到過一份輿情數據,說是新浪微博上吐槽物價房價的人越來越多,唯一降低的就是吐槽就業的人。那麼兩個數據一綜合可以猜測,就業形勢也許在好轉。

第三個方法就是線性時間上的驗證。數據是一種特別能反映全貌的工具,它在預測方面的功能也很好。如果沒有人口學的數據預測,那整個計劃生育和二胎政策放開的時間節點就都會發生變化。我之前在《南風窗》寫過一篇《全面二孩政策背後的數據迷局》裡面就有數據的故事。

今天我介紹數據搜索技術的不是特別多,因為我覺得技術上你只要願意花時間,數據都是能找到的,對於數據的理解、我們跟數據的關係可能更值得探討。

感謝各位,歡迎聯繫我

[email protected],希望能收到大家的反饋郵件。謝謝今日頭條提供給我的這次分享機會。

(整理: 趙康帥)


數據新聞大咖談 | 戴玉:如何更有效地找到可靠數據


分享到:


相關文章: