戴玉:如何更有效地找到可靠数据


今天我想和大家分享三个方面的内容:

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

中国不同数据源的数据公开策略

中国的数据大致分为六类:

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

◆ 第一个是互联网企业的数据:数据多、结构化、较开放

有些公司也自带了生产数据新闻的功能。是的,我说的就是今日头条媒体实验室。我觉得他们给媒体提供的数据后台还是不错的,对于时事热点的监控挺有用。

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

◆ 第二种是传统企业的数据:结构化不理想、披露谨慎、数据理解力较好

传统行业发展了很多年,他们的数据结构化和开放策略虽然都不够理想,但他们对行业的驾驭力比较好。

◆ 第三个是政府的公共数据:公共性较强、公共所有、公布方式较杂、结构化较弱

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

拿到政府数据的难点在哪里?

  • 第一个是政府数据本身结构化的问题,公共数据的风险评级也没有做完,所以很多数据的开放可能还需要时间。

  • 第二个是政府数据的开放形式各种各样,不同部委不同性质单位公布数据的时间节点、公布方式、数据格式都不一样。了解不同政府数据的公布特点,可能是比较难的地方。做的比较好的可以随时下载历史数据,数据更新得也很快。但我之前也见过,还有靠印刷和出版来公布数据的,你得花钱去买那本书,才能拿到这份数据。

◆ 第四个是研究咨询机构的数据报告:鱼龙混杂、认准口碑

了解报告的发布方特别重要。现在国内的报告发布机构特别多,他们的数据可靠性涉及到资金来源、背靠单位、往日口碑,还有擅长的领域等等。有时候一份报告或一个排行榜的发布,后面的利益链比较复杂,所以要分辨出哪些是口碑比较好的数据报告。

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

社科文献出版社的中国评书网有比较多的权威数据。各高校老师发布的数据,他们的数据其实质量挺高,但往往缺乏特别理想的统一发布渠道。这些好的数据就需要到中国知网和核心期刊里面去翻,里面真的有很多数据干货。

◆ 第五种是外国机构发布的数据:结构化且公开透明、体贴的数据服务、机构细分、不够本土化,须留意政治倾向

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

外国机构发布的数据有自己的特点:

  • 第一个特点是他们是统一公开的,像联合国、世界银行、欧盟等等都有专门的网站网页去公布数据,可以检索下载。各国的统计局也会有很多数据,尤其是美国的数据公布得非常详尽。

  • 第三个特点就是专业细分特别发达。一个你从没听过名字的外国咨询公司,可能是这个细分行业的领头羊。但不同外国机构有着不同政治立场,这个方面大家需要注意一下。外国机构发布的报告数据不错,国际视野很好,但主要问题是对中国的解读不够本土化。

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

如何明确哪些数据能解决你的问题、拿到相匹配的数据

我知道自己想要什么数据,但就是找不到,可能想要的数据跟问题并不匹配,或者可以用其它数据来替换,这种情况经常发生。

如何判断数据的可靠性

我之前自己总结过判断信源的十原则:

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

这是一个什么级别、具有何种声誉的发布者?

在以什么身份,经过了哪些控制流程之后,可能因为何种利益驱动在哪种场合发布了自己专业权威领域之内或之外的信息?

这些信息经过了几次传递,是否曾公开出版过?是否经过时间检验

数据的判断有四个特殊的地方:

数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据

第二个是最好有交叉印证。比如说之前有一次统计局公布过登记失业率降低的数据,正好在它公布之前,我看到过一份舆情数据,说是新浪微博上吐槽物价房价的人越来越多,唯一降低的就是吐槽就业的人。那么两个数据一综合可以猜测,就业形势也许在好转。

第三个方法就是线性时间上的验证。数据是一种特别能反映全貌的工具,它在预测方面的功能也很好。如果没有人口学的数据预测,那整个计划生育和二胎政策放开的时间节点就都会发生变化。我之前在《南风窗》写过一篇《全面二孩政策背后的数据迷局》里面就有数据的故事。

今天我介绍数据搜索技术的不是特别多,因为我觉得技术上你只要愿意花时间,数据都是能找到的,对于数据的理解、我们跟数据的关系可能更值得探讨。

感谢各位,欢迎联系我

[email protected],希望能收到大家的反馈邮件。谢谢今日头条提供给我的这次分享机会。

(整理: 赵康帅)


数据新闻大咖谈 | 戴玉:如何更有效地找到可靠数据


分享到:


相關文章: