悦读:谷歌与流感传播的预测

最近在读一本书,叫《大数据时代:生活、工作与思维的大变革》。

开篇提到一个跟医学有关的案例,觉得很有意思:谷歌公司利用其大量用户的检索数据形成的大数据,来预测季节性流感的流行传播,并且将其研究成果发表在著名杂志《Nature》上。

悦读:谷歌与流感传播的预测

熟悉科研的朋友应该对《Nature》不陌生。它是世界上最早国际性科技期刊。能在上边发表高质量文章的人,基本上都可以贴上“大神”的标签了。带着好奇心,我找到了这篇谷歌公司发表的这篇文章,下面把标题及摘要部分分享给大家。

标题:

Detecting influenza epidemics using search engine query data

利用搜索引擎查询数据来预测流感的流行

摘要:

Seasonal influenza epidemics are a major public health concern, causing tens of millions of respiratory illnesses and 250,000 to 500,000 deaths worldwide each year.

季节性流感流行是一个重大的公共健康问题。其在全球范围内,每年可导致几千万的呼吸道疾病病例,甚至造成25万至50万人的死亡。

In addition to seasonal influenza, a new strain of influenza virus against which no previous immunity exists and that demonstrates human-to-human transmission could result in a pandemic with millions of fatalities.

除了季节性流感,如果一种新型的流感病毒,目前还没有相应给免疫预防的手段,而且它可以在人际传播,那可能就会造成数百万人的死亡。

读到这里,想起了历史上惨绝人寰的“西班牙打流感”。这场流感波及了全世界近10亿人,造成了2500万至4000万人的死亡(亦有别的说法)。死亡人口甚至超过了当时正在进行了第一次世界大战。这也促使了第一次世界大战的结束,因为许多国家已经没有额外的兵力作战。

Early detection of disease activity, when followed by a rapid response, can reduce the impact of both seasonal and pandemic influenza.

早期发现疾病活动,并予以快速应对,可以减少季节性流感及大流行流感的影响。

One way to improve early detection is to monitor health-seeking behaviour in the form of queries to online search engines, which are submitted by millions of users around the world each day.

一种提高早期发现的办法就是监测网上搜索引擎的查询数据,通过数据了解人们的寻求健康行为,而这些数据可以从世界范围内成千上万的谷歌用户得到。

Here we present a method of analysing large numbers of Google search queries to track influenza-like illness in a population.

这里我们提供一种通过分析大量在谷歌网站上的查询记录来追踪人群中的流感样疾病。

Because the relative frequency of certain queries is highly correlated with the percentage of physician visits in which a patient presents with influenza-like symptoms, we can accurately estimate the current level of weekly influenza activity in each region of the United States, with a reporting lag of about one day.

因为相关检索词出现的频率与有流感样症状病人去就诊的比例呈现高度的相关性。仅1天的时间的延迟,我们就可以准确评估美国各州每周流感活动的水平。(要知道疾控中心的数据可能有1到2周的延迟)

This approach may make it possible to use search queries to detect influenza epidemics in areas with a large population of web search users.

这种方法能在拥有大量网民的地区利用网民在网上的查询记录来预测流感的流行。

我们知道,“疾病重在预防”,要想阻断流感这类疾病的流行、传播,及时发现传播事件及传播的地点至关重要。谷歌公司的这个技术可以说是棒极了,如果在验证之后,确实可以推广,那我们的健康又多个一层保障。

这时候又联想到我们常用的百度搜索引擎。这差距是不是有点大呢。百度最被诟病的就是它的广告竞价排名,曾经的“魏则西事件”可以触痛了多少人。也正是这个事件,把百度推上风口浪尖。

悦读:谷歌与流感传播的预测

今天我再次以“不孕不育”、“癫痫”、“白癜风”等疾病为检索词,在百度上查询时候,发现原来的竞价排名的广告不见了。

这也算是百度的一点进步。希望它能越做越好。


分享到:


相關文章: