米资讯|大数据背后,是谁在监视你的生活

米资讯|大数据背后,是谁在监视你的生活

大数据里的我们,拥有异常真实的群体画像。因为我们在面对手机的时候非常诚实,永远对它说真话。

世界上知道这些秘密的只有你,和机器另一端的数据科学家。在机器语言里,我们不止是一个名字、一个地址、一串设备识别符。它每秒钟监测超过400个变量,记录每一个行为轨迹。

今年57岁的韦思岸(AndreasWeigend)知道无数这样的故事。他出生在德国,原本在赫赫有名的欧洲粒子物理研究所(CERN)研究上帝粒子,但在2002年,他选择投身大数据世界,成为了亚马逊首席科学家,后来他曾任阿里巴巴数据顾问、人人网早期外部投资人,也曾为摩根大通、汤森路透、沃尔玛、AT&T等机构提供数据咨询。

他教会机器一个理解人类的方法是:获知一个用户地址后,还要抓取这个地址周围5公里内的书店分布状况,因为这决定了用户有多大概率在亚马逊买书、会在什么情况下买书。这条准则后来被应用到了阿里巴巴的数据分析实践,所以当淘宝知道你家5分钟步行路程内有超市的时候,它就不会频繁向你推荐油盐酱醋,但是它看到你的搜索记录,获知你皮肤敏感,而15分钟路程内的商场都没有你习惯用的护肤品,那么,这些商品将会出现在你的屏幕上。

韦思岸将数据分析师每天的工作形容为‘人性实验’,就像科学家通过实验探索物质的本质,数据分析师通过程序研究人的行为特征。技术改变了人的物理概念。定义我们的不仅仅是账户和密码,还有我们的爱好、情绪、行为习惯。不管我们在互联网上如何伪装,换新的名字、新的头像,机器总能轻易识破。数据记录下的习惯,是我们的另一个身份定义。

大数据日渐了解我们,但是很少人知道,我们所做的事情会让我们成为广告主的商品、被人剖析个性的样本、掌握我们的一举一动,甚至能预测我们的未来轨迹。

米资讯|大数据背后,是谁在监视你的生活

‘隐私’

不止一位数据科学家确信,隐私已经是一件‘算法上不成立’的事件。我们知道自己在分享数据,但是大部分人并不知道,自己正在分享些什么,更不知道,这种分享将会意味着什么。

从App下载到手机那一刻起,揣测人生的尝试就开始了。仅仅是安装过程中所抓取的硬件设备信息,App已经对你有了一个大概印象——如果一台手机一个月内有10次连接同一个星巴克的WIFI,20次连接同一个定位在写字楼的公共区域WIFI,30次连接一个家庭WIFI,再算上这些WIFI的地理位置,以及WIFI名里的关键词,那么,一条几近清晰的生活——工作的路线轨迹,get。

在学者的论文里,这被形容为一个‘数据失控’的时代,没有人能控制自己的数据,我们的数据时刻被人监视。

不过,实际经手数据的人并没有这种感觉。人们担忧自己的个人信息泄露,比如姓名、电话、地址。在业界,工程师给隐私下过一个最简单的定义——隐私,就是那些不允许自由流动的数据,比如被法律禁止交易的身份证号、个人征信、医疗记录,它们只能固定储存,不允许随意读取。事实上,现在App收集信息也确实越来越受到限制,比如IOS10以后的系统已经禁止读取许多设备硬件信息,安卓系统也在逐步限制软件能够获取的用户信息范围。

不过对公司来说,以上这些信息固然重要,但更值钱的是另一些数据——你的喜好、兴趣、生活方式、行为习惯——而这些数据在很多人的概念里,还不属于隐私。

对抗

并不是没有技术办法对抗这样的数据危机。在英国,有专门保护个人隐私的公共机构,直接向英国国会报告。它提出了数据管理者登记制度,要求每个处理个人信息的机构都要在信息专员办公室登记,否则就算为刑事犯罪。很多公司也有谨慎的数据使用哲学。谷歌会把用户的姓名、账号、联系方式、地址等信息,与行为数据完全分开,不会将两者关联使用。而雅虎会有专门的研究员,在实践中界定数据搜集的隐私边界。

许多数据科学家将自己设计的隐私保护对策详细公布在论文中,有人将分散信息流控制和差分隐私保护技术应用到云计算,还有人通过模糊处理(obfuscation)技术对用户隐私全程加密,另一种有效的操作方法是制造噪声,根据用户历史记录制造等比例的行为噪音,这样试图解读用户行为的服务商就很难辨别哪个是用户真实需求,哪个是系统制造的噪音,从而保护用户真实的隐私。

但是,在真实的大数据前线,还轮不上这些对策上场,仗已经败了。技术理想的敌人其实比想象中更原始——严谨规则背后,不讲规则的人。

米资讯|大数据背后,是谁在监视你的生活

 数据未来

我们正在面对的数据未来是,人或许比想象中更容易预测,而算法可能比我们更了解世界。

随着技术优化,现在甚至不需要成为专业人士,就能洞察真相。就在今年初,使用健身记录软件Strava的用户发现,仔细查看App所提供的跑步热力图,能轻易推测出美军驻阿富汗军事基地的具体位置。因为它会实时追踪用户位置数据,以高亮形式呈现在地图上,而在当地用户很少的战乱地区,每天集体跑步的美国士兵在热力图上圈出了异常明显的行动路线,基地位置、出勤时间、巡逻路线在图上一目了然。

无论如何,我们依然生活在这个数字化包围的世界,不愿意放手。统计显示,人们平均每天要在手机屏幕上滑动2617次,在睡不着觉的晚上,23%的受访者会抱着手机睡觉,而其中的3%则强调,自己必须要天天握着手机,才能入睡。

光纤传回数据的时候没有声音,它不会提醒你,这里正在发生什么。在更好的规则到来前,大数据世界将依然是一个没有警笛的沉默战场。就像是这座城市里被忽视的周五晚高峰地铁上的八卦、没有打开的高端财经App、被印在报价表上的个人喜好,还有那些为了它苦恼、争吵、麻木、抗争的人类故事一样,它们只存在在一串字符与另一串字符的连接中,极少为人们所知。


分享到:


相關文章: