大数据让我们的生活更加便利
也为商业发展带来了帮助
但近年频发的事件又让人不得不担心
我们的数据和信息
是否能得到充分的保护
在大数据已成为国家战略的今天
对数据的使用是必要且重要的
那么我们是不是有办法
在保护数据安全的同时
也能充分发挥数据的价值?
本期《数中生智》
邀请了美丽动人的法律人
与成熟稳重的技术人
来一起聊聊这个话题
一个典型应用场景
精准营销,是非常典型的大数据应用场景。
确定广告如何投放,通常的做法是,通过某项标签属性来判断某个设备用户是否属于广告的目标人群。例如,如果想投放《复联3》的广告,会用设备ID去DMP(数据管理平台)查询“电影”、“漫画”相关标签,再做定向投放。
但如果DMP由第三方提供,广告主要拿出自身的数据资产,又没有做好匿名化处理的话,就会存在一定风险。
一个保护数据安全的算法
从技术角度出发,TalkingData采用了布隆过滤器来解决上述问题。
布隆过滤器(Bloom Filter),是一个很长的二进制向量和一系列随机映射函数。它可以用于检索一个元素是否在一个集合中,优点是空间效率和查询时间远远超过一般算法。
当运用布隆过滤器,还是上述场景,广告主将投放标准提交给第三方DMP, DMP根据标准筛选人群形成设备列表,利用布隆过滤器将这些数据形成一个匿名化的数据包。广告主同样通过布隆过滤器来匿名化判断DMP方的数据包中是否有匹配的目标人群,如果有就可以投放。
这样一来,广告主不需要提供自有原始数据,DMP方也无从知道广告主定向投放了哪些人群,处理过的数据包都保持匿名,既最大限度保证了数据安全和合规,又满足了精准投放、人群画像等实际业务需求。
一个创新性技术框架
布隆过滤器并非适用于所有的业务场景。
为了应对不同业务场景的需求,目前TalkingData正在与MIT连接科学研究所进行合作,参与OPAL(Open Algorithms)的研发。
OPAL是“可穿戴设备之父”阿莱克斯·彭特兰提出的创新技术框架,其核心特性是“不流动数据,只流动算法”。 OPAL利用分布式技术进行数据存储和运算,并在流程中都保持数据的加密状态,将经过验证的算法前置到数据端,不移动数据而只提供安全的分析结果,实现在从数据中获得有价值的洞察的同时,有效保证数据安全与流程合规。
TalkingData已经在OPAL研发中取得一定进展,未来也会将这个技术集成到相关产品和服务中。
技术是钥匙,也是安全门。我们可以用技术来挖掘数据中的价值,也应该用技术来保护数据的安全。
现在,数据安全和个人信息保护是一个严峻又重要的课题。不仅需要对数据相关各方严格监管,所有相关企业也应该主动重视并采取恰当方式来保护数据安全,坚守合法合规的底线。
閱讀更多 TalkingData 的文章