网络平台数据的“访问”之争——大数据之殇?

【笔者按】

无论是信息、知识还是当今热议的机器智能都是以数据为载体存在的,数据是对客观世界的记录,当我们赋予数据背景时,它就成为信息。信息是知识的来源,当把信息提炼出规律的时候,就上升为知识;有独创性、显著性或创造性的知识产品就成为知识产权客体。本文讨论的平台数据内容兼或包含了数据、信息、知识产权客体,平台数据纠纷亦然包括了著作权纠纷、不正当竞争纠纷等方面。

引言

近期美国法院就hiQ公司与LinkedIn公司之间的数据纠纷作出禁令裁决,可以看到在世界范围内,互联网平台数据保护的争议也非常之大。法院认为“平台上的数据由用户自行发布在公共空间,LinkedIn不能证明他们拥有这些数据,从而也就没有权利屏蔽他人使用这些数据。而且理论上说,任何人可以手动点开每一个人的信息,拿纸笔抄下来,然后再录入到电脑里”。据此,法院要求LinkedIn在24小时内停止通过技术措施阻止hiQ公司获得上述公开数据。

但细经思量,Linkedin虽然对用户公开的资料并无所有权,但对其创建的网络空间是否享有所有权或控制权?或者LinkedIn是否有权对其提供的网络空间实施一定的阻隔措施?但网络空间毕竟不同于物理空间,网络空间内容数据的“访问”与“自力”救济(限制访问措施)引起的法律争议也由来已久。从回溯性角度考察平台数据之争,可以发现随着技术和商业模式的变化,平台数据呈现出阶段性的特点,并对立法和司法形成一股“倒逼”之势。

网络平台数据的“访问”之争——大数据之殇?

一、web1.0时代,侵犯动产理论、合理使用、避风港规则交替适用,旨在打破网站信息保护之门。侵犯动产理论并不全然适用于“网络空间数据内容的访问”(website access),合理使用、系统缓存等制度更获青睐

网络空间数据内容的“访问”(website access),包括籍由搜索链接(link)、网页快照、数据抓取、端口接入等技术实现对网页、客户端内容的“获取”,以及将相关内容呈现或推送至用户终端的行为。

对网络空间内容的“访问”是否必须经过授权,世界各国以及相关的国际条约中,都没有对其做出明确的规定,我国的法律及司法解释也没有明确的规定。网络空间内容的访问涉及到网站经营者、访问者(搜索、链接等服务提供者)与互联网用户三者之间的关系,关乎着互联网经营者与社会公众之间的利益实现。从回溯性角度考察,以往的判例考量了网络所具有的开放性特征,资源共享是网络产生的初衷,因此保护网络信息的自由流通和利用成为早期互联网内容访问是否构成侵权判定的重要因素。法院遵循了这样的逻辑,只有在计算机网络或网络内容并不是任何人都能接触到的情况下(采取了自力救济,如技术措施、密码保护等),法院才会根据侵犯动产的原理来追究行为人非法入侵的法律责任。

侵犯动产的理论应用到互联网领域,可概括为以下几个规则:首先,在网络空间生成并存在的内容蕴含着欢迎他人来访问、设链的内在要求,即默示许可;其次,网站经营者或所有者采取了必要措施限制(自力救济手段:如网站显著位置的声明、设置元标签、设置爬虫协议)他人访问;第三,违反、规避上述限制措施,才可引发进一步的侵权之诉;第四,网站经营者或所有者可享有普通法上的禁令救济;第五,受害方承担损害后果的证明责任。此种主要是对损害的证明,比如对计算机服务器的损害;将来损害的潜在危险(他人效仿的侵权行为);持续性的经济损失(商誉损害或消费者评价的降低,如垃圾邮件)。

在网页版权系列纠纷中,如 Field v. Google Inc.等相关案例中法院基于(搜索引擎)这一自动搜索过程,从技术上合理推定网站所有人同意制作和保存其网页副本,大多数网页内容的所有者(版权人)对未经许可复制并保存其作品副本的行为持容忍态度,毕竟版权人从网页保存服务中获益良多。当然法院也不乏通过合理使用制度、临时复制、避风港规则等来论证网页保全行为的正当性。

二、互联网及移动时代,网络平台数据之争在国内的阶段性变化

阶段一:垂直搜索平台数据之争,以实质性替代标准评判数据内容控制权边界

这一阶段以大众点评诉爱帮网系列案件为典型。汉涛公司通过商业运作吸引用户在大众点评网上注册、点击、评论,并有效地收集和整理信息,进而获得更大的商业利润,法院认定该合法权益应受法律保护。爱帮科技公司作为提供搜索、链接服务的网络服务商,应遵守法律规定和相关行业规范,对于特定行业网站信息的利用,须控制在合理的范围内。但爱帮网对大众点评网的点评内容使用,已达到了网络用户无需进入大众点评网即可获得足够信息的程度,超过了适当引用的合理限度,事实上造成爱帮网向网络用户提供的涉案点评内容对大众点评网的相应内容的市场替代,对汉涛公司的合法利益产生实质性损害,构成不正当竞争。而后百度地图与大众点评案法院基本遵从同样的审理逻辑,认为二者在为用户提供商户信息和点评内容的服务模式上近乎一致,双方存在直接竞争关系。百度地图大量使用大众点评网的用户点评,替代其向网络用户提供信息,会导致大众点评网的流量减少。百度公司大量、全文使用涉案点评信息,实质替代大众点评网向用户提供信息,对汉涛公司造成损害,其行为违反了公认的商业道德和诚实信用原则,具有不正当性,构成不正当竞争。

阶段二: 网站设链权与禁链权之争,未决的技术规范与法律“权利”之博弈

该阶段以百度诉360搜索引擎违反Robots协议、不正当竞争纠纷案为代表。该案首次从司法判决角度对Robots协议效力作出了评述,认为Robots协议仅是一种网站程序编写的技术规范,并非法律意义上的协议或者合同。Robots协议作为一种技术规范,其作用只在于标示该网站是否准许搜索引擎爬虫机器人访问、准许哪些搜索引擎爬虫机器人访问。但爬虫机器人识别该Robots协议内容后,无论爬虫机器人是否遵守,Robots协议都不会起到强制禁止访问这一技术措施的作用。从另一个方面来讲,Robots协议作为互联网本领域技术人员通俗易懂、操作简便的技术规范,已经成为一种国内外互联网行业惯例,应得到普遍遵守。法院同时认为,网站除非有正当理由(如网站服务器或带宽的承受能力、用户隐私保护、特定经营模式下对收费权的保护等),不得以Robots协议拒绝搜索引擎抓取其内容。言下之意,一般情况下Robots协议不应成为内容网站“限制”搜索引擎抓取的“权利主张”,须网站举证证明拒绝的理由具有正当性,但正当性作为法律价值判断,由商业性网站承受显然过重。

阶段三:用户属性数据权属之争,再次拷问信息抓取行为的边界

备受关注的“脉脉非法抓取使用新浪微博用户信息”案历经二审,法院最终认定脉脉方未经用户允许和微博平台授权,非法抓取、使用新浪微博用户信息,非法获取并使用脉脉注册用户手机通讯录联系人与微博用户的对应关系,构成不正当竞争。脉脉抓取的涉案数据信息同时具备以下条件(非用户发布内容):新浪微博提交的公证书显示,其主张被非法抓取、非法使用的新浪微博用户信息均为非脉脉注册用户信息,注册用户数据信息(名称,性别,头像,职业等)而非用户发布的内容,用户数据信息直接体现在脉脉客户端可见的“X度人脉关系”。本案中新浪微博并没有提交直接证据证明涉案数据为脉脉从新浪微博抓取,同时脉脉也无法提供非脉脉注册用户的涉案数据来源,法院是依据优势证据原则,推定为脉脉抓取了非脉脉注册用户的但属于新浪微博注册用户的涉案数据。二审法院认为新浪微博拥有上亿用户的个人信息,庞大的用户群及数据信息成为新浪微博在社交软件中的竞争优势。但是在0pen API的接口权限设置中存在重大漏洞,被侵权后无法提供相应的网络日志进行举证,对于涉及用户隐私信息数据的保护措施不到位,暴露出其作为网络运营者在管理、监测、记录网络运行状态,应用、管理、保护用户数据,应对网络安全事件方面的技术薄弱问题。为保护新浪微博用户的个人信息及维护新浪微博的竞争优势,应当积极履行网络运营者的管理义务,防止用户数据泄露或被窃取、篡改,保障网络免受干扰、破坏或者未经授权的访问。在该案中同样引发热议的另一问题是:平台能不能基于自身经营所收集的用户信息主张平台权利?或者平台能不能将用户的权利“拿来”作为自己竞争的优势?法院没有确认平台可以基于自身经营对用户的相关信息主张自己的财产权,但基于大数据发展趋势,法院认为平台数据是一种财产,是一种应当被保护的利益,但是并未涉及保护的方式以及救济措施的设置。

数据纠纷方兴未艾,菜鸟顺丰、京东天天快递因物流数据短兵交战,腾讯华为再起用户数据之争,倒逼立法。

网络平台数据的“访问”之争——大数据之殇?

三、数据立法与规则反思

《网络安全法》的施行,标志着网络空间安全管理及用户个人信息保护进入崭新阶段,但该法仍未涉及对网络数据的共享和流动的法律调整。如果没有数据产权制度、数据流通交易制度,那么数据企业平台将会依据其先占的竞争优势,拒绝其它数据平台访问或接入,或者向其索取高额端口接入费的方式,会损害最终消费者的福利,这种畸形发展的结果是网络空间最终可能会变成信息孤岛。未来在数据平台互通访问规制模式上,我们至少须解决以下三个问题:第一,是否要对数据平台经营者赋权的问题,包括赋予哪项权利、哪些权能、权利的效力范围等;第二,在数据平台经营自主权与数据共享互通的规制上,数据平台的“关门”权与其对访问、接入容忍义务的平衡点在哪里?第三,在用户数据的收集使用上,细化并明确数据平台获取数据资源的合法途径、使用范围和使用方式。


分享到:


相關文章: