COVA:用区块链解决数据“归属权”问题,打破人工智能发展瓶颈

来源/31QU

2016年,第三次人工智能浪潮席卷而来。从无人驾驶到智能家电,从深度学习到语音识别,人工智能概念开始出现在金融、医疗、交通、家居等多个领域。

而人工智能也是目前最火的创业领域,吸金能力无可比拟。

据CB Insights统计,2017年,全球人工智能创业公司的融资额达到了152亿美元,其中,中国企业占48%。

但在破纪录的融资额背后,不容忽视的是,自从2016年3月AlphaGo惊艳亮相后,经过两年多发展的人工智能也遭遇了一些挑战。

“如果你做人工智能领域的研究,你就会发现,最大的瓶颈不是算法,也不是算力,而是数据。”COVA联合创始人Vincent Li告诉31QU。

“(人工智能)算法已经到了一个很高的水平,而且都是开源的,想再有一个跨越性的进步是很难的;算力如果是云算力也特别便宜。”Vincent进一步解释道,在人工智能的三大支柱中,数据存在太对亟待解决的问题。

尽管“大数据”也是被热炒的概念,但如今数据孤岛问题依然严重,数据安全问题时有发生,数据的采集使用和个人隐私保护的冲突也愈演愈烈。

而区块链技术,能否解决数据领域的问题,进而推动人工智能的进一步发展?

“数据石油”的落地

早在2013年,世界经济论坛研究报告就称:“大数据是新财富,价值堪比石油。”而“数字石油”的叫法,也就此在业内传开。

“但数据和石油是有很大区别的。”Vincent称。


COVA:用区块链解决数据“归属权”问题,打破人工智能发展瓶颈

COVA联合创始人Vincent Li

石油是一个实物,产权明确,“谁挖出来就是谁的”;石油的交易过程清晰,“从一个人到另一个人手上”;石油一旦交易就能产生价值,“比如我给你一桶石油,就相当于给了你60美金”。

但在数据领域,状况就完全不一样了。

一个数据要如何定价?“看过或复制就能拥有”的数据到底属于谁?和石油相比,数据的所有权、处置权和交易权等都不清晰。

“这个问题在医疗领域非常明显。”Vincent举例,“医疗数据应该归病人还是医院,还是研究的医生?”

目前,数据归属权的确定方式,还依赖于违规后的处罚,不仅滞后,而且导致真正有价值的数据没有办法正常流通。

“因为数据的产权定义不清晰,导致后面的数据交易、使用等环节都难以推进。”Vincent认为。

因此,目前数据领域最难也是最重要的任务,就是解决数据的“归属权”问题。

“我们在COVA网络内,就能把数据产权定义的非常清晰。”Vincent对31QU表示。

首先,搭建在区块链网络上的COVA是去中心化,没有人可以控制这个网络;其次,在网络中的数据就属于上传的用户,用户可以用智能合约的方式,决定自己的数据被谁使用、如何使用。

数据生态

在数据产权确认后,整个数据链条才能正常运转下去。

而在COVA生态网络中,主要有数据提供方、数据使用方、系统维护者三个主要角色。

我们来逐一解读:

数据提供者有两类,一类是个人,一类是机构。

对于个人用户而言,一旦个人可以将自己的购物数据、财务数据等上传到网络,这个数据的归属权就属于上传的用户。

而用户可以通过智能合约来保护和使用自己的数据。

比如,如果追求强隐私性,用户就可以设置,在服务结束后,在App关闭的一瞬间,必须销毁相关的数据。

如果追求流动性,用户可以设置其他的规则,比如让对方使用三个月再销毁等。而一旦对方使用了用户的数据,就需要支付给用户一定的费用——这也是COVA Token一部分价值的体现。

对于机构而言,除了提供直接的数据,他们更有价值的,是提供“数据标注”。

简单的解释“数据标注”,就是将海量数据分类、贴上标签,来帮助人工智能学习。

“数据的标注成本是非常高的。”Vincent称,“一个有用的数据标注成本可能是在百万和千万级的。”

但这些花费了大价钱标注的数据,往往因为没有靠谱的销售和使用方式,导致在黑市之外,几乎没有任何流动性。

COVA:用区块链解决数据“归属权”问题,打破人工智能发展瓶颈


数据使用方,是COVA生态网络的第二类参与方。

“一些高科技公司对数据的需求是非常大的。”Vincent表示,“现在很多AI公司发展受阻,唯一原因就是他们没有办法获取大量的数据。”

有个极端的案例是,一家AI公司融资了1亿人民币,其中5、6000万都用来购买数据和数据标注。

而COVA提供了一个渠道,能让数据使用者找到自己真正需要的数据类别。

最后,使系统维护者,也就是我们常说的“矿工”的概念。

矿工可以通过挖矿,比如进行数据传输、数据计算等运作,来获得COVA奖励。

三种角色,构成了COVA整个生态系统。

数据隐私保护

在解决了数据归属权、建立了数据生态后,“区块链+数据”的探索,依然要面临其他挑战。

首先,在目前区块链技术下,如何进行海量的数据处理?

“我们的分散机制像POW,但是我们有有类似DPOS的地方。” Vincent进一步解释,“秘钥等需要保密的东西,采用POW的形式,把隐私性提高;其他可以采用分散方式,将效率提高。”

其次,如何让更多的人来进入这个全新的生态?

“尽量让用户的使用方式和之前一样。”Vincent介绍,比如采用数据分析从业者更熟悉的Python语言,在UI、US上下功夫等。

并且,数据的交易并不强制使用COVA的Token,COVA更多是起到平台的作用。

最后,还是要回到关键的数据隐私保护上。

即便在区块链生态内解决了数据归属、数据保护问题,依然难以约束数据适用方将数据复制、加工,卖到区块链生态之外。

“这个问题已经有理论能解决。”Vincent表示,有一种理论是,数据使用方可以在数据上跑算法,但却不能直接“看”到数据,沿着这个逻辑尝试,已经找到了解决办法。

事实上,在大数据领域,数据隐私是一个冷门、甚至是被故意忽略的领域。

“如果用隐私来交换便捷性或者是效率的话,很多情况下,他们(中国人)是愿意这么做的。”年初,百度李彦宏的这番话引起了激烈争论,却也表明了在数据领域,对流动性的重视一度高于隐私性的状况。

如今,数据的“流动性”已经遇到瓶颈,而解决了数据隐私保护的问题,才能让数据交易变得健康而顺利。

目前,已经有不少创业团队,在尝试将区块链技术与数据领域结合。

Vincent表示,数据归属权是最基础最重要的工作,“我们希望有更多的技术专家、工程师入场”。


分享到:


相關文章: