探秘中国AI村 为人工智能数据的贴标人 收入可观

探秘中国AI村 为人工智能数据的贴标人 收入可观

在中国小城市、乡镇,无数年轻人正成为“数据贴标人”,他们每天坐在电脑前八小时,点击几十张照片,概述背景、前景和特定物品。他们的工作为AI公司的算法提供和处理大量数据。随着技术的进步,那些“低技能”的工作者将会失业,但也创造了很多“低技能”的工作。

俊凯的办公室坐落在河南省东沙河的边缘,今年夏天,19岁的周俊凯和他26岁的堂兄在这里建立了他们的小型数据标签工厂。

由他们创办的俊鹏科技公司办公楼位于河南省典型的农村传统四合院。这房子很大,有两三层楼高,不像中国大城市常见的公寓楼。房子后面,一个男人在一块土地上耙树叶,周俊凯说这是一块农田。

探秘中国AI村 为人工智能数据的贴标人 收入可观

在房子里面,唯一温暖的房间是办公室,十多个年轻人坐在十几个大电脑屏幕前。

探秘中国AI村 为人工智能数据的贴标人 收入可观

这些年轻人是“数据贴标人”,他们每天坐在电脑前8个小时,点击几十张照片,概述背景、前景和特定项目,所有这些都是基于从事人工智能工作的客户的规格。有些可能标示医疗扫描,有些带有风景和树木的图片,还有一些带有无人驾驶车辆的道路图片。这些是AI算法学习“看”的数据。

人工智能产业依赖于这种廉价的劳动力,因为算法和“机器学习”在很多情况下是由真正的人训练的。

人工智能需要大量的数据来学习和识别模式,无论是图片、音频还是文本,因为它们不同于人类解释媒体。要教算法如何准确地识别苹果是苹果,它需要成千上万的苹果图片。此外,该算法容易被欺骗。在一项实验中,安全研究人员发现,通过扭曲校车图片,人工智能系统再也无法识别校车,即使人眼看不到这种变化。

很少有地方的资本流入中国的人工智能产业比河南更好。几年前,河南富士康的工厂(生产苹果产品)和电子工厂很有名。现在,河南的城镇有办公室职员,他们努力工作,单调乏味地输入信息,使计算机更智能。

咨询公司AIB的一项研究显示,去年,风险资本家在中国的人工智能初创企业中投资了50亿美元,这使得该行业的资本首次超过美国。中国政府已将人工智能部门列为优先事项,并于去年夏天宣布了一项雄心勃勃的政策:到2030年建立价值1500亿美元的人工智能产业。

在带动中国经济发展的制造业中,河南人也发现自己处在一个劳动密集型数据标签公司不断增长的边缘行业,这些公司为算法提供和处理大量的数据。除了几家中国大城市的大型企业外,这些数据标签公司主要分布在小城市、小城镇和农村地区。

周俊恺在平顶山的西部城镇看到一些类似的数据工厂后,想开一家自己的商店。他的堂兄妹们一起积蓄了好几年(45000美元),买了几十台电脑,租了办公室。据他们所知,他们是民权县唯一从事这一行业的人。

"你不能指望工资这么高的人做这种劳动密集型的工作。"

从商学院毕业后,周俊凯开始进入这个行业。在那之前,他一直在找工作,但是他到处都受到限制。

探秘中国AI村 为人工智能数据的贴标人 收入可观

周俊凯,19岁,来自河南省民泉县的一个村庄。他说,从贸易学院毕业后,他的工作选择有限。

“如果你不知道将来要做什么,你可以去大城市,成为白领,每天挤地铁和公共汽车,”他说。至于其他方面,如果你想取得成功,你需要大量的知识、经验和教育。这些是我们没有的.”

他很难找到汽车修理工的工作。他说他在一家工厂工作了一段时间后就辞职了——一天工作14个小时太苦了。

“我以为我再也受不了了,”他说,“但我现在从事的行业觉得它有潜力。”

韩金浩说,现在很多人涌向数据标签行业。一年多前,他在河南省会郑州创办了数据标签公司Dianwokeji,现在拥有100多台数据标签机。

他说:“尽管贴标签是一项相对低水平的工作,但进入门槛相对较低,而且仍属于人工智能行业。因此,我们认为,如果我们可以从这里开始,然后慢慢地逐步走向更高价值的工作。”

韩国拥有超过6000台数据标签设备,这些设备已经在他构建的类似Craigslist的平台上注册,而较小的平台可以找到外包或雇佣新员工。

18岁的赵孟遥是个新手。她今年十月开始在周的公司工作。当我去办公室时,她正在跟踪停车场停车位的白线:扭曲的图像,曲线就像照相机上的鱼眼镜头,但是她很容易地把鼠标放在上面。20分钟后,赵梦遥继续处理她的下一张照片。这是停车场的另一个景色。

探秘中国AI村 为人工智能数据的贴标人 收入可观

年轻女孩正在学习如何给汽车打分。

在她的旁边,一个年轻人描绘了一个歌手穿的橙色连衣裙蓬松的边缘。接着,他开始画一个高尔夫球手的轮廓。

赵梦遥曾经在婚纱摄影棚当过化妆师,但是他辞职了,因为他厌倦了工作。几天来,她不得不早上4点起床准备客户拍摄,晚上7点回家。

现在,她对自己工作的节奏感到满意:八点到六点,中间一个半小时。午休期间,她和同事还可以聊聊他们一起玩的游戏。

她说:“我觉得很好。这里很自由。”

赵说,薪水还可以:每组照片(大约20张)可以拿到20元。她每天能完成四到八组照片,80到160。当我问她这些照片会去哪里,会用来做什么时,她说她不知道。

数据标签的月工资从2000元到4000元不等。这相当于中国工人的平均可支配收入或税后收入——2017年为2164元。郑州有这么多这样的工作可以得到这样的报酬。”

探秘中国AI村 为人工智能数据的贴标人 收入可观

我的大多数科技人员都20出头。

AI照片识别是使用ImageNet图像来进行教学的,ImageNet图像是由斯坦福大学教授李飞飞和她的团队创建的一个超过1400万张图像的数据库。这个数据库依赖于亚马逊的Macanical Turk,它以每件几美分的价格将诸如照片标签之类的劳动密集型任务外包给互联网用户。

然而,随着世界各地的公司越来越多地转向人工智能在从无人驾驶汽车到医疗诊断等行业的应用,ImageNet和Mchanic Turk已经证明是不够的。

你认为我们会让无生命的东西控制人类吗?

数据标签公司Awakening Vector的创始人Peter Yang说:“医疗企业需要非常详细的数据来使AI学会如何区分,比如在CT扫描中区分肿瘤和眼球。”它需要来自大量不同照片的数据来指示肿瘤的样子,这需要人工点击和标记。

“但大多数人工智能初创公司只有少数全职员工,通常是数据科学家。”

“这需要大量的体力劳动。你不能指望收入这么高的人做这种劳动密集型的工作,所以你得把它外包出去。”

此外,还存在隐私和质量控制问题。

例如,医学图像需要保密。AmazonMachineryTurk的任务是由任何想要赚取额外收入的注册用户完成的,而不是由周一到周五有固定薪水的员工完成的。

外包意味着这些业务现在正在全国各地扩展。

杨彼得的业务集中在新疆,客户包括百度和诺华制药公司。韩金昊的公司为国内一些初创的无人驾驶汽车提供服务,并在河南和邻近的山东省的一些小城市设有分公司。

传统上,随着技术的进步,那些“低技能”的工人将失去工作。学术研究大多支持这种观点。

但这并不意味着技术必然会取代所有的工作。

波士顿大学科学技术与政策研究项目执行主任詹姆斯·贝森说:“历史研究表明,自动化带来了就业的繁荣。”

“以纺织业为例。十九世纪初,大多数人只有一套衣服,因为布料太贵了。但是随着科学技术的发展,一些任务变得自动化,制衣成本降低,人们对服装的需求也越来越大。服装需求的增长带来了更多的就业机会。虽然纺织业被认为是“低技术”产业,但随着规模的迅速扩大,它也带来了新一代的工人,他们必须学会操作复杂的机械。只有当需求得到满足,就业才会下降。

目前,中国的劳动力仍然很便宜。

这项工作超出了图片标签。许多公司也支付语音识别、视频标签甚至原始数据的费用。

对于一些工人来说,成为新工业的一员有着明显的自豪感。

我们正在做一些非常基础的工作,虽然只是为了帮助机器人学习和查看大量数据,但我们也是其中的一个非常重要的部分。

因此,如果有一天,算法学会自己识别事物,成千上万的“低技能”人工智能人才会失去工作吗?

对此漠不关心:“如果我们真的到了那个阶段,那么人类也许就不能生存。你认为人类会让无生命的东西控制人类吗?我们只会教它如何为人类服务。我们不会教他这么好,以至于有一天我们会为这台机器服务。”

如果你有什么意见或者感兴趣 请留言关注


分享到:


相關文章: