我用灵犬测了《王者荣耀》里的女英雄……


我用灵犬测了《王者荣耀》里的女英雄……

我用灵犬测了《王者荣耀》里的女英雄……


全国已经累积注册了两千多万个公众号,是一个头部吃肉、中部喝汤、底部喝西北风的状态,为了让自家的内容获得曝光,各路神仙都有很多骚操作。

比如前几天知乎还推给了我一篇秘籍,大意是在探探上做好一套资料,扮演女人来和男性配对,以此勾引男人加自己的微信。

我用灵犬测了《王者荣耀》里的女英雄……

加好友后自己一直扮演女人,再有意无意的对直男们露出公众号。

文章里兴奋地说道:“一个人一天转化进10个人,如果雇佣3个人来做的话,每天可以转化进30个人,一个月就是9000人,这可将近一万粉丝啊!”

……

30 x 30 = 9000?将近一万粉丝?

我用灵犬测了《王者荣耀》里的女英雄……

一个月涨粉“一万”这个数据在后文还被引用,抒发自己对世上无难事,只怕有心人的这句话的赞同。

为了能从千万大军中厮杀出来,男扮女装只是鸡贼的自媒体人中小小的一个伎俩。为了吸引流量,色情、低俗、标题党从未消失,各种迷惑文章层出不穷。

文章《震惊!著名LOL玩家和DOTA玩家,互斥对方不是男人,现场数万人围观》点开一看,发现是周杰伦和林俊杰合唱《算什么男人》。

《关于我市暴雨强制放假通知》点开一看,只有几个字“年轻人,你的思想很危险啊!”。

我用灵犬测了《王者荣耀》里的女英雄……

今日头条上每天产出数十万内容,为了过滤不合时宜的内容,听说有一个上万人的审核团队,我猜他们每天的工作大概是这样的。

我用灵犬测了《王者荣耀》里的女英雄……

全部靠人来审核,日复一日这个成本太高了,尤其内容还是爆炸式增长的,效率也容易跟不上。所以,今日头条很早就尝试用技术来做反低俗的工作。应该是国内最早建设的,每天都在迭代。

现在还放出了个简化的版本可以给普通的创作者使用,名叫“灵犬反低俗助手”。

我用灵犬测了《王者荣耀》里的女英雄……

它已经进化到了第三个版本,不但可以识别图片是不是低俗,还可以结合上下文理解文本,看看你是不是标题党或者是血腥暴力的内容。

像我这种做游戏的,以前检测玩家是不是说了粗鄙之语的办法主要是靠屏蔽字库,把所有屏蔽词都汇总在一起,匹配到玩家说的内容后,再进行各种处理(例如降低权重、转换成**、禁止发言)。

我用灵犬测了《王者荣耀》里的女英雄……

但这个办法已经太古老了,一是用户体验不好,因为词库一大,正常说话也容易被无意间转换成**,体验极差。

而词库太小,又达不到效果。

再者就是也很容易被绕过,比如用户打拼音和缩写就没办法了,大家都已经熟练掌握。

我用灵犬测了《王者荣耀》里的女英雄……

但是“灵犬”AI不一样,它用的是自然语言处理(NLP)技术,可以全局的理解文本,如今第三代同时使用“Bert”和半监督技术,训练数据集总量是1.2个T,相当于20个百度百科,包含920万个样本,准确率提升至91%。

我用灵犬测了《王者荣耀》里的女英雄……

说了这么多,但我觉得头条还是不相信中文语言的博大精深,一定是低估了这帮自媒体人的鸡贼程度。

我用灵犬测了《王者荣耀》里的女英雄……

正好头条搞了个小程序版,把精简版的功能开放给用户使用,就让我来看看到底谁比较睿智。

第一轮挑战:

人民日报:《电杆上抢修的大叔一低头,发现水沟里漂着个娃……》

识别难度:低

我用灵犬测了《王者荣耀》里的女英雄……

健康概率:90%。

评价:文章讲的是供电员工抢救溺水儿童的一事,应该没有比《人民日报》更正能量的公众号了,要是这也能翻船,头条的程序员的头就白秃了。

通过测试

第二轮挑战:

全世界不如一个你:《官方开车最为致命,四川卫视报道暗访按摩店,上演“鸡你太美~”》

识别难度:中

我用灵犬测了《王者荣耀》里的女英雄……

健康概率:45%。

通过测试

评价:这篇文章讲的是四川记者暗访按摩店,播出节目后关键部位未打码的相关段子。虽然表面上写的是段子,但是底下的评论都在评价王先生的尺寸。

所以健康概率不高也就很好理解了。

第三轮挑战:

青橙生活研究所:《刘强东的2分钟,真的算快吗》

识别难度:高

我用灵犬测了《王者荣耀》里的女英雄……

健康概率:58%。

通过

评价:这篇文章暗藏杀机,虽然看似是一个科普文章,用东哥的2分钟为引子,分析全球男人的性行为平均时间,得出的评价也算得上有理有据,但是角度相比之下还是偏向低俗。

市界:《刘强东明州24小时》就严肃的多了,还原了整个事件的过程,所以分数就很稳……

我用灵犬测了《王者荣耀》里的女英雄……

目前看来文章检测的可靠性还是很高的,不过不要高兴的太早。

还有一个环节是图片检测,图片检测的难度同样非常高,普罗大众一看就懂的内涵图,在AI的眼里看来也许并没有那么好理解。

以前通过裸露皮肤的比例来判断是否违规,而历史和艺术性的照片就会被误伤。

我用灵犬测了《王者荣耀》里的女英雄……

下面我将使用控制变量法,来测试一下“灵犬”对于图片的健康检测。

我用灵犬测了《王者荣耀》里的女英雄……

众所周知,《王者荣耀》里的女英雄原画曾遭到过不同程度的削弱,下面我们将对比削弱前后,看看影响健康值的浮动。

第一轮:

测试样本:不知火舞 新旧原画

修改处:增加了衣服两侧的布料

我用灵犬测了《王者荣耀》里的女英雄……

测试结果:

我用灵犬测了《王者荣耀》里的女英雄……

不知火舞加了这么多布料,仅仅从66%提高到了67%,提升幅度仅有1%。

原画:“这波修改太亏了。”

第二轮:

测试样本:武则天 海洋之心 新旧原画

修改处:增加了胸部的布料

我用灵犬测了《王者荣耀》里的女英雄……

测试结果:

我用灵犬测了《王者荣耀》里的女英雄……

AI居然直接给修改前的武则天打码了……健康概率提升幅度达23%。

第三轮:

测试样本:妲己 新旧原画

修改处:超大幅增加了胸部的布料

我用灵犬测了《王者荣耀》里的女英雄……

测试结果:

我用灵犬测了《王者荣耀》里的女英雄……

老版本依然打码,新版修改之后健康概率提升幅度高达57%。

以王者荣耀的群众基础来看,这轮修改非常有必要,AI打码也算情有可原……

看来AI对直观的视觉刺激检测更为严格,对似有若无的的精神刺激拿捏还并不到位。

我用灵犬测了《王者荣耀》里的女英雄……

总体看来,今日头条的“灵犬”AI来做简单的过滤已经没什么问题,至少可以帮助审核团队大幅的提高审核的效率,而且我用的只是一个简化版,看来今日头条的审核员不用像程序员一样秃头了。

但是完全交给AI来审核目前来看还是不现实,人民群众的智慧是无穷的。比如我们一看就懂这是CXK,可是AI想要分辨就非常困难。

我用灵犬测了《王者荣耀》里的女英雄……

更何况“低俗”本身界限就很模糊,在未成年人眼里看来低俗的图片,在成年人看来未必,一张内衣照片是放在淘宝还是文章里,在不同语境下去看待时,是否低俗也同样是变化的。

所以AI+人工复审的机制将会长期存在。

不过至少有一点毋庸置疑,那就是人既没有自己想的那么开放,AI也没有我们想的那么呆板,界限已经越来越模糊。

这个世界啊,未来究竟会是怎样?


分享到:


相關文章: