美猴王的第七十三变:大数据分析

西天取经,孙悟空一路护法,历经八十一难,终成正果。他能踏平坎坷成大道,靠的是什么?一个字:识别。你看,不管是天上的神仙假扮成人间的怪物,还是菩萨的喽啰变幻成占山的大王,孙悟空的火眼金睛都能一一识别,斗罢艰险又出发。


美猴王的第七十三变:大数据分析

西游路线图

隔行如隔山,但隔行不隔理。搞大数据,与西天取经是相通的:孙悟空西天取经,一路护法靠识别;其实,大数据的挖掘与应用,同样有一个最基础的工作——数据识别。

各位看官,且听分解——

弥勒佛前司磬的童儿在小雷音寺变成黄眉大王,悟空的火眼金睛因为看到山上“禅光瑞霭之中有些凶气”而一眼就识别出来。这其实就是大数据中最基础的识别:数据清洗。

孙悟空与二郎神斗法变成一座土地庙时尾巴无处安放只能変做庙后的旗杆,二郎神因为“不曾见一个旗竿竖在庙后面的”而一眼就识别出来了。这其实就是大数据识别的一个重要规则:唯一识别码。

红孩儿在火云洞变成一个挂在树上的小孩,孙悟空先是自己掂了掂发现“七岁小孩儿不足四斤重”,接着把土地老儿叫出来问得“本是牛魔王的儿子”,两者相连,于是识别出此小孩不是凡人。这其实就是大数据识别的核心:数据连接。

狮驼岭上的青狮、白象、大鹏拦住了唐僧师徒的去路,孙悟空从山中老人那问得对方的住址,又自己跑到那里看清了他们的相貌,还飞到天上找如来问清了他们的身世,最终一一识别,化险为夷。这其实就是大数据识别的重要目标:全网识别,生成画像。

美猴王的第七十三变:大数据分析

欲知详情如何,且听细细道来:

悟空识别黄眉大王,靠的是“数据清洗”

孙悟空大闹天宫后,被二郎神抓回天庭。玉帝下旨,将孙悟空推入八卦炉中,炼成仙丹。悟空在八卦炉中无法招架三昧真火,“他即将身钻在‘巽宫’位下”。巽在八卦中代表风,有风就没有火。只是风吹出的烟,把眼睛熏红了,这就得来了“火眼金睛”。

后来,悟空发现不管对方怎么变幻,“火眼金睛”都能识别对方真身。

《西游记》第六十五回,师徒四人忽见山前有座寺庙,唐僧下马要拜。悟空道:“此处是倒是座寺庙,然而少吉多凶。”唐僧肉眼凡胎,不能识别,笃信“既是寺庙,必定有个佛祖在内”。于是,唐僧一步一拜,孙悟空不仅不拜,反而对庙里那个看似佛祖的黄眉老和尚“双手轮棒,上前便打”。唐僧骂道:“泼猢狲!害杀我也!”悟空道:“此佛乃妖王幻化!”

原来,孙悟空早就凭借火眼金睛,瞧出寺庙的上方“禅光瑞霭之中,又有些凶气”;到了那宝殿之上,“行者又仔细观看,见得是假”。孙悟空的“火眼金睛”把采集到的这些零散数据一番清洗,料定此和尚必不是佛祖真身。果然,几个回合交手下来,最后从弥勒佛那里得知,庙里的黄眉大王原是弥勒佛前司磬的黄眉童儿遛到了凡间。

二郎神识别孙悟空,靠的是“唯一识别码”

不管对方幻化成什么形象,孙悟空通过火眼金睛都能够识别出来。但同时,如果对方十分强大,纵使孙悟空会七十二般变化,对方也同样能把他识别出来。

《西游记》第六回,二郎神领旨捉拿孙悟空。两人打了三百多个回合,不分胜负。打斗期间,孙悟空分别变作麻雀、鹚老、鱼儿、水蛇隐藏自己;二郎神逐个识破,并化作老鹰、海鹤、鱼鹰、灰鹤一一应对。孙悟空没法,最后只好“变了一座土地庙儿”。但尾巴不好收拾,“竖在后面,变做一根旗竿”。随后二郎神赶到,“却见有一间小庙,急睁凤眼,仔细看之,见旗竿立在后面”,就知“是这猢狲了!他今又在那里哄我”。

原来,二郎神“也曾见庙宇,却不曾见一个旗竿竖在后面的”,于是通过寺庙的旗杆应该竖在庙前而不是庙后这个识别规则,判别出此庙并不是真正的寺庙。果然,二郎神上前恐吓一二,悟空便化了原形,“扑的一个虎跳,又冒在空中不见”。

悟空识别红孩儿,靠的是“数据连接”

识别是一个过程,没有终点。有时仅靠第一方数据无法识别,就需要通过动态连接各种外部数据。在西游记中,有时对方变化多端,孙悟空只能知道对方不是真身,至于真身是什么,实在是认不出来。所以,他有时去天上问神仙,有时到地下找土地。你看,在第四十回,就遇到了这么一种情况——

师徒四人行至火云洞,听见有人喊“救命”,见有个小孩被捆着倒挂在树上。唐僧要孙悟空救下小孩驮着前行,孙悟空只得照做。但他心生疑虑,掂了掂小孩重量,发现“只有三斤十来两重”,于是问道:“今年几岁?”小孩说“七岁。”悟空笑道:“一岁长一斤,也该七斤。”便抓过小孩往石头上用力一扔:“分明是个精灵,变化得这等。”小孩见事情败露,一阵阴风,卷走了唐僧。

悟空虽然识别了对方,但不知那小孩来历。他召出土地老爷一打听,得知对方“本是牛魔王的儿子,乳名叫做红孩儿”。悟空听到这话满心欢喜,因为他还想起另一个信息:牛魔王与他在花果山是结拜兄弟,这红孩儿应叫他叔父。

孙悟空识别红孩儿,靠的是数据连接:他自己用手掂量重量,获得的信息叫第一方实名数据;他找土地老爷问到小孩儿身世,获得的信息叫第三方实名数据。两者一连接,就把红孩儿完全识别出来。

悟空跨越狮驼岭,靠的是“全网识别”

有的时候,即使有了内部第一方数据,也有了外部第三方数据,让然还不能完全识别对方。怎么办?

《西游记》第七十四回,狮驼岭上的青狮、白象、大鹏拦住了唐僧师徒的去路。孙悟空用了更复杂的办法识别对方。

孙悟空先是从山中老人那得到对方的住址。“此山叫做狮驼山,中间有座狮驼洞,洞里有三个老妖,专在那里吃人。”唐僧大惊失色,命悟空去打探虚实。

悟空于是又自己跑到狮驼洞中看清了他们的相貌。“一为青狮怪,生得凿牙锯齿;一为白象怪,生得凤目金睛;一为大鹏金翅雕,生得金翅鲲头”。

而且,悟空还飞到天上找如来问清了他们的身世:青狮怪的主子是文殊菩萨,白象怪的主子是普贤菩萨,大鹏怪更有来头,如来说是自己的舅舅:“五台山文殊、峨眉山普贤,这是老魔、二怪之主。自那混沌分时,凤凰育生孔雀、大鹏。孔雀出世之时能吃人。我在雪山顶上,早被他把我吸下肚去。是我剖开他脊背,跨上灵山,故此,封他做佛母孔雀大明王菩萨。大鹏与他是一母所生。”

悟空自己获得的是第一方数据,在山中老人那里获得的是第三方数据,这两类是线下数据;悟空还飞到如来那里获得了线上数据。第一方、第三方、线下、线上,将这些数据一一连接,这个过程就叫全网识别,最终生成了360度画像,化险为夷。


分享到:


相關文章: