一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

碰巧這個團隊在美國學的都是數據分析,一怒之下決定訓練一個模型,用於篩選餐飲評論的水軍,恰巧馬蜂窩成了他們的練手對象,沒想到不爬則矣,一爬把馬蜂窩給捅了!

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

這篇文章中表示:“在馬蜂窩網站上,發現了7454個抄襲賬號,平均每個人從攜程、藝龍、美團、Agoda、Yelp上抄襲搬運了數千條點評,合計抄襲572萬條餐飲點評,1221萬條酒店點評,佔到官網聲稱總點評數的85%。”

文章中還列舉了幾項抄襲石錘:

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

還有的抄襲賬號自相矛盾,性別忽男忽女,甚至有些直接調用Google翻譯接口

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

馬蜂窩回應

22日早上,馬蜂窩也隨即發佈了聲明,表示會對涉嫌虛假的信息,進行查處。

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

另據最新消息,針對自媒體報道的馬蜂窩數據造假一事,馬蜂窩已向北京市朝陽區人民法院提起訴訟,稱乎睿數據侵犯名譽權,目前已獲立案。

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

23日,馬蜂窩CEO陳罡也針對此事作出回應:馬蜂窩在餐飲等點評數據方面存在部分問題,但遠沒有外界所表述的那麼誇大。目前已經重新梳理工作流程,堵住漏洞。

網友怎麼說?

目前,這件事已經在各大論壇都議論紛紛:

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

私信小編007即可獲取驚喜大禮包一份哦!

這件事總算讓我見識到程序員的厲害之處了:

一位爬蟲工程師寫的爬蟲!把估值175億的馬蜂窩給捅了!

‘水軍’和‘爬蟲’一直都存在於互聯網行業,因為流量和數據對於一個互聯網企業不可或缺,關於數據糾紛問題在互聯網更是屢見不鮮,目前此事真相還未明瞭,我們暫時不予置評。

但通過這件事情告訴我們, 惹誰也別惹程序員 !尤其是有正義感又閒的技術宅。


分享到:


相關文章: