“馬蜂窩捅了‘馬蜂窩’” 旅遊點評數據造假被曝光

“馬蜂窩捅了‘馬蜂窩’”

旅遊點評數據造假被曝光


“馬蜂窩捅了‘馬蜂窩’” 旅遊點評數據造假被曝光

近日,某微信公眾號發佈了來自深圳乎睿數據有限公司(以下簡稱乎睿數據)的調查報告,稱旅遊攻略網站馬蜂窩所宣稱的2100萬條“真實點評”裡有1800萬條數據是通過軟件從點評和攜程等競品網站上抄襲而來,並貼出大量截圖作為證據。

文章發出後,在網絡引發關注。“點評造假”是否只是個別現象?通過調查,筆者發現,旅遊網站之間點評雷同的現象並不少見,“點評搬運”或成旅遊網站“潛規則”。

馬蜂窩捅了“馬蜂窩”

10月22日,北京螞蜂窩網絡科技有限公司回應承認部分點評造假,已對涉嫌虛假點評的賬號進行清理,並表示,針對文章中歪曲事實的言論和已被查證的有組織攻擊行為,馬蜂窩將採取法律手段維護自身權益,並於22日晚間起訴爆料公司深圳乎睿數據有限公司名譽侵權。

乎睿數據在發佈的報告中宣稱,其以“一字不落”才算抄襲的標準,共發現了7454個抄襲賬號,這些賬號合計抄襲了攜程、藝龍、美團等競品網站572萬條餐飲點評,1221萬條酒店點評,佔到官網聲稱的總點評數的85%,並提出了多個點評賬號出現自我身份矛盾、時間錯位、翻譯錯誤等現象。

文章發出後,引起網友極大關注。有網友戲稱該事件是“馬蜂窩捅了‘馬蜂窩’”。而據相關媒體報道,旅遊網站攜程與“去哪兒”同樣發生過“點評數據之爭”。2008年,因“去哪兒”網站中有數萬個頁面轉載有攜程酒店點評文章,攜程將“去哪兒”告上法庭。最終經法院審理確認,攜程擁有該網站內容及資源的版權,“去哪兒”行為屬於侵權。

多個旅遊網站均存在“點評搬運”現象

按照乎睿數據的說法,馬蜂窩若抄襲了1800萬條點評,如此海量的數據遠非人力所能完成,有業內人士表示,該行為或是利用爬蟲軟件完成。

所謂爬蟲軟件,是指按照一定規則,自動抓取互聯網信息的程序或者腳本。該人士表示,利用爬蟲軟件抓取其他網站數據,再搬運到自身平臺,這在互聯網行業並非新鮮事。

事實果真如此?爬蟲軟件抓取數據難度有多大?筆者隨機選取了北京一家酒店,利用爬蟲軟件,不到兩分鐘便抓取了其在攜程和同程旅遊網站中的百餘條點評內容。通過比對兩份數據,筆者發現,該酒店在兩個網站中存在13條完全雷同的點評,而且多數點評在兩個網站所顯示的日期完全相同。

其他平臺是否也存在此類現象?筆者進一步檢索該酒店在其他平臺的點評數據,發現驢媽媽、馬蜂窩等旅遊網站中,點評雷同的現象同樣存在。其中一條103字的點評內容在同一天內分別出現在了攜程、同程旅遊和驢媽媽網站上——這意味著有消費者在一天內通過三個平臺訂了同一家酒店,並發表完全相同的點評,顯然並不合理。筆者發現,該酒店在驢媽媽上一共有5條點評,均能在其他平臺的點評中找到完全相同的“孿生兄弟”。

“點評搬運”是網站行為還是個別酒店的行為?對此,筆者又隨機抓取了上海兩家排名較靠前的酒店在不同平臺的點評數據,發現或多或少均存在雷同點評,這些點評中,既有相對簡單的好評,也有長篇控訴的差評,部分點評賬戶連名稱都是“搬運”而來。值得一提的是,筆者在比對數據中將“一字不差”作為判定雷同的標準,許多在搬運後由人工進行“洗稿”的點評並未反映在內。

一名旅遊自媒體從業者告訴筆者,作為“非剛需”的行業,旅遊網站的流量往往受季節影響。而對於普通人而言,如果不是想給差評,往往不會特地上網站進行點評,這也造成許多中小旅遊網站缺乏人氣的現狀,某種程度上也催生了“搬運點評”的需求。

根治“數據造假” 立法執法須形成合力

對於此次“數據造假”的風波,馬蜂窩與乎睿數據的爭執依然未有定論,具體證據將有待雙方開庭時公佈。

但在業內人士看來,互聯網行業的“數據注水”似乎並不意外,特別是中小網站,主要靠的就是“流量+廣告”實現內容變現。馬蜂窩曾在上一次融資時表示,每月有1億活躍用戶,其中85%來自其移動應用程序。網站用戶每月發佈超過13.5萬篇旅遊文章,當時預計2017年個人旅遊產品的銷售額將超過90億元人民幣(合13億美元)。

儘管“數據造假”受到業內外普遍詬病,但是如何根治數據造假,從體制、機制上建立有效的防範糾錯和應對處置機制,依然任重道遠。

“數據造假行為的治理應該是一個多主體、多元化、綜合規制的過程。”中國互聯網協會研究中心秘書長吳沈括認為,首先應該明確各個主體的權責,鼓勵各方積極承擔相關責任,比如立法部門應儘快填補法律在這一方面規制的空白。其次,執法部門也應當革新監管方式,加大處罰力度,可採取設立“黑名單”、違規主體曝光等形式,為行業的發展劃定一條原則紅線。

(吳劍鋒 唐 弢)


分享到:


相關文章: