馬蜂窩“被捅”千萬條評論造假 訴乎睿數據名譽侵權獲立案

10月21日,一篇由自媒體“小聲比比”發佈的《估值175億的馬蜂窩 竟是一座殭屍和水軍構成的鬼城?》的文章在網絡刷屏,作者梓泉根據乎睿數據團隊提供的數據報告在文中表示,馬蜂窩2100萬“真實點評”中有1800萬條是通過機器人從競爭對手平臺上抄襲而來。紛爭之際,10月22日晚間,馬蜂窩起訴深圳乎睿數據有限公司、丁子奎名譽侵權案獲立案。

馬蜂窩“被捅”千萬條評論造假 訴乎睿數據名譽侵權獲立案


馬蜂窩誕生於2006年,已在2017年完成1.33億美元的D輪融資 圖片來源:東方IC

“旅行之前,先上馬蜂窩。”2018年世界盃期間一則廣告席捲網絡,在北京馬蜂窩網絡科技有限公司(以下簡稱馬蜂窩)收穫大波流量的3個月後,這個憑藉用戶原創內容(UGC)逐步壯大的在線旅遊平臺,被一個叫乎睿數據的團隊(深圳乎睿數據有限公司)揭開了疑似數據造假的一角。

10月21日晚間,自媒體“小聲比比”在已發佈《估值175億的馬蜂窩 竟是一座殭屍和水軍構成的鬼城?》一文後,如約發佈了第二篇指馬蜂窩充斥殭屍和水軍的報告文章。隨著輿論發酵,馬蜂窩於22日上午發佈公開聲明表示,針對該文中歪曲事實的言論,和已被查證的有組織攻擊行為,馬蜂窩將採取法律手段維護自身權益。10月22日晚間,馬蜂窩起訴深圳乎睿數據有限公司、丁子奎名譽侵權案獲立案。

2014年4月,馬蜂窩CEO陳罡曾經在微博公開炮轟去哪兒網通過虛假評論造假,稱去哪兒網的刷點評行為已經動搖到了行業誠信的根基。如今,馬蜂窩“被捅”,有何說法?

馬蜂窩陷“抄襲門”

10月21日,一篇由自媒體“小聲比比”發佈的《估值175億的馬蜂窩 竟是一座殭屍和水軍構成的鬼城?》的文章在網絡刷屏,作者梓泉根據乎睿數據團隊提供的數據報告在文中表示,馬蜂窩2100萬“真實點評”中有1800萬條是通過機器人從競爭對手平臺上抄襲而來。

文章一經發布,公眾號便收到了馬蜂窩“損害商業信譽”的投訴,梓泉在次日的推文中稱,不僅如此,“在文章發出來8個小時以後提及的賬號從搜索欄屏蔽,點評內容也在個人頁被刪除了。”

10月22日,乎睿數據團隊以郵件形式向《每日經濟新聞》記者發送了一份關於馬蜂窩的25頁數據報告,該報告顯示馬蜂窩疑似存在評論搬運、遊記摻水、問答抄襲的現象。

乎睿數據團隊在報告中表示,經初步探索馬蜂窩UGC和用戶數據並與競品比照,結果發現,包括官方賬號在內的許多螞蜂窩用戶,人均抄襲了數百名大眾點評網用戶的評論以及大量來自攜程、藝龍、Agoda、Yelp等知名網站的用戶內容,甚至還屢次在官方有獎活動中拔得頭籌。

10月22日晚間消息,針對自媒體報道的馬蜂窩數據造假一事,馬蜂窩已向北京市朝陽區人民法院提起訴訟,稱乎睿數據侵犯名譽權,目前已獲立案。

馬蜂窩否認85%點評造假

馬蜂窩“被捅”千萬條評論造假 訴乎睿數據名譽侵權獲立案

上述報告顯示,乎睿數據團隊經過數據分析發現,馬蜂窩上有7454個抄襲賬號,合計從競品網站上抄襲搬運了572萬條餐飲點評與1221萬條酒店點評,佔到官網聲稱總點評數的85%。

乎睿數據團隊剔除“抄襲賬號”後,在餘下的所有賬號中選擇了15000個最活躍的賬號,發現用戶在答題、點評等行為時間上高度一致,且與其他同類型評論網站發佈時間差異較大,大多是工作時間(週一至週五10點至12點、14點至17點)更為活躍。

乎睿數據團隊還發現,一批在遊記攻略中植入廣告的商家通過抄襲、拼接等“做號”、“洗稿”手段批量炮製出含有廣告內容的遊記、問答、回覆,再由大量的小號、馬甲進行人工置頂,達到以低成本對平臺上億用戶打廣告的目的。

乎睿數據團隊“捅了”馬蜂窩,一時間輿論如潮。馬蜂窩於22日上午7:45分在微博發佈聲明稱,馬蜂窩的UGC內容數據中,遊記和攻略佔比78.91%,嗡嗡(旅行故事)佔比7.92%,問答佔比10.26%。這些數據背後是用戶真實的情感與回憶,也是馬蜂窩內容的真正價值。

馬蜂窩進一步表示,點評內容在馬蜂窩整體數據量中僅佔比2.91%,涉嫌虛假點評的賬號數量在整體用戶中的佔比更是微乎其微,馬蜂窩已對這部分賬號進行清理,其認為“自媒體文章所述的馬蜂窩用戶數量與事實和第三方機構數據都嚴重不符”。與此同時,一直以來,馬蜂窩嚴厲打擊遊記和問答中違規廣告的行為,平均每週處理26000條違規廣告信息、查封15000個違規賬號。

對於報告數據挖掘選用的工具與分析的科學性與準確性等問題,《每日經濟新聞》記者22日通過郵件向乎睿數據團隊提問,但截至發稿尚未收到回覆。

數據爬蟲業內屢見不鮮?

馬蜂窩“被捅”千萬條評論造假 訴乎睿數據名譽侵權獲立案

2018年10月21日,馬蜂窩旅遊網對全站遊記、攻略、嗡嗡(旅行故事)問答、點評等數據進行了核查,並對涉嫌虛假的信息展開查處。

馬蜂窩在公開聲明中表示,餐飲點評不是馬蜂窩的內容核心,且部分點評來自於遊記、問答的內容的提取,自媒體將馬蜂窩用戶內容生產的活躍週期,與餐飲等本地生活服務類APP相對比,並解讀為馬蜂窩員工有組織地抄襲,存在明顯的誤導傾向。

實際上,就此事業內也有不同的觀點。

“馬蜂窩承認部分點評來自內容提取,讓UGC行業或多或少地暴露出原創內容端的不足、不同端口資源共用等問題。”業內人士分析認為,馬蜂窩被疑抄襲的內容存在一定的被“反爬”跡象,比如點評中出現翻譯提供方的字樣等恰恰說明這是行業比較常見的操作。

電子商務研究中心生活服務電商分析師陳禮騰認為,有些平臺從其他平臺抓數據的目的是為了製造流量很大的假象,既給用戶看、商家看,更是給投資人看。由於不涉及到數據庫門檻,在技術上沒有難度,任何一個爬蟲工程師就可以做到,也可以批量處理,通常是“機器抓取+人工編輯”。

“互聯網公司利用爬蟲技術,從其他平臺抓取數據的行為應該說較為常見。”陳禮騰表示。

此外,從事旅遊平臺管理的技術員小王告訴《每日經濟新聞》記者,討論行業共性問題時首先要清楚這次報告顯示的數據抓取和分析是否存在系統性偏差或者內定指標。他建議,可以同樣抓取相關平臺數據做行業對比分析才有說服力,除此之外應把平臺系統性造假和用戶自身一稿多投的問題區分開。“前者是蓄意欺騙,後者算是監管不嚴。”

爬蟲抓取、抄襲和造假在互聯網行業並不少見,陳禮騰表示,甚至已經成為很多平臺屢試不爽的一大“捷徑”,但對於像馬蜂窩這樣的企業而言,或許入駐馬蜂窩平臺的商家為吸引人氣和流量所為的可能性更大。

馬蜂窩“被捅”千萬條評論造假 訴乎睿數據名譽侵權獲立案


究其原因,業內人士認為,正是因為用戶原創內容愈發趨於商業化,在此情況下想要獲取帶有流量的原創內容的成本變得越來越高。“在用戶從確定旅遊目的地到購買旅遊產品的場景中,企業僅僅依賴UGC基礎上的廣告營收是遠遠不夠的,變現、盈利成為生存難題,而反過來這些客源也勢必會成為企業間爭奪的核心資源。”

平臺形象遭遇危機

電子商務研究中心特約研究員、北京志霖律師事務所趙佔領律師指出,用戶點評版權存爭議的核心問題是存在法律“空白”,任何一家平臺未經允許擅自抓取其他平臺上用戶所發佈的信息的行為如果屬實,就涉嫌不正當競爭。

陳禮騰進一步指出,如該事件屬實,消費者對於平臺的信任度將大打折扣,造成用戶流失,品牌形象、未來經營都將受到一定影響。

馬蜂窩“被捅”千萬條評論造假 訴乎睿數據名譽侵權獲立案


從旅遊社區起步的馬蜂窩誕生於2006年,在2011年10月及2013年4月,分別獲得A、B兩輪融資。2015年1月獲得高瓴資本等投資的8500萬美元C輪融資,同年發佈自由行戰略後探索出了一條從內容到數據再到交易的商業模式,目前已在2017年完成1.33億美元的D輪融資。

彼時,馬蜂窩CEO陳罡在D輪融資的內部信裡表示,每月有1億活躍用戶,其中85%來自移動應用程序,“三年後,螞蜂窩將成為中國最大的旅遊流量平臺”。馬蜂窩曾公開表示該網站的用戶每月發佈超過13.5萬篇旅遊文章,當時預計2017年個人旅遊產品的銷售額會超過90億元人民幣。

目前,無論馬蜂窩平臺背後的真實數據佔比多少,其核心價值勢必受到投資者的關注與考量。但從估值影響上看,陳禮騰認為,對於投資者言這些數據僅僅是一些參考指標,並非其核心內容,最終還是要看馬蜂窩的轉化率及盈利能力如何。如此看來,該事件對於馬蜂窩的投資人信任與核心估值是否會產生較大影響尚難定論。

馬蜂窩在此次的聲明中表示,2016年以前,馬蜂窩曾激勵用戶發表點評,點評數據出現快速增長。但隨著馬蜂窩全方位移動互聯網化及用戶量級的增長,以遊記、攻略為代表的長內容,以嗡嗡(旅行故事)、問答為代表的短內容產品成為運營重心,它們共同構成馬蜂窩的核心競爭力。

根據消費者權益保護法和新出臺的電商法等相關法律,陳禮騰說,若上述自媒體曝光信息屬實,馬蜂窩的做法或已涉嫌違法;若只是平臺上商家所為,馬蜂窩作為平臺享有“避風港原則”規定的一定的免責權利,具體是否該承擔責任,則要看平臺有沒有盡到應盡的商家管理、平臺治理、信息審查這方面的義務。


分享到:


相關文章: