獨家|愛奇藝如何用大數據助力娛樂工業革命?

獨家|愛奇藝如何用大數據助力娛樂工業革命?

本文約4278字,建議閱讀8分鐘。

本文為你講述愛奇藝快速發展的背後,數據如何發揮作用、發揮什麼原因的作用。

本文為清華數據科學研究院聯合大數據文摘發起的年度白皮書《頂級數據團隊建設全景報告》系列專訪的第四篇內容。《報告》囊括專家訪談、問卷、網絡數據分析,力求為行業內數據團隊的組建和高校數據人才的培養提供指導性意見。前往文末參與填寫問卷,將獲得《報告》完整版~

網飛公司(Netflix)產品副總裁Todd Yellin曾如此解釋Netflix的成功:Netflix就像一個雙螺旋,把科技和娛樂創意兩條線給拉緊在一起。

全球擁有超過1億會員,每日平均觀看時數超過140億小時, 娛樂當道,網飛,這家全球最大的視頻流媒體服務提供商的成功,說明了數據在視頻娛樂上大有可為。

而在這個重內容創作、長期以來靠“藝術家”驅動的領域,將數據思維與業務線有效地結合,並不是一件容易的事情。

對於這個話題,國內或許沒有哪家公司比愛奇藝更有發言權。

作為一家視頻娛樂公司,愛奇藝在今年接連打造出《中國新說唱》(原《中國有嘻哈》)、《偶像練習生》這樣的爆款綜藝。在今年三月,愛奇藝成功上市。根據8月1日剛剛發佈的第二季度財報顯示,愛奇藝會員規模達6710萬,同比增長率達到75%。

從選角到會員運營,愛奇藝快速發展的背後,數據到底在發揮什麼樣的作用?

從“有嘻哈”說起

獨家|愛奇藝如何用大數據助力娛樂工業革命?

去年夏天,愛奇藝將嘻哈熱這一檔綜藝帶到了多數中國人的面前,每期視頻點擊率過2億,單從數字來看,這是一檔相當成功的節目。但在其出現之前,沒有人能想象得到,這樣一個偏小眾的音樂形式在中國有如此大的號召力。

“在決定做這檔節目之前,我們通過數據分析發現嘻哈在中國是有一定根基和生命力的 ,只是沒有一檔娛樂節目去將它帶到公眾面前。” 愛奇藝大數據和商業智能負責人孫斌告訴我們。

“雖然通過用戶群體畫像,我們發現中國的嘻哈愛好者群體偏年輕,是教育背景、理念、經濟水平都不錯的一群人,但在愛奇藝這麼大的受眾背景下,如果開設一檔有關嘻哈的娛樂節目,誰都不知道能不能火。”

之後,愛奇藝分析了用戶的站內行為,包括瀏覽的內容、評論和彈幕是否與嘻哈相關,泡泡社區(愛奇藝用戶的粉絲社區)的活動中是否參與了嘻哈相關的圈子及討論;也通過合法獲得的站外數據,對全網輿情進行分析,瞭解嘻哈音樂在全網用戶中的情況。孫斌介紹:“根據所有的這些線索,利用如自然語言處理結合大數據分析方法,才得出嘻哈音樂在站內站外用戶中已經很有根基,也很有生命力的結論 。”

而這背後的價值並不止於此。

孫斌表示,這整個的過程是一個良性循環。“我們在數據分析的基礎上可以做出一些節目,而節目後獲得的反饋又會幫助我們完善用戶的畫像和輿情動向,從而進一步探尋觀眾的需求,做出讓大家更滿意的節目。”

不僅是節目的分析,愛奇藝將數據分析應用在各個方面。在背後支撐這一切的,是一個叫做“通天塔”的數據平臺。

打通分散數據,建一座數據“通天塔”

獨家|愛奇藝如何用大數據助力娛樂工業革命?

由於各種各樣的原因,許多公司的數據是分散的,數據平臺和數據應用團隊也是獨立的,一旦公司規模逐漸擴大,如果不同團隊的數據沒有很好結合起來,就會使數據形成一個個的孤島。

而愛奇藝所倡導的,是一個全棧的(full-stack)組織架構:從最底層的數據產生與採集,到中間的數據加工分析,一直到最上層的應用,以及在大數據平臺之上的商業分析、運營分析、產品分析,都集中在一個“中央集權”的團隊裡,全部實現一站式管理,使得公司中的各個角色能夠非常快捷地獲取自己想要的數據來輔助分析。這既包括服務於公司內部系統,如商業決策分析、商業智能系統,也包括服務於公司外部應用,如針對終端用戶的個性化推薦。

孫斌介紹說,在通天塔之前,不同的數據系統之間理論上相通,但存在壁壘。畢竟那是“從舊歷史來的系統,需要適應需求,重新整合成新的統一大數據平臺。”

這個統一的大數據平臺,就是“通天塔”。

“我認為這個名字是對愛奇藝內部情況的一個精準的描述。它的目的就是建立起一個所有的業務數據平臺上的大倉庫,理清全部‘血緣關係’,實行統一的管理。” 孫斌反覆強調了統一大數據平臺的重要性,“我們希望把我們自己的數據,包括以合法手段收集的到的全網數據蒐集起來,最終實現這個目標。”

這其中產生的價值是不可估量的。通過數據分析,許多看似不相關的領域都可以相互聯繫,相互促進。

孫斌告訴我們,娛樂和生活,和人格都是息息相關的。“很多時候在運作之前是意識不到的。不過一旦聯繫起來,比如繪製出用戶的群體畫像,就可以發現很多不一樣的東西,這就是數據的魅力。”

擴展數據能力,讓“藝術家”也有數據思維

獨家|愛奇藝如何用大數據助力娛樂工業革命?

對於愛奇藝這樣的視頻公司,內容和娛樂是主要業務,所以團隊很大多數是內容創作者。如何讓“藝術家”們在感性思考的習慣下,也培養起數據思維,是一個大難題。

孫斌認為,數據團隊提供的是平臺能力,而絕非僅僅數據本身。

“我認為一個健康的大數據平臺不應該把所有事情都交給所謂的數據團隊來做,而是讓數據團隊提供數據能力。”

所謂數據能力,一是提供直觀的,可視化的數據(如數字、圖表),二是提供數據工具,通過“拖拉拽”的可視化分析工具以及自定義SQL,讓使用者們可以通過簡單的查詢、計算條件生成特定的數據結果,三是把數據平臺做成開放平臺,提供API給開發者。

“類似‘自助服務(self-service)’一樣,有一些開放平臺的概念,我們會給予不同團隊不同的權限來做應用。”

孫斌要求團隊中的產品經理和數據分析師必須懂業務,因為當內容團隊,如電影、藝術團隊有數據方面的訴求時,數據團隊如果只機械地聽取,很容易產出不符合內容團隊要求的結果。

“產品經理必須有數據分析的能力,接收任務的時候應該懂得如何用數據的方式去衡量、優化任務,如何建立一套數據指標描述業務的健康性,這是其應有的素質。”孫斌告訴我們,“所以,之前提到的‘自助’式的數據工具一定是在真正瞭解內容團隊需求的情況下而產出的。”

相反,數據方面的產品經理應該如何補充一些行業知識呢?“肯定要多看劇!”對於這個問題,孫斌先認真地幽默了一下。

那麼數據團隊如何配合不同團隊的需求擴展數據能力?孫斌給出了兩個有趣的例子。

1、配合內容團隊:智能選角系統

獨家|愛奇藝如何用大數據助力娛樂工業革命?

目前,影視圈內聚集了很多“北漂”的演員。由於行業現狀,選角導演在篩選演員的時候存在一個明顯的效率問題,而大數據和互聯網的一個很大的好處就是它們能打破一些時間和空間上的壁壘。通過一個可以體現演員演技的真實有用信息的標準化視頻簡歷庫,可以智能的通過劇本角色和藝人基本條件去篩選藝人,大大提高篩選效率,快速圈選目標藝人,輔助專業決策。

AI技術在智能選角系統中得到了廣泛應用,除了通過自然語言和語義理解對劇本和角色人物小傳的理解,通過角色人物小傳智能匹配藝人,還能溝通過視頻智能理解和剪輯技術,快速的找到藝人在站內站外的視頻片段,豐富藝人資料,更有效的提高選角工作效率。

AI可以保證這15秒的片段都包括特定的演員,但是這些片段是否具有代表性,是另一項監督學習的任務。對此,數據團隊會請選角導演來提供意見,對其中的一些片段進行標註。例如導演會要求一些正臉的片段,而AI篩選出來側臉的話,就需要算法上的調整。數據、算法的篩選,配合行業的眼光,就能達到一個很高的效率。

另外,據我們瞭解,愛奇藝的數據團隊也會參與到節目臺本和環節的設計。“雖然藝術創作是一個很感性的過程,但很多的節目環節還是有AI的手段去提效的。總之,數據分析的目的是服務好藝術創作。”孫斌解釋道。

“和大多數的產品經理相比,愛奇藝的數據產品經理在工作方法上沒有太大變化,依舊是做用戶研究、訪談,無非這些用戶從普通的大眾變成了導演、製片人、會員部門、版權部門等。這也是這一類產品經理門檻高的原因。第一步一定是瞭解用戶,比如搞清版權部門和宣發部門有什麼區別。需要一定的功底才能把這些用戶需求提煉出來。”

2、與運營團隊合作:付費會員流失預警

獨家|愛奇藝如何用大數據助力娛樂工業革命?

對於運營團隊來說,付費會員的粘性十分重要。對即將流失的會員進行預警,是數據團隊負責研究的項目。

會員流失預警是用戶行為分析的一個非常典型的例子。簡單講,流失的原因一定是用戶使用愛奇藝的服務後有了不符合預期感覺。而這一點一定會體現在用戶行為上,比如發佈的社區動態變少,觀看的視頻變少等。當預測某位用戶要流失了之後,運營團隊會提前收到預警,進行下一步的措施。

而從數據來看,這個項目的效果也超出預期。根據剛剛發佈的愛奇藝第二季度財報,本季度內,愛奇藝會員服務收入為人民幣25億元(約合3.74億美元),同比增長66%。訂閱會員規模達6710萬,其中付費會員為6620萬。

數據驅動業務的公司文化

在愛奇藝,數據驅動的文化從高層就受到了很高的重視。

“我在面試的時候就感受到CEO龔宇本人很重視數據,……不僅需要數據本身,還需要相關的分析及背後的邏輯,這就是愛奇藝的做事方式。”

這樣的文化很直觀的體現在人員佈局上:在愛奇藝,產品與技術的員工一定要保持在總員工的一半,一旦低於一半,其他部門就會停止招聘。今年上市之前,愛奇藝也修改了企業願景“做一家以科技創新為驅動的偉大娛樂公司”。

同時,高層的決策也有商業分析團隊和商業智能系統作為輔助。比如對於流量、收入分析,有從產品角度的分析,也有輔助運營策略的制定;同時也有對行業相關的分析和洞察:有些公司做長視頻,有些做短視頻,有些做直播,每家分別有什麼側重。

“Netflix做的那麼好,美國人那麼愛看體育,但Netflix就是不做新聞和體育,這裡面的邏輯是什麼?我們需要用數據的方式搞懂它。”與之相配合的是定期的經營分析會議。不僅是高管,一線負責人也要參與進來,從純數據的角度來俯視行業。

另一種非常規性的專題分析,是愛奇藝管理層特別關注的。管理層很希望有團隊可以挖掘出下一個類似《中國新說唱》的黑馬。對此,數據分析團隊會盡量根據互聯網上用戶行為的變化,去尋找、感受下一個可能的機會。

不言而喻,與業務和內容結合在一起的數據團隊才能真正為公司創造價值,而如何才能在一家娛樂公司做到這種結合?孫斌給出了他對數據科學家工作性質的理解。

數數據科學家的價值:理解場景,以數據發現、描述、解決問題

獨家|愛奇藝如何用大數據助力娛樂工業革命?

無論是綜藝還是影視,一定會去考慮投入產出比。例如對於具體在什麼期間安排什麼樣的影片,傳統方法多會依賴從業多年多專家根據敏銳感覺給出意見。數據科學雖然不能替代這些專家,但期待於從數據的角度挖掘出這背後的原因,豐富內容團隊的決策。

數據科學家需要具體瞭解場景,例如劇集是周播還是日播,具體的指標是觀看量還是觀看趨勢,這些微小的差別都會導致很大的不同。

訪談的最後,孫斌告訴了我們他對數據人才的期待:“首先要有解決新問題的能力。我們目前的技術團隊是一個有先進理念的團隊。從愛奇藝來講,我們很注重可持續發展,不希望只是做好一兩個項目,而不能幫助整個平臺的發展。其次要有一定的視野。我希望我們團隊裡的同學可以關注業界的新動向,能去接受新的技術。一定要有活躍力,創新力。”


分享到:


相關文章: