「深度」Netflix們的AI競技場

「深度」Netflix们的AI竞技场

利用AI提高營收是大公司都會考慮的問題,但短時間內AI技術的使用很難對內容有本質上的提升,但後者往往是用戶更關心的。

失去凱文·史派西的《紙牌屋》第六季於今年年末在慘淡中黯然收場,但相比於這部劇本身的質量高低,六年前當這部集合了大衛·芬奇、凱文·史派西和英國知名政治小說三大要素的政治驚悚劇橫空出世時,除了其大牌陣容與精良製作以及一次性放出全季的“壯舉”,更關鍵的是讓全球的觀眾認識到了劇集開頭的“NETFLIX”品牌。

也正是從那時起,這幾個字母背後所體現的技術與藝術的完美融合為全球觀眾及整個娛樂行業帶來了一場深刻變革。

「深度」Netflix们的AI竞技场

《紙牌屋》成為了Netflix改變一切的關鍵

與此同時在大洋彼岸,中國的流媒體行業競爭態勢之慘烈更甚於美國同行,位於第一梯隊的愛奇藝、優酷、騰訊視頻都依然常年保持著用高額虧損換用戶增長的狀態。

這或許是屬於流媒體最好的時代,但“燒錢”一刻也不能停。

由於採購現成版權內容的費用不斷上漲,以Netflix為首的流媒體平臺都開始將更多精力和資金轉向自制原創內容,去年Netflix宣佈將再投入80億美元打造原創內容。但根據日前《經濟學人》的報道,Netflix今年的實際在內容方面的投資將達120至130億美元,超越了同期任何一家電影公司、電視臺(不含體育頻道),訂閱用戶每年可收到82部電影,作為對比,今年華納兄弟推出了23部電影,迪士尼則為10部。

「深度」Netflix们的AI竞技场

如日劇增的版權成本是流媒體平臺的承重負擔

國內三大巨頭的虧損很大程度也是由於日益高漲的內容成本,以愛奇藝為代表,其2018年度前三季的財報顯示,今年一季度、二季度、三季度,愛奇藝內容成本分別為 39 億、47 億、60 億,同比增長了54%、47%、66%。在本季度,內容成本佔總成本的比例達到 78%,而內容成本最重要的兩部分——版權費和自制內容成本——仍然呈增長態勢。

同為美股上市公司的Netflix與愛奇藝都選擇發債來擴充“彈藥庫”,十月底,Netflix宣佈了今年再籌集20億美元新貸款的計劃。加上這20億後,Netflix的長期債務已經超過100億美元。11月30日,愛奇藝發佈公告,確定發行6.5億美元的可轉換優先債券,部分募集資金將用於支付有上限期權交易的成本 ,剩餘的資金將被用於繼續擴充和提升內容庫、加強技術研發以及用於公司日常運營。

除了不斷擴充內容庫與打造自有IP——這類早已被HBO和迪士尼等娛樂公司證明行之有效的手段之外,同時具有科技公司基因的Netflix和愛優騰,還將吸引用戶和提高營收的希望寄託在了新技術——人工智能(Artificial Intelligence,以下簡稱為AI)身上。

身在硅谷的內容公司Netflix,

利用AI更懂你

從2016年1月DeepMind首次披露AlphaGo可以戰勝人類棋手開始,到隨後AlphaGo與中國棋手的“世紀對弈”,AI這一偃旗息鼓甚至是被大眾忽視多年的領域突然又進入了所有人的視野,儘管科技行業一直在保持投入,但隨著公眾關注度的不斷提高,AI幾乎是以肉眼可見的速度成為了新的風口。

「深度」Netflix们的AI竞技场

媒體提及AI時的評價態度變化,2016年1月是個重要的時間節點

就如同兩三年前文娛行業隨處可見的“大數據”一樣,最近幾年AI再次成為了新的技術靠山,尤其是在國內的人口紅利日漸消失,同時內容與發行方面已經無法明顯做到差異化的流媒體行業,越來越多的公司將目光投向了AI技術,試圖依靠技術優化用戶體驗來提高用戶粘性並獲得營收增長。

而作為經典意義上的硅谷科技公司,Netflix不僅僅只是傳統的流媒體巨頭,其身上的硅谷基因也使得整個公司從來都會嘗試以各種新技術來驅動產品和服務。

早在Netflix的主業還是出租DVD的時代,他們便開發了一套名為“Cinematch”的智能推薦系統,它能夠根據用戶以前的評分數據預測到這位顧客可能喜歡什麼樣的主題和風格,等新電影發行後馬上為相應的用戶群體進行推薦。

不過基於當時的技術導致這套系統並不完善,2006年, Netflix對外宣佈,他們要設立一項大賽,公開徵集電影推薦系統的最佳電腦算法,第一個能把現有推薦系統的準確率提高10%的參賽者將獲得一百萬美元的獎金。三年後Netflix則真的憑藉一百萬美元獎金,獲得了一套準確率被提升了10%的算法。

2013年《紙牌屋》的推出則是一次Netflix精心營造的“技術營銷”,當時所謂的依靠“大數據”打造的美劇,事後被證明更多依靠的是Netflix不計成本的高投入,兩季總共一億美元的投入,於當時HBO一家獨大的美劇行業來說可謂是“天價”。

但與此同時,Netflix又熱衷於將AI技術應用到其產品當中,並且這一技術也確實幫助其獲得了營收的增長。

「深度」Netflix们的AI竞技场

每個行業因為人工智能的加入都會是贏家,但有些行業註定是大贏家

早前德勤發佈了一份面向全美企業的AI狀況報告也證明了這一點,報告中德勤特別提到了Netflix的案例:Netflix發現他們的用戶喜歡搜索電影,但如果搜索並找到一部電影的時間超過90秒,那麼用戶往往會放棄,而藉助AI技術優化站內搜索之後,不僅可以給用戶帶來用戶體驗的上升,還能讓用戶更快地付費。德勤的報告顯示,僅僅一年,得力於AI對搜索的改進,Netflix可以多賺10億美元。

為人所稱道的Netflix智能算法推薦,便是基於AI技術所打造。廣義的AI所包含的技術眾多,當下科技公司能夠將其轉化到實際應用場景中的無非是機器學習、深度學習、自然語言處理和計算機視覺四大類別,而從Netflix的技術博客可以看到,Netflix利用機器學習和深度學習所開發的算法正是其推薦系統異常“懂你”的關鍵。

「深度」Netflix们的AI竞技场

廣義的人工智能技術包含了當下最流行的機器學習和深度學習

在過去,Netflix通過收集每個用戶對於每部影片的評價(分數1-5),藉此推薦用戶可能有興趣的內容。不過隨著Netflix掌握更多用戶行為數據(包括用戶觀看的內容、使用設備、觀看時間、觀看頻率、觀看地點),同時藉助機器學習來建立推薦算法,以捕捉更多基於rule-based算法可能漏掉但對預測喜好相當有幫助的信息,例如:觀看影片的順序、不同因素之間的交互作用。

Personalized Video Ranker, PVR (某類型影片):推薦你喜歡的影片類型

Top-N Video Ranker (最佳推薦):推薦你喜歡的影片,和PVR 的差別在於這邊沒有類型的限制

Trending Now (現正熱播):依據當下熱門話題,如聖誕節慶,推薦你喜歡的影片類型

Continue Watching (請繼續觀賞):推薦你可能會想繼續觀看的影片

Video-Video Similarity (因為您觀賞過):推薦用戶可能會想看的類似影片

Page Generation:將上述演算法排序出最適合你的的個人化首頁

「深度」Netflix们的AI竞技场

Netflix基於算法所打造的屬於每個用戶的獨特首頁

上述是Netflix首頁的推薦條目,背後的算法大致可以歸結為兩類:基於內容過濾(Content-based filtering)與協同過濾(Collaborative filtering method)。內容過濾算法是根據影片本身特性找出類似影片並推薦給用戶,這也是現在多數視頻網站能做的將同類作品推薦給用戶,如果你看過迪士尼的《頭腦特工隊》那麼算法就會給你推薦《神偷奶爸》系列。

而後者則是先找出喜好類似的用戶,藉此判斷用戶A可能會喜歡用戶B看過的影片。具體到Netflix,基於該算法的內容推薦是由相似的瀏覽模式代表相似的用戶品味這一假設所提供的,“同品味用戶群”(Taste Communities)這一概念在這些推薦算法中起著重要作用,“同品味用戶群”即喜歡看相同內容的用戶群體,Netflix目前已識別出2000個這樣的用戶群。

這些同品味用戶群內的用戶可能會喜歡看似完全不同的內容,這時算法便會派上用場,Netflix負責原創內容的副總裁Cindy Holland曾提到:“Netflix的算法發現單口喜劇演員Dave Chappelle的粉絲群與霍金傳記電影《萬物理論》的粉絲群之間存在著令人意想不到的聯繫。”

「深度」Netflix们的AI竞技场

內容過濾(Content-based filtering)的簡單概念識別

根據《福布斯》的報道,Netflix表示通過算法增強了用戶粘性,每年可以節省超過10億美元的成本。同時Netflix也越來越多地使用算法所打造的公式來進行內容創作,其成功率高達80%,而傳統電視節目的成功率為30%-40%。

對於個性化推薦,Netflix最知名的論斷便是“有3300萬個不同版本的Netflix”,在2013年還只有3300萬訂閱用戶時,Netflix首席內容官泰德·薩蘭多斯就說過“沒有‘Netflix節目’這種東西,我們的品牌是個性化的。”

利用算法,Netflix可以根據每個用戶的需求調整整個用戶體驗,包括主頁、標題、每部電影的視覺效果等等,Netflix把這種個性化的過程定義為“消費者科學”(Consumer Science)。Netflix的高級數據科學家Mohammad Sabah在2014年曾表示,“75%的用戶根據公司的推薦選擇電影,Netflix希望這個數字能更高。”而根據2015年Netflix公開發表的一篇論文顯示,80%的用戶觀看時長都是依靠算法推薦而來。

「深度」Netflix们的AI竞技场

同一部劇集Netflix會打造多個海報封面推送給用戶

也因為Netflix完全依靠用戶訂閱作為主要營收來源,如Netflix產品副總裁Yellin所說,他們幾乎是跪在地上哀求用戶不要取消訂閱,想方設法吸引用戶留下是Netflix的唯一目標。因此在內容之外,包括預告片、標題、視覺呈現都是Netflix要專注為用戶所打造的。

去年IBM的研究人員研發出第一個“認知電影預告片”系統。其採用機器學習技術為電影《摩根》生成了一個恐怖電影風格的預告片,以吸引觀眾的眼球。Netflix也計劃將這項AI技術應用在自家作品的預告片中,包括電影和電視劇。其AI系統利用機器學習技術可以將一部更能吸引用戶興趣的電影或電視劇進行分析,將影片數據按類別歸類,比如場景、演員、背景樂類型、拍攝手法等等,然後根據每個用戶的偏好,製作成符合用戶口味的預告片。

「深度」Netflix们的AI竞技场

接近實時推薦系統

多數互聯網公司使用批次處理(batch processing)的方式實現個性化的目標(如個性化推薦),但這也是靜態的機器學習所能達到的極限狀態。包括Facebook和Netflix在內的巨頭都意識到這對於具備時效性的推薦內容來說依然不夠快,比如某一突發新聞或者實時上線的新劇在常規狀態下就得不到及時推薦。

Netflix隨後轉向了接近實時( Near Real-Time Recommendation)的推薦過程,以加速學習過程並推出測試結果。目前Facebook已經開發出了實時機器學習(Real-Time Machine Learning)算法Spiral,可以為網站上的數十億用戶提供實時推薦的服務。實時機器學習的優勢在於能夠在幾分鐘內預測並將新結果輸出給用戶,而不是依靠好幾周的數據來優化和更新服務。目前Netflix等專注算法推薦的媒體公司也都在跟進這項技術。

正如凱文·凱利在《必然》一書中寫道:“Netflix的推薦系統有一個300人的團隊,擁有1億美元的預算,但他們解決的是一個價值10億美元的問題 。”

國內的巨頭們,都說要讓AI幫忙做爆款

在年末第六屆中國網絡視聽大會期間發佈的《2018中國網絡視聽發展研究報告》中,有一章提到了新興技術在國內網絡視頻行業的應用,其中提到AI和大數據可能會最先應用到內容生產、廣告分發、IP預測等各個層面。

在接受界面娛樂專訪時,金山雲高級副總裁、合夥人梁守星表示,AI作為一種技術能力,正在成為視頻行業發展的新引擎。他也提到現在金山雲在將AI應用到視頻行業,主要針對於技術與內容兩個層面,技術層面主要是解決視頻公司的傳輸和帶寬問題,而在內容層面現在AI技術能夠解決的則是內容審核和標註,前者是由於當前國內的審查環境使得大公司需要投入更多人力去對UCG內容進行審查,後者將標註自動化之後則會有利於視頻平臺更好的售賣廣告。

「深度」Netflix们的AI竞技场

金山雲的AI技術能為視頻行業解決人力審核壓力過大的問題

受困於激烈競爭和盈利壓力的國內巨頭們,也紛紛將目光投向了AI技術。

2017年6月,愛奇藝創始人、CEO龔宇在愛奇藝世界大會上發佈了“做一家以科技創新為驅動的偉大娛樂公司”的企業願景,之後愛奇藝宣佈將會全面AI化。背靠已經“ALL IN AI”的科技公司百度成長起來的愛奇藝,也是國內最早提出要將AI應用到視頻場景的流媒體公司。

「深度」Netflix们的AI竞技场

愛奇藝創始人、CEO龔宇多次提到AI對於流媒體平臺的重要性

想依靠技術來驅動公司發展和產業升級,幾乎已經成了國內視頻巨頭的共識。來到今年的優酷秋集,優酷宣佈APP端正式改版,從原先的固定頻道推薦轉變成為了複合信息流推薦。阿里巴巴文化娛樂集團大優酷COO兼CTO南天提到“新時代的AI技術不神秘,不冰冷,也不會背離用戶與從業者心智,它會是一套切實可依的方法論,在每一個內容生產前後的細節中,體現出效率的力量。”

目前基於AI技術和算法,優酷推出了魚腦和YOUKU ORIGINAL兩款內容製作產品。其中,魚腦平臺依託於阿里大數據能力,建立了內容從投資、製作、智能化運營、需求挖掘等輔助決策的工業化標準體系。它可以完成AI選角、AI劇本、推動內容IP流量放大及聯動等功能。

至於在2018年被人稱為“沒有夢想”和身處溫室的騰訊,也在調整內部架構之後宣佈喊出了“AI in ALL”的口號,相對其他兩家,騰訊視頻則更多倚賴於騰訊整體的AI戰略,上半年騰訊雲推出的騰訊音視頻AI產品解決方案——騰訊明眸,可以實時的對視頻流進行識別,並進行AI化處理。在2019年V視界大會上,關於騰訊視頻對於技術的投入和使用,騰訊視頻總編輯王娟也只是表示“讓技術和數據產品更加前置,指導內容生產的過程,從而達到內容的品質更可控。”

雖然國內的流媒體巨頭們都在爭先恐後的強調自己的付費會員數量,但國內視頻網站付費用戶留存率一直是一個大問題,對於內容所帶來的黏性較低問題,前愛奇藝CTO湯興曾表示:“影視圈的問題是沒有黏度,熱播期一過去用戶通常不會再回來。”對國內巨頭們來說,吸引用戶付費是一回事,如何留住用戶讓其持續付費又是另一回事。

沒有持續產出好內容始終是橫亙在國內視頻平臺面前的最大障礙,龔宇早前也認識到了這一問題:“需要用源源不斷的內容養成用戶的內容慣性,並考慮長期用戶體驗及特權。”但認識到問題不等於解決了問題,當下大公司們能給出的解決方案則都不約而同的指向了AI。

「深度」Netflix们的AI竞技场

愛奇藝AI的應用場景

在今年多個場合都著力強調AI重要性的愛奇藝在這方面無疑走得最遠,今年以來,愛奇藝連續發佈了通過AI深度神經網絡算法增強的HCDN技術、AI ABS自適應碼流、ZoomAI視頻增強技術、綠鏡以及只看TA 3.0和蒙版彈幕等功能,以此來提升視頻用戶的體驗。

對於用戶而言關注內容往往更甚於使用體驗本身,在利用AI提升用戶體驗的同時,愛奇藝基於AI技術所打造的“IP價值評估系統”和“流量預測”則是完全針對於內容生產本身。

對於底層技術的使用,愛奇藝商業大數據的負責人孫斌表示;“上述應用場景都使用了主流且比較成熟的AI技術,如自然語言處理(NLP),語義理解,深度學習技術等技術,獨特的地方在於與愛奇藝業務場景的結合,我們在業界最早開始大規模嘗試並且應用於實際業務的。”

「深度」Netflix们的AI竞技场

愛奇藝的AI智能匹配技術為《中國新說唱》選擇了鄧紫棋作為導師

“IP價值評估系統”顯然是想讓AI技術真正介入到內容的生產與創作環節,利用AI和大數據分析全面提升劇本創作質量、評估可拍攝性以及商業價值,而這一系統與優酷致力打造的魚腦思路不盡相同。

“IP價值評估其實是基於一個IP生命週期中各個階段的相關信息綜合進行分析的。”孫斌也進一步解釋了在實際應用中這一系統如何發揮作用,“比如相似IP在歷史上的受歡迎程度,話題輿論熱度,IP涉及的關鍵信息對應事件在歷史上的反應等等信息都會作為模型的輸入,再根據業務目的動態調整權重進行評估。”

同時他也表示基於大數據和AI的評估永遠無法確保一個內容一定成功,但是基於海量數據和深度學習的模型,可以最大程度充分分析歷史和預測未來,從而為決策提供高置信度的數據支持,說唱音樂之所以能成功出圈,很大程度得以於基於愛奇藝海量站內數據和站外數據,配合最領先的深度學習算法,及時和準確反應出了愛奇藝站內以及站外的觀眾興趣和輿論動向,所以的這些都離不開兩個關鍵因素,“大數據”和“大算法”,這兩者愛奇藝恰恰都有。

算法至上的Netflix低頭了,AI創作還只是夢想

由於科幻小說、電影和劇集的影響,公眾會對AI產生過多不切實際的幻想,甚至連伊隆·馬斯克這樣的科技大佬不時也會發表所謂的“AI威脅論”,但事實上目前的AI技術發展遠沒有進入能令產業結構發生翻天覆地變化的程度,正如科技博客作者趙賽坡所說在沒有具體的應用場景之下,甚至並不存在一個真正意義上的“人工智能行業”。

2016年的倫敦科幻電影節上,一個名叫Benjamin的人工智能寫出了一段科幻短片,在一位電影人和AI研究者的共同參與下,Benjamin經過訓練最終完成一段劇本創作,但它甚至還無法完成為人物起名字這件事,因為虛擬角色的名字往往具有不可預測性。今年六月,Benjamin捲土重來,它採用神經網絡和換臉技術通過整合大量電影素材和演員語音,生成新的場景和對話完成了一部名為《Zone Out》的6分鐘電影短片,但由於這次完全沒有真人演員參與演出,單靠用換臉技術將演員的臉放置在已經存在的角色上使得最終成片顯得相當怪異。

「深度」Netflix们的AI竞技场

《Zone Out》主要通過換臉技術來實現角色表演

事實上AI或者數據能為內容創作帶來的幫助並不多,作為專業的技術人士,梁守星認為依靠AI來進行內容創作並不成熟,“文藝創作類的內容理論上來說是感性的東西,用機器學習來判斷我覺得並不成立。一部電影或者是一部劇集的創作不是內容的問題,而是過程當中導演感覺的問題,演員表現力的問題,包括每個時代不同觀眾接受度的問題,有很多綜合的因素,人的情感在裡邊。目前這個AI時代是很難預測。”

而同樣是依託大數據和AI技術為影視行業服務的小土科技,旗下產品也是試圖利用技術去為影視劇本做評估和判斷,小土科技創始人祝金甫表示作品能不能成為爆款,思想性和藝術性一定是有30%的佔比在,AI短期代替人的藝術創造很難,只能基本判斷這是不是一個合格的產品,但是藝術性判斷不出來。

「深度」Netflix们的AI竞技场

Netflix CEO裡德·哈斯廷斯從不諱言數據對他們的重要性

需要依靠人來做最終決策,這依然影視行業充滿不確定性的關鍵,Netflix雖然長算法推薦,但對於其並非像外界所誤解的那般愛好用算法去執導內容創作,Netflix首席內容官泰德·薩蘭多斯也不止一次說過:“千萬不要沉溺於算法,過去的信息很有可能限制對於未來的想像力。”

“數據是用來支撐決策的,算法越準,數據量越大,數據結果的置信度越高,可是這個決定永遠都是人做的,所有的這些數據評估體系的結果都是為相關的專業人士負責的,我們從來沒有讓一個算法的結果來替我們做決定。”孫斌在採訪中也一再強調“人”的重要性。

當然身在硅谷卻越來越向好萊塢靠攏的Netflix,其實已經在面臨在算法涉嫌“種族歧視”,以及在算法與人情之間抉擇的問題。前述已經提到過Netflix善於利用算法為不同用戶提供各種風格的海報,今年十月一些黑人訂閱者發現《虎父無犬女》這部電影的縮略圖,其中突出了非洲裔美國演員倫納德·歐茲和布萊爾·布魯克斯,但這兩位黑人演員其實只是小配角,正片裡他們發現這其實是一部白人演員主演的作品。儘管Netflix後來否認根據用戶種族推薦作品,但過於“智能”算法所引發的社會工程學問題已經產生了不小風波。

「深度」Netflix们的AI竞技场

最終出現的《同妻俱樂部》第二季海報

而上個月WSJ一篇長篇報道則直接指出,Netflix內部其實已經分化出兩派,“技術團隊更偏向於‘數據驅動和分析’,而好萊塢方面更偏向於‘以關係為導向’。”

文中提到的例子依舊是關於推薦海報,Netflix熱門劇集《同妻俱樂部》第二季的播出宣傳時,Netflix的根據數據發現當宣傳海報中沒有簡·方達時,用戶會更加願意點進去觀看,儘管簡·方達是該劇的兩大女主角之一。顯然根據Netflix的數據發現,年輕觀眾已經對於這位好萊塢老江湖不感興趣,但發佈一張沒有主演的劇集海報毫無疑問會讓Netflix與好萊塢之間產生嫌隙,更別說這一做法甚至有可能違背了雙方簽訂的合同。

對於海報中明星站位的不同所引發的紛爭,即便是在國內影視圈也屢見不鮮,而Netflix直接製作了一張沒有主角的海報無疑也觸怒了好萊塢,最終想要成為好萊塢一份子的Netflix做出妥協,重新發布了包含簡·方達的海報,儘管公司部分堅信“數據”的工程師至始至終都無法理解為什麼要做出這種決定。同時Netflix對於好萊塢人才的吸納也在不斷增加,去年長期在任的Netflix首席產品官Neil Hunt下臺,代替他的是在產品內容運營方面更有經驗的高管Greg Peters。

當新勢力嘗試進入並改變傳統行業時,勢必都將會面臨新舊對立的問題,尤其是面對影視這一長期倚賴人類智能與人際關係所建立起來的龐大產業。正如梁守星所說現在階段的AI可以解決一部分能力釋放的問題,包括內容監管和標註的問題,當人力密集和模式化的時候,它是可以解決這個問題。“但是要超越這個,加入感情和趨勢的東西,那是不可能的。很難說短時間內AI可以達到新的高度並解決一些趨勢判斷的問題。”

不過Netflix的中國學徒們還尚未走出需要依靠廣告甚至遊戲收入的商業模式,距離真正用AI為用戶和內容服務其實還有很長的路要走。

「深度」Netflix们的AI竞技场
「深度」Netflix们的AI竞技场


分享到:


相關文章: