喻國明:從"今日頭條"的四次升級,看算法分發的價值迭代|德外薦讀

算法型信息分發給傳播領域帶來權力結構的改變,同時也使算法面臨人與機器爭奪社會權力的質疑。傳統媒體掌握社會信息結構控制權的時代已經過去,以算法為代表的大數據技術形塑著信息的社會傳播效果。但這並不意味著技術控制了社會的信息傳播結構,"算法推薦導致視野變窄"這樣簡單因果關係從未被實證研究的結果證明過。算法是人寫的,有著多種類型與價值取向。技術、人和社會信息結構展現出了更加複雜的圖景。今日頭條的信息推薦算法,被認為是國內、乃至全球最具代表性的信息推薦算法,從2012年9月第一版開發運行至今,已經經過四次大的調整和修改。研究表明,算法推薦不是一成不變的,算法型信息分發在不斷迭代中提升著"有邊界的調適",並增強了其社會的適應度與合法性。

喻国明:从

算法型分發:

關於"信息繭房"的學術爭論

人工智能時代,算法分發已然是信息平臺、搜索引擎、瀏覽器、社交軟件等幾乎所有軟件的標配,但與此同時,算法強大的功能和權力內涵,尤其是算法在新聞傳播領域的應用,開始面臨嚴重的質疑與挑戰。為解決大數據信息超載問題應運而生的、帶有算法推薦功能的資訊類APP("今日頭條"、"一點資訊"等),從面世的第一天就備受質疑:使用這類APP是否會導致我們只看得到自己感興趣的、認同的內容,進而所有人都活在自己的小世界裡,形成"信息繭房"效應?有人甚至把它提升到"會導致一個民族的智能水平下降的危險"的高度。因此,釐清算法的技術邏輯以及對社會信息傳播產生的影響,在傳播學、計算機科學等相關領域具有重要意義。

有學者指出,在大數據時代,龐大的數據賦予算法巨大的傳播導流能力。英國文化研究專家斯科特•拉什(Scott Lash)總結認為,在現代社會媒體和代碼無處不在,其對於傳播的影響力越來越存在於算法之中。

大衛•比爾(David Beer)指出,這種影響力包含兩層含義:第一,體現了算法發揮的功能,包括分類、過濾、搜索、優先、推薦、判定;第二,由於基於算法的決策常常被認為是理性、中立、高效、值得信賴的,算法這一概念本身就具有影響力的內涵。大量以此假設出發的研究表達了對算法推薦型信息分發導致"信息繭房"的擔憂,即認為使用算法推薦技術的資訊類APP的人會出現視野變窄,進而導致"群體極化"。

喻国明:从

也有學者對此提出不同看法,認為算法本身並不具有社會權力,而是算法聯合即算法與人的結合(algorithmic associations)在發揮作用。算法運作過程中會和"規則、人、過程、關係"等相互作用,因此要特別考慮算法的情境性(situatedness)。姜紅和魯曼關注了這種人與非人因素的交織、相互作用,運用"行動者網絡理論"(actor-network theory)指出算法、專業新聞機構和用戶這些行動者共同編織著一張傳播之網。無論是算法自身,還是算法聯合,都深刻影響著新聞業。

Michael DeVito考察了Facebook的算法運作機制,通過對其公開發布的專利、新聞稿、博客等進行內容分析,概括出九大算法價值要素:朋友關係、用戶公開表達的興趣、用戶先前的參與、用戶含蓄表達的偏好、發佈時間、平臺優先級、頁面關係、用戶的負面表達、內容本身的質量。Dubois, E., & Blank, G.最新的研究成果發現,總體而言,人們對於信息迴音室效應的擔心是被誇大了的。尤其是那些對政治感興趣的讀者,實際上會受到好奇心的驅使,去消費更多樣的內容,視野並不會受限。基於這樣的理論爭論和前人研究,算法型信息分發發展到今天,尤其是在科技和經濟社會飛速發展的中國,算法型信息分發發生了哪些變化?其與人工分發彼此交疊的部分有哪些?各自適宜的區位是哪些呢?算法型信息分發的變化及迭代邏輯正是本文研究的重點。

喻国明:从

智能算法技術的崛起:

傳播領域"常規"的變局與解構

算法型信息分發最為普及的定義是Resnick和Varian在1997年提出的,指推薦系統向客戶提供商品信息和幫助用戶決定應該購買什麼商品,模擬銷售人員幫助客戶完成購買的過程(Resnick P , Varian H R., 1997)。早期的算法型信息分發被應用於電子商務領域,目前已在各個領域被廣泛應用,信息領域亦然。從廣義上講,算法是一種編碼程序,被定義為"為了解決問題而輸入機器的一系列指令"。

從信息生產的角度看,算法型信息分發重塑了新聞生產機制。算法型信息分發帶來的新聞生產方式是"新聞內容+數據化精確制導"。精確指向特定用戶的數據引擎已經成為新聞生產的標配,新聞生產的精英主義正在被用戶思維和互聯網思維所代替。這意味著在算法登堂入室的時代,傳播新聞時所倚重的邏輯是"用戶本位"的,傳統意義上新聞傳播中"傳播者本位"的精英主義邏輯正在消解,算法型信息分發模式從一開始就是沿著用戶的需求的邏輯不斷提升和迭代的。

算法型信息分發在一定程度上決定著信息流向、信息重要程度,以及用戶對信息的關注度。在傳統新聞生產中,傳送新聞文本環節就是將製作好的新聞文本,通過報刊的出版發行、廣播電視節目的播出等傳送給受眾的過程。傳統新聞生產對新聞文本傳送是大眾化、標準化基礎上的規模化的,在內容呈現上是千人一面的。傳統媒體掌握內容入口和分發渠道的控制權,信息以單向、單一的方式在相對封閉的渠道流動,形成塔奇曼所謂的"新聞常規"。就傳播領域而言,新聞產業在內容採集、分發和盈利模式上已經形成一整套相對穩定的規則和傳統。於政治學而言,規則和傳統以及路徑依賴,為形成相對穩定的制度創造了條件。

但隨著互聯網技術的普及和進步,數字內容分發渠道全面佔有與分割傳統的社會信息供給結構。

喻国明:从

不同於傳統媒體時代內容生產和渠道發行是兩個完全分開的環節,互聯網時代的內容生產、內容入口和內容分發乃至信息反饋都是在技術支持和數據作用之下融為一體的,換言之,它們的邊界是模糊的,彼此之間形成了相互融通難以分割的一個整體。用戶所能見到的內容已經成為數據化生產和加工以及數據導流、精準分發以及場景化商業變現的工具和手段。因此,在內容生產過程中的平臺型媒介機構,就越發重視數據和智能化的算法對內容採製、內容分發、場景到達、用戶接受等全環節的重要影響。

在討論"算法導致信息迴音室"的時候,人們往往將"算法"視作一種單一的、同質性的存在,似乎算法只有一種推送邏輯。實際上,早在2014年,明尼蘇達大學計算機系Nguyen, T. T.等學者使用電影評分和推薦網站MovieLens的數據就發現,不同的算法推薦方式會導致不同的"過濾氣泡"效應。不同於基於內容的推薦算法,MovieLens所使用的算法是"基於物品的協同過濾算法"(item-item collaborative filtering)——"依據了和你相似的其他人喜歡什麼",這有助於向用戶推薦自己本不會接觸到的更多樣內容。

大部分實證研究結果都沒有支持"算法推薦導致視野變窄"這樣一種簡單的結論,而是展現出了更加複雜的圖景。"迴音室"、"過濾氣泡"是技術、人性、社會結構共同作用的結果。它的消除既需要技術優化,也需要媒體的平衡報道、社會信息結構的多元化構造,還需要社會評議機制的完善以及市場創新的競爭節律、人們制度化參與渠道的拓展等等。算法有著多種類型,並且在不斷地調整、變化。人們在算法推薦平臺上看到的內容,從來就不是單純被機器所決定的。

概言之,在技術層面,算法推薦有著不同的類型、不同的原理。被廣泛使用的協同過濾算法,實際上並不會縮減人們的視野,甚至有時能打開更大的世界。"

迴音室"、"過濾氣泡"是技術、人性、社會結構共同作用的結果,不能歸結為技術本身。

喻国明:从

人機互動下算法邏輯的價值迭代:

從"算法沒有立場和價值觀"到

"技術必須充滿責任感和充滿善意"的升級

那麼,當前算法型信息分發與人工分發彼此交疊的部分有哪些?發生了哪些變化?本文以"今日頭條"為案例,蒐集分析了"今日頭條"相關資料、市場數據,以及"今日頭條"官方公佈算法原理等材料,對算法型信息分發的變化進行討論。

新聞價值觀念是指新聞主體用來選擇和衡量新聞價值客體的標準。在"編輯分發"模式中,新聞價值觀念主要體現在新聞從業人員的實踐(如新聞篩選、排序、版面設計)或新聞機構的內部規範之中,而對於算法型信息分發模式來說,新聞價值觀念則內嵌於代碼的設計和編寫之中。傳統大眾媒體時代,把關人的研究主要集中在傳播者身上,主要研究把關人(個人或組織)特徵對把關活動的影響;到了網絡傳播時代,受眾在傳播的價值實現過程中主導性地位日益顯著,"傳-受"身份重合,把關人研究的重心轉移到受眾身上,由此便存在將傳統把關人(即內容生產與傳播一方)研究弱化的問題。

隨著大數據技術運用到新聞傳播領域,技術型互聯網平臺公司日益佔領了傳播渠道,機器算法在新聞分發中佔據主導地位,此時,把關人理論面臨著全新現實改變。記者、編輯等傳統把關人在進行信息篩選時所遵守的職業規範和新聞倫理並不約束算法工程師或程序員。信息把關,從某種程度上演變成一種傳播權力的無形轉換——從人工編輯向智能算法讓渡。傳統的新聞價值觀念已然不能精準地解釋當前業界的新動態和新趨勢。這是否意味著算法本身沒有自己的價值觀念可言呢?

喻国明:从

算法型信息分發最初實踐展現出明顯的"用戶本位":"你是誰"、"你怎樣"決定了"推薦給你什麼內容"。它強調"用戶是信息的主人",基於算法技術,根據網絡用戶特徵建構用戶畫像,即通過收集用戶的社會屬性、瀏覽習慣、閱讀行為甚至性格星座等信息,抽象出用戶閱讀需求的共同特徵並梳理用戶的需求比重模型,為每個用戶貼上"信息標籤",據此搜索並推薦與用戶閱讀需求最契合的內容。推薦算法讓人們從海量信息中解脫了出來,減少了在紛繁複雜的信息中去挑選、去尋找的不安全感和焦慮感。2012年成立的"今日頭條"就是基於此行為和理念的第一家將算法推薦引入其中的新聞移動客戶端,並以此獲得了迅猛的發展,2014年就宣佈每日活躍用戶數量超過千萬。當時,"今日頭條"對外宣傳的口徑是公司產品"沒有采編人員,不生產內容,沒有立場和價值觀,運轉核心是一套由代碼搭建而成的算法"。

2015年1月,"今日頭條"創始人張一鳴在極客公園創新大會上發表主旨演講,指出"今日頭條"主要使用有關用戶的以下數據來進行信息推薦:動作特徵(包括點擊、停留、滑動、評論、分享)、環境特徵(包括GPS定位、是在Wifi環境還是3G環境、是否為節假日等)和社交特徵(例如微博的關注關係、歷史上發的微博)。在《機器替代編輯?》一文中,張一鳴介紹了"今日頭條"的推薦機制:"當用戶綁定微博登錄後的5秒鐘之內,系統會為用戶建立起一個DNA興趣圖譜。這個圖譜類似於一個數學模型,主要根據用戶SNS賬號上的標籤、關注人群、好友、評論/轉發、收藏等數據,以及用戶的手機、位置、使用時間等數據提取而來。"這標誌著"今日頭條"已經坦言算法分發在"今日頭條"的存在及其依據,新聞編輯把關權被算法所替代。

在之後很長一段時間內,一直引發爭議的是,算法推薦原理始終處於未公開狀態。問題的關鍵在於,算法分發是否把所有決策都交給了機器?用戶的個人信息和數據成為輸入信號,源源不斷地被收集、儲存、分析,這一決策過程實質上是在"黑箱"中進行的。社會呼籲算法公開透明化,打開算法"黑箱"。2018年1月11日,"今日頭條"首次系統公開了其算法分發的技術原理:內容上主要考慮提取不同內容類型的特徵做好推薦,用戶特徵包括各種興趣標籤、職業、年齡、性別等,環境特徵基於用戶在不同場景中信息偏好不同。結合這三個維度,模型會給出一個預估,即推測推薦內容在某場景下對某用戶是否合適。

這三個變量都基於對用戶信息的反饋,算法的內在邏輯迎合著用戶需求。此外,有四個典型的特徵會對推薦起到重要的作用:相關性特徵、環境特徵、熱度特徵、協同特徵。其中協同特徵通過用戶行為分析不同用戶間相似性,如點擊相似、興趣分類相似、主題相似、興趣詞相似等,依靠"興趣探索"和"泛化"來實現價值的多樣性。

此次公開的推薦系統原理包括今日頭條算法模型設計維度與策略,以及頭條的內容安全機制及相關舉措。如何在線訓練大規模推薦模型、典型召回策略的設計方法、多目標如何融合等業界關心的核心問題都在此次算法公開中得到解答。算法原則歷來屬於公司行業機密,這一次今日頭條將算法原理公開,並接受建言,實屬行業首例。很多人對算法的理解仍然停留在"算數"或者"魔法"。對算法而言,信任取決於透明度,如果你知道它的原理,明白它在做什麼,並能對它可能出現的問題提出建議,看到它在不斷提升,就有可能接納並信任算法。

如果用形式化的方式描述,算法型信息分發實際上是去擬合函數。設計、監督並管理算法模型的依然是人,這意味著算法型信息分發並非把所有決策都交給機器。在追逐算法這一"熱"趨勢的同時,算法型信息分發的透明性提高,算法價值觀念發生了根本的變化。張一鳴曾經表示,"技術必須充滿責任感,充滿善意",他將企業責任細化為三個方面,即平臺治理、科技創新,以及內容建設和信息服務。抖音總裁張楠在回應新京報記者提問時也表示,不認同"算法沒有價值觀"的觀點。"算法也是人寫的","在抖音的頂層設計中,主流價值觀和用戶體驗排在優先級最前列,商業變現是最次要的"。這一系列行為體現了一家平臺對技術發展的責任感,不僅對算法應用起到積極推動作用,還回應了社會各界對算法型信息分發的質疑和誤讀。

喻国明:从

算法型信息分發的控制變量升級:

以"有邊界的調適"到社會適應度與合法性的獲得

算法推薦是內容智能分發平臺的"靈魂","今日頭條"的推薦算法,從2012年9月第一版開發運行至今,已經經過四次大的調整、修改和升級。顯然,推薦算法並不是一成不變的,算法型信息分發在不斷提升"有邊界的調適"。

首先,從分發的文章數量和質量上看,通過算法加人工的半自動形式進行文章內容的質量辨別:從算法上自動標識質量分值、自動提取文章標籤、自動識別錯別字等方式進行文章質量判斷;人工方面則需對有異議的文章進行二次審核。只有通過算法和人工雙重考核的文章才能夠進入個性化推薦的"分發池",以此保證算法所推薦的文章符合起碼的質量標準,同時也限定了進入分發池文章的數量。有限的、高質量的文章保證了用戶所接收到的個性化分發文章是可信賴的、真實的和比較理性的。

第二,從用戶的精準畫像和用戶分群的角度看,通過數據融合、行為分析和算法優化,自動對用戶進行精細畫像的描繪和精準分群,使得機器能夠自動辨別出哪些用戶喜歡非個性化的內容、哪些用戶喜歡個性化的內容。當機器辨別出該用戶喜好非個性化內容時,客戶端將自動呈現編輯人工推薦的內容。即使是對於喜歡個性化內容的用戶,也不是一味地推薦用戶喜歡的內容,而是按不同權重分發不同的內容。比如直接過濾掉停留時間短的點擊,打擊標題黨;隨用戶動作增加,老的特徵權重會隨時間衰減,新動作貢獻的特徵權重會更大。

第三,從個性化推薦能力提升的角度看,不斷優化推薦算法的興趣探索能力,動態調整不同類別新聞分發的權重,提高了個性化分發的能力,實現硬資訊與軟資訊、興趣與理性之間的平衡,保證喜好個性化分發的用戶在能夠得到自身所想看的東西之外,亦能獲取其他方面的信息,即獲取興趣之外的興趣點。

喻国明:从

2018年1月3日,今日頭條宣佈招聘2000名內容審核編輯,由算法為王向人機結合轉變。5月7日,今日頭條再次採取措施整頓平臺內容,邀請學者、媒體人、公職人員成立專家團隊,參與平臺內容與服務的監督,並在技術上推出國內首款人工智能反低俗

小程序"靈犬",為用戶提供更優質的信息。

智能時代算法的重要性日益彰顯,"今日頭條"公佈的一系列算法的升級與調適體現了技術、人性、社會政治共同作用於我們能夠看到的信息。"今日頭條"在算法迭代中控制變量升級,正是以"有邊界的調適"贏得更好社會適應度與存在的合法性,它是中國互聯網飛速發展的一個典型樣本。毫無疑義,雖然傳統媒體掌握社會信息結構控制權的時代已經過去,以算法為代表的大數據技術形塑著信息生產與傳播的社會形態與傳播效果,但這並不意味著技術控制了社會信息結構,歸根結底,算法是人寫的,可以也應該有著多種類型,並且是在不斷地調整、迭代和變化中的。就社會的整體傳播效應而言,與其要求一家算法型分發平臺"全面",不如在信息供給結構上鼓勵多元化的算法平臺的競爭與協同,這樣所構造起來的社會內容的"供給側"將會更為完善——選擇性更多、個性化更強、內容維度更為完整。

總之,算法技術實際上並不會縮減人們的視野,恰恰相反,它總能為我們打開更大的世界。技術會帶來更好的社會信息結構還是更壞的社會信息結構,決定者其實依然是人和無形的社會軟制度。

喻國明:教育部"長江學者"特聘教授,北京師範大學新聞傳播學院執行院長、教授、博士生導師,CTR媒體融合研究院專家。

杜楠楠:中山大學博士研究生。

《智能型算法分發的價值迭代:"邊界調適"與合法性的提升——以"今日頭條"的四次升級迭代為例》,《新聞記者》2019年第11期。


分享到:


相關文章: