情感計算:讓機器擁有「讀心術」

在近日中國科協發佈的12個領域60個重大問題中,人機情感交互位列其中。“無情感不智能”已經成為眾多研究者的共識。

日前,在杭州舉行的第七屆UCAN用戶體驗設計論壇上,阿里巴巴人機自然交互實驗室聯合達摩院機器智能技術實驗室和浙江大學推出了一款可以基於圖文內容自動生成短視頻的人工智能Aliwood。值得一提的是,該團隊在研發過程中引入了“情感計算”能力,給視頻所配的音樂建立起了情感模型,以便更好地抓住觀眾的情緒。

“情感計算”讓機器也可以察言觀色,它是怎麼做到的?

從感知信號中提取情感特徵

“視頻中的每一個單元都會多多少少左右我們的情緒。”阿里巴巴人機自然交互實驗室負責人楊昌源在接受科技日報記者採訪時介紹,音樂情感是視頻情感的一部分,通過AI的方式給音樂建立一套情感模型,基於目前應用最廣二維情感分類法模型,將備選音樂從“arousal”和“valence”兩個維度劃分,優先選擇更為契合購物(電商)環境的偏雙高模型音樂作為視頻的音頻配樂,為電商產品視頻渲染出正向購物氣氛。

如何理解情感計算,要從“情感”這個源頭說起。國際關係學院信息科技系副教授李斌陽介紹,情感相對來說是一個比較籠統的概念,包括了情緒、感情、心情等多個方面。而狹義的情感計算要分析的就是人對於一個事或物所持有的觀點,如褒義、貶義、正面、負面等。也可以是分析人在當時環境中的喜、怒、哀、樂等感情或情緒。

當你說“錢包丟了”的時候,具有情感計算能力的機器人會是什麼反應?它不僅會接受到了錢包丟失的既定事實,還能“讀”出你的悲傷,拍拍你的肩膀說,“沒關係的,總有運氣不好的時候。”

1985年,圖靈獎獲得者馬文·明斯基提出應該讓計算機具有情感能力,他說問題不在於智能機器能否有任何情感,而在於機器實現智能時怎麼能夠沒有情感。從此,賦予計算機情感能力並讓計算機能夠理解和表達情感的研究、探討引起了計算機界許多人士的興趣。

情感計算(Affective Computing)一詞,是美國MIT媒體實驗室皮卡德教授提出的。她給出了定義,即情感計算是關於情感、情感產生以及影響情感方面的計算。讓機器也具備“感情”,從感知信號中提取情感特徵,分析人的情感與各種感知信號的關聯,成為國際上近幾年興起的研究方向。

基於多模態融合讀懂情感

情感計算是如何做到的?以文本分析為例,李斌陽介紹,最初的文本分析主要是基於詞典中的詞語色彩,即褒貶進行分析,並在此基礎上加入一些規則提高效果。在此之後,基於傳統機器學習的方法興起,其主要圍繞模型和特徵兩個方面。從2013年至今,深度學習方法作為一個主流分析方法被廣泛應用。

“深度學習的方法提供了一種對於文本表示的建模方法。”李斌陽說,它最主要的特點是基於上下文語境,找到隱含的情感表述。舉個例子,如“今天我去商場,我買了一件衣服,很好看,只花了300元”。傳統的機器學習方法可能只把注意力放到“很好看”這個詞,而深度學習方法則可能注意到“只花了300元”這句話,雖然沒有明顯的表達情感詞彙,但我們可以從中體會到“只花300元”,表達說話人認為衣服是比較便宜的觀點,基於深度學習的情感計算可以分析出說話人不僅認為衣服好看,還很便宜,這是和傳統機器學習最大的不同。

“目前,有很多情感分析基於多模態融合的方法。”李斌陽說,以前我們探討的情感分析多指文本中的情感分析,現在的情感分析是多維度的,如文字+圖片+表情+顏文字的綜合分析,文本+語音+圖像的綜合,即多模態情感分析,是目前來說比較前沿的情感分析研究方向。

楊昌源也認為現在多模態情感分析是發展的主流方向。他介紹,每個模塊所傳達的人類情感的信息量大小和維度不同。在人機交互中,不同的維度還存在缺失和不完善的問題。因此,人機交互中情感分析應儘可能從多個維度入手,將單一不完善的情感通道補上,最後通過多結果擬合來判斷情感傾向。除了上面提到的文字、圖像模態等,目前對於腦電波、皮電信號、心率等情感信息通道的研究也是新興研究方向。

新零售、自動駕駛應用效果初現

發展近20年,目前情感計算已經應用在生活中的多個場景。如我們最傳統的商品評價分析、民意調查,以及應用程序中的推薦功能。楊昌源介紹,在未來情感計算用於流媒體用戶的情感分析或是一個發展方向。如在一段長視頻中,用戶對於某類物品的喜好操作等,可能成為精準推薦的參考。而在線下新零售中,店員也可以通過情感分析對於消費者的購物行為有一定把握。

在駕駛領域,情感計算也正應用其中。楊昌源介紹,如我們可以通過對於駕駛者微表情,以及一些生理信號的捕捉,來判斷一個人的疲勞程度,從而避免交通事故的發生。MIT媒體實驗室數據顯示,在識別表情方面,計算機已經可以超越人類,對於真笑和苦笑的一樣實驗中,機器學習的成功率是92%,大幅優於人類。

此外知識圖譜的引入也讓人工智能更懂你。知識圖譜如同人工智能的知識庫,如aliwood的下一步也計劃通過構建短視頻知識圖譜的方式將人類的知識結構化、系統化,並賦能給Aliwood,來幫助AI短視頻的生成。

儘管情感計算已經深入生活,而要讓機器人更加懂你卻並非易事。李斌陽說,當我們追溯情感發生的本源時,我們還並不能完全清楚它的發生機制,就像錢包丟了,我們能夠感受到情緒,但它的發生機制是什麼,這還需要從認知學、心理學等進行探索。楊昌源介紹,目前實驗室也將如何讓人和機器的交互、機器和機器的交互更積極、更聰明作為一個長久目標,要實現這個目標還需要多個學科共同努力。


分享到:


相關文章: