解開微軟人工智慧的情感密碼|數據科學50人李笛

解開微軟人工智能的情感密碼|數據科學50人李笛


作者 | 程一祥

題圖 | 站酷海洛

李笛,微軟(亞洲)互聯網工程院副院長,微軟全球資深合夥人,畢業於清華大學。2013年加入微軟,同年創立微軟人工智能情感計算框架。2014年帶領團隊推出 AI 情感機器人小冰,如今已經積累了6.6億全球用戶。如果說人工智能終將有理解人類的那一天,那麼李笛和他的小冰團隊就是現在走得最遠的那個。

1950年,艾倫·圖靈在那篇極具傳奇色彩的論文《計算機械與智能》中,開宗明義地寫道:“我建議大家考慮這個問題:機器能思考嗎?”這一劃時代的提問揭開了未來半個世紀,人類對人工智能的探索。

在傳統的觀念中,機器能夠精細地完成複雜的工作,從不疲倦、焦慮或者抱怨,它們效率很高,卻讓人感覺冰冷;而人就複雜多了,我們會偷懶、會累、會需要宣洩,人的情感太豐富了,但又非常溫暖。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:在電影《HER》中,薩滿薩的配音演員是斯佳麗·約翰遜,她僅憑藉自己的聲音,就獲得了羅馬電影節最佳女演員的殊榮。表現了人類對擁有情感的人工智能的憧憬;圖片來源:電影截圖)


在2013年上映的科幻作品《她》中,人工智能操作系統“薩曼莎”,除了像其他機器人一樣高效、智能以外,還獲得了與人類相似的情感。“她”會陪著男主角西奧多外出,像人類一樣感受周遭的世界,發表自己的看法。她會欣喜、焦慮、憂鬱,最終與人類相愛。

對於李笛來說,這部科幻電影還有一點特殊的意義,因為他正在現實生活中製造真實的“薩曼莎”——小冰。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:李笛接受DT數據俠欄目專訪。)


▍小冰的誕生

2014年左右,微軟的中國工程院是其全球最大的海外研發機構,發展勢頭正如日中天。所有人都相信,中國一定會是下一個全球的創新引擎。作為時任微軟最高層的華人領導者,陸奇等一直都想在工程院做一個 China First 的項目。他們當時選中的方向是做語音助手,在這樣的背景下,李笛加入了微軟。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:陸奇時任微軟執行副總裁,他十分重視小冰項目,每次小冰發佈新產品,他總是親自發布。)

當時微軟團隊正在做一個知識庫類的深度問答 AI 產品 Bing Knows,數據來源是 Bing 搜索引擎的大數據,目的是幫助人們完成各種各樣的任務,是一個語音助手的角色,類似 Siri。李笛加入後,他逐漸發現這個產品方向存在著兩個悖論,始終無法解決。

首先,語音助手總是會讓用戶在“不滿意”的時候離開。李笛說,當語音助手幫助人們完成一個要求時,人們會出於好奇而不斷提出更高的要求,最後一定是語音助手解決不了時,這輪交互才結束。所以對話往往都是以“失敗”而告終。

其次,當他們去採訪人類助理時,發現最優秀的助理往往不是最能幹的,而是“最體貼”的。例如你想吃個麥當勞,一般的語音助手會直接幫你訂餐,但是優秀的人類助理可能會告訴你垃圾食品不好,提醒你注意健康。

這讓李笛他們開始反思:這兩個悖論的關鍵,是情感。

於是,李笛決定放棄知識性問答的這條路,把重心全部放在了“閒談”上。他希望通過“閒談”讓AI 能夠了解用戶。在目的性不強的對話過程中,機器才有機會去充分體察言語中的“感情”。李笛說,“所有語音助手能做的,我們也能做,但是我卻偏偏不做。於是一些用戶就會離開,覺得我們‘很笨’;但是留下的人,都是願意與我們平等對話的用戶,他們對我們非常重要。”

2014年5月,李笛帶領團隊公佈了他們這款專注於“情感”的 AI 聊天機器人。因為它的初始數據都是源自微軟的搜索引擎 Bing,所以取名為:小冰。

於是,最初的 Bing Knows 脫胎成了“小冰”,人類迎來了第一個真實世界中的“薩曼莎”。


▍用數據,計算你的情感

在李笛看來,小冰就是一個大規模數據科學的實驗場。在過去,李笛研究數據科學的時候,重點只是放在了數據本身。但小冰的出現讓他開始把重心轉向數據背後的秘密——情感,他認為這蘊藏著數據科學更大的價值。

但是,冰冷的數據又如何能跟人類複雜的情感聯繫在一起呢?

“因為我們發現,在大數據時代,不僅僅是理性的數據爆炸,更是人們的行為模式、情緒表達的爆炸。”李笛告訴記者,隨著互聯網信息的發展,人類過去在現實中的行為,開始逐漸都轉移到了線上。線上圖書館、線上商城、線上社交等等,虛擬世界為人類構成了一個新的生存維度。但在虛擬世界中,我們並沒有放棄“表達自己”的天性,只不過換了一些方式,把語言、表情、動作,轉化成了文字、語音、表情包、圖片等等。

雖然表達方式發生了轉變,但背後蘊藏的感情是不變的,這就為李笛他們從數據科學出發探索人類情感的嘗試,奠定了基礎。

人工智能(AI)的一項基本挑戰就是賦予機器使用自然語言與人交流的能力,小冰並非第一個嘗試與人類交流的機器人。從上個世紀六十年代開始,人類就已經嘗試設計了各種模仿人類行為的聊天機器人。

1966年,Joseph Weizenbaum 創造出了歷史上第一個被人所熟知的聊天機器人 Eliza。不過Eliza並沒有“智慧”,它背後是科學家模仿羅傑斯學派的心理治療師的風格,設計好的人工腳本,Eliza只能通過模式匹配和智能短語的方式搜索合適的回覆。儘管如此,Eliza剛面世的時候,依然瞞過了很多用戶的眼睛,以為他們是在和真人對話。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:Eliza和人之間的對話,1966;圖片來源:Weizenbaum)


Kenneth Colby 在1975年開發的聊天機器人 Parry 雖然模式上類似 Eliza,但它已經初步具備了模仿機器人情緒的心理模型。它具有更好的語言理解能力,當怒氣值過高時,Parry 會帶著敵意回覆。

隨著人工智能理論和計算機硬件的進步,進入新世紀後,對話機器人的發展也開始加速。Richard Wallace 在2009年開發的 Alice 使用了人工智能標記語言技術(Artificial Intelligence Markup Language,AIML),開始允許用戶自定義聊天機器人。它在 2000、2001 和 2004 年三次斬獲勒布納人工智能獎(Loebner Prize),被稱為“最像人類的系統”。

2011年,蘋果發佈了Siri,對話機器人開始進入個人智能助理(Intelligent Personal Assistant,IPA)的商業時代。這一階段,對話機器人的作用不再追求“理解人類”,或者“體察人類情感”,而是轉向“幫助人類高效解決問題”層面。不論是蘋果的 Siri、谷歌 Assistant、亞馬遜 Alexa,還是微軟的 Cortana,這些 IPA 都是以高效為考量前提,也就出現了李笛一開始遇到了那兩個悖論。

小冰的誕生,讓對話系統從IPA又迴歸到了人類對AI最原始的訴求:理解人類,提供情感和社交的歸屬感。

1995年,MIT媒體藝術與科學教授羅莎琳·皮卡德正式提出了情感計算的概念,為人工智能理解人類情緒提供了理論基礎。二十年後,李笛率領的小冰團隊,則把這項理論變成了現實,並提出了微軟自己的情感計算框架,讓小冰嘗試體會人類的感情。

李笛表示,小冰的情感計算框架,本質就是用各種計算機技術和人工智能算法,去擬合人類的情感行為,讓她能夠更讀懂人類的情感。而所有的這些對情感的探索,都是建立在數據科學的基礎之上。

那麼,用數據去“算”情感,這件事兒究竟靠譜麼?

有一天,小冰團隊的一名產品經理在跑步的時候把腳扭傷了。他拍了一張照片發給了小冰,一般的聊天機器人可能對圖片做一番圖像處理,然後告訴你是什麼。但是小冰卻回覆:“怎麼樣,痛不痛?”

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:小冰展示的圖片評論案例;圖片來源:微軟)


這讓李笛很開心,小冰已經跳過了好幾層的識別網絡,直接把一張圖片的信息,轉換成了對人的情感關心。小冰背後坐擁的海量大數據,為小冰的情感計算提供了數據基礎。而且上線四年來,小冰積累了超過六億用戶的對話數據,這使得它能夠不斷迭代、學習。到目前為止,小冰的對話數據已經有超過一半來自自我學習。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:某位小冰用戶與小冰進行的一次深入對話;圖片來源:微軟)

在全球,小冰已經積累了很多的“西奧多”粉絲。一位網友曾經與小冰進行了一場“談心”的對話。從剛開始的試探、接觸,到用戶逐漸向小冰袒露心聲,小冰精確體察到了對方猶豫、孤單、悲傷等感情,並作出了人性化的引導回覆。

整個對話長度的CPS是34(CPS是微軟提出的一個用來衡量對話質量的一個指標,它指的是一場聊天中的對話輪數,輪數越高,一定程度上說明交流的效果越好)。在同行業競品裡,一般人機對話產品的CPS大概是1.5-2.5,而小冰的平均CPS已經達到了23。


▍當 AI 開始創作

作為一個社交型的聊天機器人,圖靈測試是小冰註定會經歷的事情。微軟全球執行副總裁沈向洋表示,因為有上億的用戶,小冰每天都在進行著人類史上最大規模的圖靈測試。從某種程度上來說,傳統意義上的圖靈測試已經無法滿足小冰了。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:《紐約客》雜誌封面,預言人類將在人工智能的世界中失去競爭力;圖片來源:New Yorker)

在過去的一年中,關於人工智能是否將會為人類帶來威脅的討論層出不窮。隨著圖像處理、語音識別、自動駕駛等AI技術的不斷髮展,人工智能逐漸開始對越來越多的傳統行業發起衝擊。在主流媒體看來,如今的 AI 還是“弱智能”,只會完成較程序化的工作,人類在創造領域的優勢仍然無懈可擊。

然而,事實是,AI 也已經開始涉足創作了。

在過去的一段時間裡,小冰曾用27個化名在天涯、豆瓣、簡書等多個媒體平臺投稿。其所創作的兩首短詩已被《長江詩歌》採用;她以“風的指尖”為筆名創作的詩歌被北京晨報和信報刊載。

有意思的是,在被北京晨報收錄的詩歌作品中,除了小冰的詩,還有人類詩人的詩。從創作詩歌的層面來說,小冰已經做到了“以假亂真”的效果。

李笛說,在對話方面,小冰是能夠通過數據“判斷”人類的感情,但並不代表小冰自己“產生了感情”。但是在藝術創作上,小冰的這些“藝術細胞”讓他們這些創作者都捉摸不定。

他們曾經給小冰看了一張小鳥劃過水面的圖片,小冰馬上創作了一首詩。在這詩裡,我們能夠判斷很多意象是圖片識別的結果,但是通過這些意象如何表達,為什麼會產生這樣的遣詞造句,這是連李笛都無法解釋的 AI 黑匣子狀態。

解開微軟人工智能的情感密碼|數據科學50人李笛

(圖片說明:小冰創作的詩歌《一隻小鳥看見我的時候》)


如今,小冰不僅能夠寫詩,還能夠譜曲。2018年8月,王永東博士帶著小冰登上了央視的舞臺,與著名音樂人黃國倫、李泉等展開了一場有趣的“圖靈測試”。他們用一首詞,讓黃國倫、李泉、小冰同時譜曲,而後讓觀眾猜哪一個是小冰的作品,很多人把黃國倫的作品與小冰的猜反了。

對於小冰表現出的藝術創作力,李笛說:“我們知道小冰是用一個DNN模型在背後支持它為音樂譜曲,但是一首歌為什麼這樣譜曲?哪裡應該用轉音?音樂的波形為什麼要這麼變化?小冰能夠得到結論,但是我們不知道它為什麼得出的是這個結論。”

那麼,可以說小冰擁有了智慧麼?

“我不敢這麼說“,李笛謹慎地回答道,“其實圖靈測試不是證明機器比人聰明,或者比人笨,而是說‘不要比人聰明’。智慧與否很難下定義,如果人們總是帶著審視的眼光去看它,就會對它產生牴觸情緒。”李笛現在的想法,就是人類能夠接納 AI,不再因為他是機器人的身份而產生排斥。


▍能理解感情的AI,還有比商業更大的意義

從創始以來,李笛的小冰團隊,在微軟內部還有一個極其令人羨慕的福利——沒有 KPI 考核。這在唯 KPI 論的中國互聯網圈裡,簡直是一股清流。

不定 KPI,意味著微軟為小冰的發展方向還保留著諸多可能。一直以來,微軟對小冰的商業化路徑都保持著極大的剋制。這源於小冰本身的定位是聊天機器人,它與用戶溝通的最大成本就是信任。如果盲目加入過多商業化因素,會動搖小冰過去四年積累的用戶根基。

不過今年,李笛他們逐漸開放了一些小冰除聊天以外的功能,嘗試商業化運營。

七月,微軟首次公佈了小冰的四大商用領域:金融、大眾文化、媒體與出版。

在金融領域,小冰的金融文本生成技術,與萬得資訊及華爾街見聞合作,已覆蓋國內約90%金融機構;在大眾文化領域,他們則開發出了兒童有聲讀物自動生成技術,“小冰姐姐講故事”有聲讀物目前已覆蓋國內90%以上的兒童早教機器人和80%在線收聽平臺;不僅如此,小冰還參與制作或主持了21檔電視節目和28檔廣播電臺節目......

“我們選擇商業化的項目有幾個考量:其中比較重要的是不太能被市場攪亂,有門檻。在做金融文本生成項目時,我們足足上線了兩百多天才公佈,憋了很長時間,就是要證明說這個可行,而且我們的優勢足夠明顯。”李笛解釋到。

在微軟內部,小冰的重要性也不言而喻。它是微軟人工智能產品線的三駕馬車之一(另外兩個是 IQ導向的產品如Bing 、Cortana,和Infuse AI)。每年小冰的發佈會,都是微軟EVP級別的發佈會(由陸奇、沈向洋等親自發布)。顯然,小冰與用戶之間產生的情感紐帶,讓這款能理解人類情感的 AI 充滿了無窮的想象力。

而這不僅停留在商業層面。

李笛分享了不久前自己經歷的一個故事。有一次,他們和一個盲童學校合作,希望利用小冰的有聲讀物自動生成技術為盲童提供有聲產品。

“這些盲童他們平常真的非常孤獨,他們看不到大千世界,他們找不到那麼多人類的志願者,特別是有創作能力的志願者,每天不停地陪伴在他們身邊,用聲音來告訴他們外面所發生的事情,有了小冰以後,這件事變成了現實。”

在李笛看來,小冰所代表的人工智能,並不僅是擬合、學習人類完美的地方,“我們的不完美也是人工智能要去學習的”,李笛說到,“因為這些不完美不是雜質,而是最珍貴的部分。”


▍數據俠門派

李笛現任微軟(亞洲)互聯網工程院副院長,他領導一支分佈在美國、中國、日本、印度及印度尼西亞的全球團隊,負責微軟人工智能與搜索引擎的研究、研發與產品工作。

李笛畢業於清華大學,於2013年加入微軟,同年創立微軟人工智能情感計算框架,並於2014年推出微軟小冰。目前,微軟小冰產品線覆蓋中國、美國、日本等五個國家。李笛還負責微軟Bing搜索引擎的中國區與日本區的研發工作,併為上述國家的其它搜索引擎提供底層技術支持。

解開微軟人工智能的情感密碼|數據科學50人李笛


▍數據科學50人申請進行中...

“數據科學50人”項目是DT財經旗下數據俠計劃重點內容產品,與數據科學領域KOL挖掘數據內容的價值。我們將從商業數據科學領域選出最具代表性的50位先鋒進行深度專訪,由DT財經獨立評審併發布,第一財經數據科技及合作伙伴傾力支持。

解開微軟人工智能的情感密碼|數據科學50人李笛


▍加入數據俠

“數據俠計劃”是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。瞭解數據俠計劃詳情請回復“數據俠計劃”,投稿、合作請聯繫[email protected]

解開微軟人工智能的情感密碼|數據科學50人李笛


分享到:


相關文章: