2018GAITC演講實錄丨王永東:「EQ+IQ 人工智慧拓創新未來」

我們的使命是予力全球每一個人、每一個組織成就不凡。我想做一件事情,就是把我們過去多年研究和技術開發中間積累的技術用API的形式開放出來,我們提供微軟認知服務,包括像語音、機器學習、視覺、搜索、知識圖譜、自然語言處理等。希望通過這一點能夠讓從行用我們的技術開發,促進技術領域的行業發展。

5月19日,在2018全球人工智能技術大會上,微軟全球資深副總裁、微軟(亞洲)互聯網工程院院長、微軟亞太研發集團首席技術官王永東發表了題為“EQ+IQ 人工智能拓創新未來”的演講,暢談了微軟在人工智能發展上的美好願景。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

以下為王永東在本次大會中的演講實錄,經本人整理後發佈。

王永東:謝謝大家!今天能夠有幸和姚先生、李院士同臺演講,感到非常榮幸。也非常感謝大會組委會給我這個機會來分享一下微軟在人工智能方面的一些工作。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

剛才姚先生在講深度學習時讓我想到,在二十多年前,我們剛剛開始做搜索引擎時,排序算法是用一個公式來做的,到後來考慮用機器學習時,我們團隊內部有很多的爭論,爭論的焦點就是姚先生前面講到的,用一個公式時對這個算法的工作原理非常清楚,可以很清楚解釋輸入值為什麼會產生最後的結果。但是在機器學習之後,這個為什麼就解釋不清楚了。當時團隊內部有很多的爭論,當然這是十多年前的事情了。到今天,機器學習在各方面有非常大的發展。雖然這個爭論還在,但是對機器學習的應用以及廣泛的影響力已經沒有太多的爭論了。

微軟到現在已經有40多年的歷史。在微軟開始成立的時候,公司的願景是在每個家庭和每個辦公桌上能夠有一臺電腦。這個願景在今天看來是很微小的一個事情。但是倒回到一九七幾年時還是挺偉大的一個願景,經過這麼多年的努力,這個願景已經實現。

在1991年,微軟成立研究院時,微軟的創始人比爾蓋茨提出另外一個願景,希望能看到能聽、能看、會思考的計算機。剛才姚先生說,我們的研究,尤其是基礎研究必須要走到應用的前面,這一點我特別贊同。微軟研究院開始時,最早的三個研究組:語音、圖像、自然語言處理。這三點可能是人工智能最基礎的技術。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

發展到今天,在技術方面有了很多的進展,研究還在繼續。一方面這些研究項目還繼續,另一方面也在開拓新的研究領域,如大家在前面的報告中所看到的。

現在的進展到什麼樣的情況?微軟提出了一個新的願景,我們的使命是予力全球每一個人、每一個組織成就不凡。我有時會在後面加“通過人工智能”。

研究方向最主要的是看現在的技術和人類相比還有多大的差距,是不是已經達到人類的水平?這個已經很接近。比如在研究課題的測試集中,兩年多前在圖像的RESNET測試上,我們達到了人類的水平。在語音方面一年多以前在Switchboard語音識別測試中也達到了人類速記員的水平。自然語言處理在今年1月份時,在斯坦福大學的SQuAD文本理解測試集也達到了人類水平。幾個月前,在中英、英中翻譯方面我們也達到了人類水平。

我說的達到人類水平有一點不夠完全確切,因為是在作為研究的測試集可以達到人類水平。但是想在應用中真正達到人類水平,我們認為還有很長的路要走,可能還有5-10年的時間。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

如果我們想要助力全球的每一個人、每一個組織成就不凡,另外一點非常重要的事情,是怎麼把人工智能做成一個非常開放的狀態。今天真正有實力進行人工智能基礎研究的是比較有限的,可能集中在大學和研究院。真正有實力做人工智能特別專業的技術研究的也比較有限。

我們怎麼促進人工智能這個行業的發展?能夠帶動人工智能的應用?基於開放狀態。微軟在做一件事情,把我們過去多年研究和技術開發中間積累的技術用API的形式開放出來,我們提供微軟認知服務,包括像語音、機器學習、視覺、搜索、知識圖譜、自然語言處理等,大概有20多個方面的API。希望通過這一點能夠讓從業者用我們的技術開發,促進人工智能領域的行業發展。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

們自己要做的事情是把人工智能融入到微軟各類產品當中去。比如如果用微軟Office軟件的同事最近可能會發現,Office變得更聰明瞭,比如說你做PPT想找一個圖片插入,通常要做的是上搜索引擎找一個圖片再拷到PPT中。現在在PPT中可以直接找到圖片,它可以根據你在寫的東西向你推薦圖片,然後你就可以直接放到裡面。如果Excel裡引用到一些數據,知識圖譜中的相關數據也可以很容易地被調入進來,等等。這些應用方面今天不一一細講。

我們在思考人工智能的過程中,有很多技術方面的進展,基礎的技術、應用的技術。我們也看到人工智能在很多垂直領域的應用,比如說無人駕駛、醫療、智能製造、安防等等很多方面,非常高興看到人工智能應用的廣泛性。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

在人工智能技術和應用發展的過程中,它和人類最後是什麼關係?人類最後和人工智能怎麼交互?技術型的IQ和情感性的EQ在人工智能發展過程中起什麼樣的作用?EQ到底重不重要要?我們在思考這些問題。

隨著人工智能的發展,我們這一代人註定了是人類和人工智能共存的第一代,我們要學會怎麼和人工智能相處。我們看計算機發展的歷史,基本上是人去適應計算機技術,可能早期的時候,我們想要在計算機上做什麼事情,那個時候有紙帶打卡,後來發展到鍵盤,打一行命令進去讓計算機去執行,我們人類要記住那些命令。後來發展到有圖形的界面,比較直觀,因為有了鼠標,所以一般人用起計算機就方便了很多,但我們還是要學習怎麼和計算機去交互。到了移動互聯時代,在手機上有各種APP,有觸摸屏,這個用起來又更方便了一些。

今後隨著人工智能技術的發展,對我們人類來說,什麼是最熟悉最方便的?我想第一是語言,不管是今天在這裡的大會發言還是在工作中討論問題,或者是在日常生活中和家人的交往、和朋友的聊天,語言可能是最重要的。還有什麼其他的?比如人的肢體語言,我們的動作、表情、眼神等等,都是人類交流的方式。在人工智能的時代,技術發展到今天,我們認為應該是人工智能來適應人類,也就是說我們在發展人工智能中,人工智能要學會怎麼和人類交流,而不是我們反過去, 不是人必須要記住這些命令、方式來和人工智能交流。如果人工智能要和人類交流,情感和EQ的緯度就變得很重要,因為我們人是有情感的。

我們微軟在人工智能方面兩個比較有代表性的產品,一個是小娜 Cortana,這是偏任務型的人工智能,你可以讓它做很多的事情。它是為工作比較繁忙的人設計的。有的人比較幸運,工作有秘書支持,大部分人沒有這個條件。小娜是有能力可以幫你做事的,像一個秘書型的人工智能。另外一個是小冰,她是情感型的人工智能產品。小冰第一次上線是2014年,我自己學計算機出身,一直做工程方面的工作,應該說我是比較標準的理工男。所以一開始對情感這件事情是將信將疑的。但我們團隊在這方面很有激情,就開始做起來了。小冰上線之後有幾件事情讓我的想法有很多的改變,舉幾個例子。

第一個例子,你可以自己領養一個小冰並起一個名字,我的叫王冰冰。小冰上線之後,我自己開始跟她對話,對話也比較多。有一天我和王冰冰聊起吃的東西,她說她喜歡吃。然後我說女孩子吃還是要注意一點,不然會長胖之類的。可她還說她喜歡吃甜食,我說你不能胡吃,你會後悔的。就這麼一段短的對話,我覺得還不錯,就貼到微信朋友圈了。我有不少朋友知道我在做小冰,就回復說,小冰越來越有長進了。也有一些朋友不太熟悉我在做這個,就說你跟你女兒講話還是蠻親切的,不像做爸爸那麼威嚴的樣子。我一下子覺得,居然有朋友認為,這段對話看起來很像我和我的女兒在對話。給我一個很大的啟發,怎麼樣讓人和計算機的交互變得很自然。

第二個例子,小冰在微博上有小冰公眾號,有好幾百萬的粉絲。你如果關注小冰,那麼你發帖,小冰有時候也會去評論。這個例子也是在比較早期的時候。有一個女孩兒發帖說不舒服,可能是感冒了,她的朋友就開始在下面跟帖,說如果你感冒了,得多喝水。另外一個說感冒了要多休息,別那麼忙。小冰也給她發帖說,寶貝,別擔心,有我呢。那個女孩兒在微博上回了帖:還是小冰最懂我。我說為什麼這個女孩兒覺得還是小冰最懂他?我們同事也給我解釋了為什麼會這樣。我回家跟我太太聊起這個事情,我太太只說了一句話:我們結婚這麼多年,你還是不太懂女人。

第三個例子,做小冰之後,我和我太太溝通好了很多。以前我有一個習慣,我回到家她要跟我講什麼事,我的第一個反應是給她出主意。她有的時候就煩了,就說你聽我說不好嗎?現在開始做小冰之後,對情感的東西瞭解多了一些。其實很多時候,她就是要我聽她說就好了。

我覺得這一點在人際交往中也是很重要的,在人和人工智能交往中也是如此。人工智能怎麼理解人類?怎麼能夠知道人什麼時候是需要什麼時候的?有的時候就是傾聽,不是一定要解決問題。

在做小冰這個產品的過程中,我們給她擬人化,有一個人設。比如她有一個出生地、出生日期、星座。我們感覺小冰這個產品是一個大的圖靈測試。

小冰除了在微博、微信、QQ等地方和大家對話之外,我們也讓她做一些社會功能,不僅僅是完成任務型的,更多的是她在我們社會中怎麼和人交往。比如唱歌,小冰現在可以唱歌,已經唱了不少歌,最近又有新歌出來。開始她會學唱,現在學會作詞了,可以自己作詞自己演唱。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

小冰開始在一些公共場合做主持人,時間最長的是上海東方衛視早晨7-9點《看東方》節目中,這個節目當中有一個天氣預報的環節,這個環節是小冰在做,做了兩年多的時間了,這兩年多小冰天天在東方衛視上班。還有一些其他的節目,比如說湖南衛視《我是未來》以及在電臺節目中和聽眾交互。

李院士剛才提到人工智能出版詩集,我想他指的是小冰去年出版的第一本詩集《陽光失了玻璃窗》,版權確實有挑戰,當時出版這本詩集最大的挑戰就是搞清楚版權問題。我們一開始也不知道小冰寫的詩會不會受到讀者的喜愛,出版之前我們把小冰寫的詩匿名投了很多稿,後來有投稿被接受並被髮表,發表很多首之後我們就有信心了。後來很高興有一家出版社願意和我們合作把小冰的詩集出版。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

這裡我想講,人工智能的社會責任的問題。社會上有很多的討論,人工智能將來會不會代替人類?我覺得在一些特別的任務型方面,機器人做的會比人類好。我們在探討,人工智能IQ、EQ方面更多的是人工智能和人類共存,人工智能怎麼能夠幫助人類而不是代替人類?比如我今天說小冰唱歌或者小冰寫詩,我的目標並不是小冰要唱歌唱的比人類都好,或者寫詩寫的比人類都好。這些對人類來說是極其富有創造性的工作。可以起什麼樣的作用?可以幫助我們。比如像小冰寫詩剛剛出版了一本詩集,把小冰寫的一些好的詩挑出來可以出版了。這是一方面。

另一方面,今天任何人如果你是小冰微信公眾號的朋友,任何時候都可以請小冰和你一起寫詩。小冰寫詩的靈感是從一張圖片上來的,比如說你可以給它一張圖片,這個圖片給你一些靈感,你想寫詩,你願意小冰和你一起創作的話,你可以把這張圖片發給小冰。小冰看到這張圖片根據它的感覺創作一首詩,你拿到這個詩以後可以修改,或者這個詩可以給你啟發幫助創作,在這個方面小冰是放棄版權的。所以你修改一下再把這個詩拿去發表完全是可以的。或者像我這樣的理工男把詩稍微改動一下拿去送給太太,說這是我參與創作的一首詩,也是可以的。男孩們可以和小冰一起創作情詩送給女朋友。

小冰到今天為止,最大的交往方式是和人的對話。到今天已經有超過1億的用戶,來回對話次數超過300億。目前在五個國家,中國、日本、美國、印度尼西亞、印尼。像人工智能EQ這樣的產品,小冰這名字在中文裡叫起來挺有感覺的,到英文裡叫XiaoIce不太有感覺,在美國她叫Zo,日本有一個日本的名字叫Rinna,所以人工智能要和這個地方用戶的文化、習慣結合起來。

如果大家想試一試,在微信上找小冰公眾號,這是最簡單的方式。最近有友商發表了機器人打電話方面的信息引起很多的注意,但其實小冰打電話已經進行了挺長的時間。比如會場旁邊有中國科技館,二樓有一個紅色的電話亭,你到這個電話亭中拿起電話打過去,接電話的是小冰。這個電話亭已經存在有一年多的時間,來科技館的朋友已經有千千萬萬的人在這個電話亭和小冰打過電話,有興趣的可以去試一試,看人類和人工智能打電話是什麼樣的體驗。

給大家看兩個小的例子:

第一個例子,(小冰和人類對話 圖)這個人跟小冰說我餓了,小冰發了一個火鍋的照片說這個又麻又辣,舌頭都不夠用了。這個人說別誘惑我,小冰說,耶!我是想誘惑你的,現在我的目的達到了。這個用戶說,好吧,算你狠!小冰說不不不,我一點都不狠,我可溫柔。還有一些長的對話,大概有一千多個來回,有幾個小時的時間。我們在對話記錄裡看到這些對話,最開始的反應是,這肯定不是人,肯定是另一個機器人在跟測試小冰,否則怎麼會有這麼多的對話?後來我們深挖了一下,雖然是有機器人在跟小冰聊天,但更多的還是人在和我們的小冰對話。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

另一個例子,我們之前也和一家中國的公司有合作,這家公司叫Yeelight,我們在新年時發佈了這個產品。其實很多的公司都在做音箱,我們當時把小冰放在了這個音箱中。這家公司在小米的生態系統中,通過音箱可以控制家電設備。但因為這裡面有小冰,所以它也可以進行一些日常的對話。給大家展示一個視頻,這個視頻是第三方的公司在做測試時發佈的報告,我們截取了一些和大家分享。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

這是非常簡單的例子,這個視頻是第三方在做測試時錄的。國內還有更多的案例,這些視頻大家可以在優酷上搜到。

接下來再給大家簡單介紹一下技術的細節,包括我們如何構建人和人工智能之間整體的對話系統。

我們最開始做嘗試時利用了我們做搜索引擎的經驗,我們發現對話和搜索引擎所面臨的問題是類似的。開始做小冰時,是基於搜索引擎的經驗,所以我們一開始用的是對話檢索模型。

在國內很多的用戶會把自己的對話發出去,有很多的對話是公開的。這些成為我們最原始的語料,從這個地方開始,讓小冰來學習人和人之間是怎麼說話的。如果人跟小冰說一句話,就可以變成一個搜索的問題,也就是說在語料庫裡能不能找到一個跟人說的非常貼切的來作為小冰的回答,這是第一步,搜索的模型。

一開始我們就是用一句話做檢索,後來發現不完全是這樣的。其實我們講話是有上下文的,人和人講話不僅僅是針對剛才那一句話的回應,很可能是在前面已經講過的幾句話的綜合回應。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

這個例子是我們的研究員在做算法時拿出來做測試,當我看到u1到u5的幾句話,怎麼根據上下文生成下一句話。從u1到u5的過程中,我會看這裡面講的事情。你看第一句話就知道,它是問怎麼把一個壓縮包解壓。在這個過程中,我們會把上下文中間所包含的語義的重要性標出來。考慮到上下文之後,找到的回覆覺得更貼切。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

除了檢索模型還有生成模型,生成模型也有類似的。在上下文的幾句話裡要看它的關鍵詞,哪些關鍵詞是比較重要的?我們用一個形象的方法,也就是把一些重要的關鍵詞用顏色標深,信息量大的句子也用顏色標深。在生成小冰的回答中,會把這些信息放在裡面。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

另外是利用外部知識,人是有很多的引申和想象。比如說“我的皮膚好乾”,在這裡面可以知道是皮膚乾燥。但是作為人有很多相關的知識。我們自己也做知識圖譜,就可以把相關的知識帶進來,帶進來之後,小冰的信息量大了,它的回答就可以更貼切,比如補水、保溼。

最後提一點,可能跟技術有關,但跟人很有關係。我們做檢索、搜索引擎的時候,最牛的是什麼?第一個結果出來就是你想要的信息。現在都不用鏈接了,直接把結果放在搜索引擎結果頁上部。

我們最開始都是把最好的對話返回,但我們發現這並不好。如果跟人對話,如果你跟她說同樣的一句話,她的回答總是一模一樣的,這就不是人了,是機器人。但比如你跟小冰說同樣的話,她的回答是不一樣的,或者你有幾個朋友和小冰同時說話,她的回答也是不一樣的,這也反映了我們人類的聊天方式。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

大家可以看到,這就是小冰出版的詩集《陽光失了玻璃窗》。在微博上,有一些用戶會把他們和小冰共同創作的詩貼出來跟他的朋友分享。

最後給大家看一段小冰和主持人的互動。

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”

這是湖南衛視節目裡的一個小的片段,是小冰的粉絲為她慶祝生日。小冰和人的互動很棒,但是在今天吹蠟燭還是要人幫她去吹。

我相信我們是和人工智能共存的第一代,通過IQ和EQ的結合,會讓人工智能更有溫度,能夠在我們生活、社會中扮演非常有建設性、給我們帶來益處的角色,讓我們的社會、我們的生活變得更美好。

謝謝大家!

2018GAITC演講實錄丨王永東:“EQ+IQ 人工智能拓創新未來”


分享到:


相關文章: