人工智慧里最難的領域——語言,看大咖的怎麼言論

王小川:機器掌握語言,強人工智能時代就來了


人工智能裡最難的領域——語言,看大咖的怎麼言論


提出了3個問題。

  • 人工智能裡最難的領域是什麼?——找到目標
  • 人類歷史上的翻譯運動都有哪些?——瞭解歷史
  • 人工智能翻譯會帶來什麼?——展望未來


大家好,我今天想和大家分享的主題是“搜狗的AI創新之路”。

從智能手機到:

音箱、

機器人、

同傳、

翻譯、

無人駕駛、

無人超市等,人工智能逐漸成為一個新物種。


和語言相關的人工智能,一方面是最新的音箱。不管是亞馬遜,還是谷歌、蘋果、微軟都推出了相關產品。

谷歌2018發佈會上展示了一個非常驚豔的助理,有打電話、訂餐等服務系統;另外是一些前沿技術。

人工智能裡最難的領域——語言,看大咖的怎麼言論

獨家:揭秘全國首家智能酒店 一張嘴就能開燈換臺調溫度



一、語言是人工智能裡最難的領域

近兩年,機器開始像人一樣聽你說話,甚至模仿人幫你對外交流。這裡有一個重大的概念,提到了語言這個詞。

掌握一種語言等於掌握了一種靈魂。

人和動物最大的區別是人會說話,動物可以懂得幾百個叫聲,但很難建立語言概念,用語言描述這個世界,描述華夏文明、長期主義這樣的詞。

人類歷史上有七千種不同的語言,語言是非常獨特、有意義的一件事情。

另外,從計算機以及人工智能角度來看,語言是人工智能裡最難、最深刻的一個領域。

聲音是聲波,圖像是點幀。

自然語言處理是人工智能時代大家最關心的尖端話題。

當機器真正掌握語言的時候,強的人工智能就到來了。


二、人類歷史上的翻譯運動

人工智能裡最難的領域——語言,看大咖的怎麼言論


語言裡有很多歷史故事,可以幫助人類更好地研究語言技術。

1)比如,阿拉伯世界的百年翻譯運動。機器翻譯的時候很認真地學習了這段歷史。

公元八世紀,阿拉伯佔領了亞洲、非洲和歐洲很大的一塊領土。為了統治需要,當時的政權組織官方力量做翻譯,幫助民眾學習當地的語言和文化。

他們花了兩百多年時間,把當時的希臘、埃及,甚至波斯和印度文獻翻譯成阿拉伯文,政權的穩定性得到了很大鞏固。

當地的百姓們有機會閱讀,從而帶來了前後五百年的盛世,這是跨語言帶來文化交流的意義。

2)後來,歐洲文化沒落了,希臘文明也開始衰落。又有學者把阿拉伯文的技術文獻和內容重新翻譯為歐洲原有的希臘文字,文藝復興誕生了。


3)中國也出現過四次翻譯高峰。

東漢末年,唐玄奘西天取經,帶回經書。

中國用了19年,將梵文經書中的75部翻譯成了漢語,帶來了佛教文化在中國的昌盛。這是翻譯和文明之間的跨越意義。

明末清初,第二次科技翻譯。當時最著名的是聖經,還有當時傳入中國,僅次於聖經,非常重要的一本書,叫《幾何元本》。

五四運動之間有大量的翻譯,如共產主義宣言等,解放後也有很多翻譯。

由於語言不同,不同文明之間存在隔閡,但一旦兩個文明碰撞在一起便帶來了新的高度。


三、人工智能使翻譯平民化

在人工智能裡,我很重視翻譯的意義。

以前是人工翻譯,有少數精英可以獲得這樣的服務,不能滿足大眾的需求。但如果翻譯變成平民化,大家都用這樣的技術,即使沒有頂尖的人翻譯的好,仍有巨大的意義。

隨著人工智能的發展,機器翻譯已經取代或擴展了每個人的外部能力。就像發明電一樣,機器翻譯可以推動世界文明的發展。

近兩年,隨著深度學習的發展,翻譯取得了質的突破。

一方面,機器做語音文字撰寫,規則變成神經元網絡的翻譯。

三年前的翻譯系統,翻譯的句子非常不流暢。今天的翻譯系統,語言非常流暢,甚至很難從句子上區分是人的翻譯還是機器。


四、翻譯推動文明進步

今年,國際、國內發佈了大量的翻譯作品。

搜狗在裡面非常努力,我們做這個事的時候,首先想的不是怎麼賺錢,而是有機會參與到人類文明裡。

我們像做輸入法一樣,在做翻譯。

美國人對翻譯的重視程度沒有我們高。

我們現在有61國語言的翻譯。在去年全球最權威的翻譯比賽中,我們和清華研究院合作,漢譯英、英譯漢雙向獲得第一名。

在翻譯方面,谷歌是最好的。

谷歌雖然不是翻譯的提出者,但它有很強的工作能力,把基礎的論文做的很好。

人工智能需要落地的場景以及大量數據的積累,在這方面,中國公司遠比谷歌或其他公司做的更好。我們做了很多產品植入,我們的輸入法和搜索,都有翻譯能力。

搜狗搜索是全球唯一輸入中文時,可以搜索全球語言信息的搜索引擎。

在這樣一個體系裡,我們推出了輸入法翻譯。使搜狗搜索從打字工具、檢索工具,擴展到全球信息的索引和溝通。這使我們原來的使命表達、獲取信息變得更加簡單。

翻譯是跨國表達,我們的產品對推動文明的進步有很大的意義。

我們不僅做這件事,我們也做新物種、AI,以及知識計算工作,包括對話、問答,以及人機交互、語音和圖像等。


五、搜索引擎的下一步是問答引擎

我們的搜索引擎,用一個關鍵詞或幾個關鍵詞去搜索網頁,但機器不懂你的內容。

現在我們講,人表達一個問題,問搜索引擎。

搜索引擎會變成一個問答引擎,根據你的問題,它不僅理解問什麼,而且能在頁面中瞭解你後面段落中的一個具體知識點。

所以給十個結果的頁面,基於你的問題給你答案,或者一個短句。

我們去年參加的一個比賽,這裡有頂尖的人類問答選手。起初我們擔心機器沒有人強大,但後來,我們發現,在這樣一個實時類問題面前,機器遠遠比人好。

數據檢索做了兩個工作:一是理解你的問題,二是從海量網頁中尋找你問題的答案。

我們看到,搜索引擎在逐步升級。

輸入法除了做語音輸入外,未來將部分取代你的人腦。像你的助理一樣,幫助你做溝通。

我們去年上市的時候,我一天收到了三千條祝福微信。我用語音或者文字回答非常難,需要機器主動幫助你回覆。

輸入法慢慢成為助理,幫助你回答這個問題,我們在客服裡做了很多這樣的應用。


六、人機自然交互

我剛才講了知識計算、翻譯、對話、問答。另外一個講自然交互,機器除了做計算外,很大的使命需要和人做溝通。

說話的時候,機器能把語音轉化成對應的文字。

為了讓人機更好地交流,國際上做了很多探討。

搜狗是中國最大的在線語音識別的技術提供者和產品提供者,每天有超過四億次語音識別的請求。

為了做到技術新高度,搜狗不僅做語音識別,還嘗試做唇語識別,這個技術大概做到了60%的準確度,張嘴去說,不需要聲音,就知道你要什麼樣的文字。

此外,還有一個很重要的工作是語音合成。

今天大家聽到的聲音很多是機器的,這裡面沒有抑揚頓挫的音調,我們這裡做了人機結合,給大家談一下。

今天的機器用14分鐘的數據做一個採樣,然後把這兩個系統疊加到一起,看到了第三個系統。

當時那首歌不是我唱的,把我的音色放在其中,讓機器和人的音色作融合。

我們內部有一個系統,我說一段話後,就變成了凱叔講故事。如果大家是做父母親的,聲音錄進去,就變成了爸爸媽媽給孩子講故事,凱叔會作為一個範本放到一邊站。

後面還有人臉遷移技術。


接下來,結合問答技術、人臉識別,看一下虛擬主播。

從語音合成、唇語合成,這樣的技術最終可能走向一個目標,虛擬的個人助理。

一方面是人機交互,作為你的替身,更好地完成服務,這是我們現在使命的延伸。借今天這個場合,談一談我們的理想和長期的理想,謝謝!

場景實驗室是國內領先的場景創新服務平臺,以“場景、超級IP、新物種”原創商業方法論為核心,提供商業模式設計、頂層戰略升級、超級IP加速等服務。

《哈佛商業評論》中文版是哈佛商學院的標誌性雜誌。致力於給全世界的專業人士提供縝密的管理見解和最好的管理實踐。

內容來源:2018年10月9日,由場景實驗室和《哈佛商業評論》中文版在M空間舉辦的甦盛典上,王小川老師以“搜狗的AI創新之路”為主題進行分享。

整理的筆記,人工智能。


分享到:


相關文章: