AI同傳技術再曝大新聞!這次是百度……

被“AI同傳造假”事件推上輿論風口浪尖的AI同傳

,又出大新聞。

因“造假”和“圈地”事件連續兩週上了熱搜之後,今日,科大訊飛劉慶峰在科大訊飛1024開發者節上再談“人機耦合”,稱“現在機器翻譯已經超過大學六級翻譯水平,並且應用於日常溝通交流。但是在’信雅達’上,機器翻譯距離高水平譯者和同傳還有很大差距”,耦合才是AI真落地。

AI同傳技術再曝大新聞!這次是百度……

科大訊飛董事長 劉慶峰

無獨有偶,今日有媒體曝出百度宣佈AI同傳最新重磅突破——一款名為STACL的同傳AI,它可以實時將英語翻譯成中文和德語。STACL不走“整句說完再翻譯”的路線,能預測,低延時,演示效果驚人,引發MIT科技評論、IEEE Spectrum等一眾外媒熱議。據說,這是自2016年百度Deep Speech 2發佈以來,又一項讓技術外媒們如此激動的新進展。

Demo展示:翻譯AI會預測

Demo可以看出,百度STACL的翻譯延時非常短,往往延3個詞到延5個詞,而且具有預測功能。對於翻譯AI來說,預測是一項很罕見的技能。不同語言的語序總有差異,所以,那些沒有預測能力的翻譯AI,通常需要等到人類講完一句話,再開始翻譯。

比如下圖中漢語說到莫斯科,STACL根據前半句以及美國總統最可能與其他人發生怎樣的活動,已腦補預測出“meet”。

AI同傳技術再曝大新聞!這次是百度……

但是AI可能從前半句話裡預測出會面順利進行,而事實可能是會面並不順利。這樣翻譯就容易出現失誤。面對這樣的情況,AI目前並沒有糾錯的能力,但用戶可以根據需求隨意調整

AI同傳技術再曝大新聞!這次是百度……

據論文所述,這種預測能力是基於wait-k模型,可以根據歷史信息,直接預測翻譯中目標語言詞彙

。該模型在翻譯質量和翻譯延遲之間做出了很好的平衡,用戶可通過根據實際需求設定延遲時間(例如延遲1(k=1)詞或延遲5(k=5)詞)。比如,法語和西班牙語這種較為接近的語言,延遲可設置在比較低的水平;但是,對於英語和漢語這種差異較大的語言,以及英語和德語這種詞序不同的語言,延遲應當設置為較高水平,以便於更好的應對差異。

百度wait-k模型不僅僅適用於RNN、Google Transformer兩個翻譯模型,還可以用在任何序列映射(sequence-to-sequence)模型上。也就是說,只要有模型能做到兩種語言之間的翻譯,加上wait-k,就可以實現同傳。

詳細技術細節請查看文末論文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency

外媒熱議

由於本論文成果發佈於硅谷,所以首先引發外媒報道評議。

IEEE Spectrum對百度AI同傳新成果給予了高度評價,認為這個新系統揭示了一種通過預測而保持穩定的翻譯工具,可以與聯合國會議期間提供同傳服務的口譯人員相媲美

AI同傳技術再曝大新聞!這次是百度……

但在技術宅集聚的Hacker News和Reddit上,百度AI同傳技術新突破的這條消息,並沒有引發太多的討論。

也有媒體將百度此次突破與谷歌、科大訊飛、騰訊對比,認為百度AI同傳系統雖然仍有侷限性,在外交、商務等一些重要場合,需要依靠人類同傳高質量、專業的翻譯完成,但在中國同傳市場尚不完備的現狀下,提供了新的選擇。

看完論文,歡迎也寫下你的觀點。

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

AI同傳技術再曝大新聞!這次是百度……

圖片來源:論文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency,僅供學習,如涉及版權問題煩請聯繫刪除。


分享到:


相關文章: