堪稱「玄學」!百度機器翻譯現在都能預測你未來幾秒要說的話了!

先給大家看一張動圖:

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

上面的中文是人類說的話,下面的英文是百度 AI 給出的實時翻譯。可以看到,沒等說到“莫斯科”的時候,AI 自動翻譯的英語就已經出現了“meet”,也就是漢語句末的“會晤”。

難道現在 AI 已經掌握了讀心術?


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

其實這是百度在機器同傳中研發的最新技術,有預測和可控延遲能力,能實現兩種語言之間的高質量、低延遲翻譯。它的出現讓機器同傳又有了新進展!


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

在我們瞭解機器同傳之前,首先要知道人類同傳是什麼。

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

同聲傳譯是一項很重要的工作,在國際會議、外交談判、演講等場合,只要交流之間出現了兩種語言,就需要同聲翻譯的幫助,他們會在現場聽取演講,並實時翻譯成另一種語言。

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

同聲傳譯工作通常在一句話的話音剛落,2-3秒之內就要立即傳譯出來,是一份高壓力、高強度的職業。而 AI 機器同傳就是把人類翻譯工作的過程用 AI 技術來代替。

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

機器同傳運用語音識別技術自動識別演講者的講話內容,把語音轉化為文字,然後調用機器翻譯引擎,將文字翻譯為目標語言,顯示在大屏幕或者通過語音合成再播放出來。


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

並不是!在人工智能領域,兩種語言的“即時互譯”是一項難以攻克的技術問題,主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

▲ 中文語序下,“香山”在前,“最美的時候”在後;而英文翻譯中,“香山”被後置,“最美的時候”被提前

這種語序的差異,讓同傳陷入一種“準確度與速度不可兼得”的尷尬境地:

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

百度工程師們針對同傳中遇到的難題,提出了“一攬子”解決方案,一起看看它有哪些亮點?


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

人類同傳譯員常用的一個技巧就是“合理預測”:在發言人話說到一半時,預測到後半句可能要講的內容,超前翻譯,這樣能使同傳又快又準。

百度的工程師們模仿這一點,研發出了“wait-k words”模型,讓機器同傳也擁有了“合理預測”的能力,一定程度上解決了上面所說的“準確度與速度不可兼得”的問題。

普通的 AI 同傳是一整句話說完之後才進行翻譯,而百度同傳沒等說完前半句,它的“大腦”就會瞬間做出反應,可以“邊聽邊腦補”!

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

▲ 這是百度同傳的腦補現場,當說到“百度在18年前”時,AI 就預測出了“started a business”

另外一點是!百度同傳可以個性化控制翻譯時的延遲速度,像法語和西班牙語這種比較接近的語言,延遲就設置在比較低的水平。

但是,英語和漢語這種差異較大的語言,以及英語和德語這種詞序不同的語言,延遲可以設置為較高水平,從而更好地應對差異。


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

人類同傳譯員在接到翻譯任務後,通常會提前很多天學習相關知識,進行“備課”,為的就是更好地應對陌生詞彙而臨危不懼。

於是,百度工程師們模仿了這一準備過程,讓機器同傳也能通過快速融合領域知識策略,快速學習專業知識,提前“備課”。

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

當 AI 同傳接到某一個領域的翻譯任務時,系統會收集該領域數據並在通用模型的基礎上進行增強訓練,最後對該領域術語庫進行強制解碼,使專業術語翻譯得準確可靠,且提升翻譯效率。


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

區別於傳統的上下文相關建模技術,百度推出了上下文無關音素組合的中英文混合建模單元,包含1749個上下文無關中文音節和1868個上下文無關英文音節。這個方法具有泛化性能好、對噪聲魯棒、中英文混合識別等特點。


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

根據語音識別模型常犯的錯誤,在訓練數據的時候加入噪聲數據,讓模型在接收到錯誤的語音識別結果時,也能在譯文中糾正過來。

堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

比如,語音識別系統將“大堂”錯誤地識別為“大唐”,這一對噪聲詞被收錄到訓練數據裡,再把源語言句子“我們在酒店大堂見面吧”替換為“我們在酒店大唐見面吧”,而保持目標語言翻譯不變“Let's meet at the lobby of the hotel”,同時將這兩個中文句子存儲在它的“大腦”裡面,以後再出現類似的情況會更輕鬆地解決!


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

和咱們人類譯員相比,機器最大的優勢是不會因為疲倦而導致譯出率下降,能把所有“聽到”的句子全部翻譯出來,這讓機器的“譯出率”可以達到100%,遠高於人類譯員的60%-70%。


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!


堪稱“玄學”!百度機器翻譯現在都能預測你未來幾秒要說的話了!

同聲傳譯被廣泛應用於政府間的峰會、多邊談判和其他商業場合,但是同傳人員稀缺也成為了當前的棘手問題。

研發百度同傳的目的,並不是取代人類譯員,而是為了降低同傳成本,讓同傳的應用範圍更加廣泛。我們希望世界各地的人在 AI 的幫助下早日實現“無障礙”的交流,用科技讓複雜的世界更簡單!


分享到:


相關文章: