現在的智能翻譯機都是扯淡

​​出國旅遊語言不通怎麼辦?來個XX翻譯機讓你從此暢通無阻。相信很多人都看過類似的智能翻譯機廣告,彷彿小時候看哆啦A夢裡的​翻譯蒟蒻道具已成為現實,但在筆者看來,受制於語音識別精度及機器翻譯能力的不足,目前這些所謂的智能翻譯機全是扯淡。

6年前筆者研究生畢業時,曾邀請母上大人來美國參加畢業典禮順帶玩了一圈,回來之後母上大人就開始時不時看看旅遊常用短句之類的書計劃未來跟朋友一起來個海外自由行。但無奈歲數大了,記憶力下降嚴重,這麼多年過去母上大人的英文並沒有太大長進,所以作為兒子,筆者一直很希望智能翻譯技術能有所突破,好幫助母上大人實現環遊世界的夢想。

這兩年人工智能概念火熱,而翻譯作為一個重要的剛需自然得到大量公司的青睞,從翻譯軟件到翻譯網站再到翻譯手機、翻譯機的產品層出不窮,價格從一兩百到幾千不等。各家都將“人工智能”四個大字當做金字招牌來用於自家產品的宣傳,而各路媒體也在旁煽風點火,大有人工智能技術將一統江山,翻譯人員全要下崗的態勢。

現在的智能翻譯機都是扯淡

​如果對智能翻譯技術不太瞭解的小白很容易就被這樣的宣傳所蠱惑,但實際上,如果對行業稍微有點了解就能知道這些產品目前還遠達不到用戶所期待的交流無礙這個標準。

從實現方案來說,分為離線和在線兩種。離線顧名思義有點類似小時候用的那種電子詞典,缺點是詞彙量和參考翻譯都有侷限性。在線的則是藉助雲計算和搜索引擎,缺點是沒了網基本就快廢了。

從功能分工來看,智能翻譯分為兩方面:一個是語音識別 ,一個是智能翻譯。所以對於所有智能翻譯機的第一道門檻就是語音識別的精確度,事實就是來說,在這方面,人工智能算法的引入及發展確實讓精確度得到了一個質的飛躍。

現在的智能翻譯機都是扯淡

​根據公開資料顯示,藉助訓練過得神經網絡系統,谷歌的單次錯誤識別率開始大幅下降,2013年時還高達23%,而2017年時已降到4.9%,而谷歌的兩大對手IBM和微軟在2017年的表現分別是5.5%和5.1%,這個成績同人類相比如何呢?根據報告可知,用英語做日常用語的人類語音識別錯誤率在5%左右,所以谷歌、微軟和IBM的成績在英語國家已堪比人類。在中文方面,科大訊飛今年公佈信息宣佈語音識別準確率已達到98%,搜狗和百度則是97%(今年兩者信息沒有更新)。

從數據來看,語音識別精確度的問題已不嚴重,但從實際應用來說,依然不盡如人意,一方面是遠場語音識別非常容易受到噪音干擾影響準確率(你總不能舉著翻譯機湊到對方嘴邊吧?),另一方面則是一音多字或者多詞的問題難以解決。

眾所周知,中文的一音多字情況非常普遍,而智能翻譯的原理是先將語音識別為正確的文字,然後再從文字轉換到希望翻譯的語言,當出現一些專有名詞或者句子過於簡短的時候,中文的識別錯誤率都會大幅攀升,就比如姓名。​別說機器,就算是我們自己如果脫離語境單純聽都能聽錯,否則相聲裡的包袱怎麼來的?

現在的智能翻譯機都是扯淡

​當然,語音識別精確度並不是最大的攔路虎,真正的挑戰還在於智能翻譯。每當討論到這個話題時,筆者的回答永遠是:什麼時候在線翻譯軟件能把文檔翻譯利索了,什麼時候智能語音翻譯就能實現。如果100%精確度的文檔都沒翻譯對,還談什麼語音翻譯?

客觀來說,中文由於過於博大精深,因此我們不能苛求翻譯機實現100%的準確率(像法-英之類的要明顯高於我們),但在筆者看來,在技術不成熟的情況下進行誇張的宣傳短期內確實可以促進銷量,可從長期來看,這很有可能讓消費者未來對此類產品的不信任感不斷加深,而這顯然不是行業參與者們所願意看到的。所以筆者還是那句話,適當誇張宣傳可以,但別過度忽悠消費者,否則最終砸的還是自己的飯碗。


分享到:


相關文章: