圖片截自知乎
換句話說,Bell認為,現場所謂的“AI同傳”流程如下:
嘉賓說話 人類同傳譯員翻譯,說出譯文 訊飛識別人類說出的譯文,把中文譯文投放到屏幕和直播中,直播中播出語音合成的人聲。
他很快收到朋友發給他的直播介紹,上面寫著:“知領直播引入科大訊飛智能語音技術,實現了國際高端會議的中英文頻道切換、智能翻譯和自動語音播報,帶給你不一樣的視聽體驗”。
於是在憤怒之下,Bell發文揭發科大訊飛“所謂智能翻譯的真相”,稱這裡壓根沒有人工智能翻譯,都是人類智能翻譯。
對此科大訊飛董事長劉慶峰做出回應
疑問一:當天會議有沒有使用AI語音翻譯?
劉慶峰:當天採用人機耦合形式,是“同傳語音轉寫”,非全自動語音翻譯
劉慶峰說,科大訊飛會前為主辦方提供了兩種服務模式:一是全自動機器翻譯,二是轉寫同傳語音上屏。考慮到會議專業性,主辦方最終採用了第二種方式,包括在工程院內部直播平臺“知領直播”上,展示的也是語音合成技術。“這次會議主辦方明確要求機器做轉寫工作”,劉慶峰介紹,因而本次會議的產品logo全部採用“訊飛聽見”,沒有采用“訊飛聽見翻譯系統”。
疑問二:科大訊飛翻譯水準到底如何?
劉慶峰:訊飛翻譯技術已達大學英語六級水平,明年初可達專八
除了做語音識別,機器到底能不能真正實現良好的翻譯效果?有翻譯界人士在微博表示,“一看就是人機協作,機器負責識別和合成,人負責翻譯。”對此,劉慶峰認為,“靠不靠譜,大家可以直接來試。科大訊飛中英機器翻譯通過大學英語六級的測試驗證,翻譯水平已經超過了大部分大學生六級英語成績。可以滿足日常生活需要,預計明年年初可以達到專八水平。”
疑問三:AI語音翻譯未來能否取代人工?
劉慶峰:語音轉寫和翻譯技術可幫同傳提高效率,形成人機耦合新模式,並非替代同聲傳譯人員
事實上,AI語音翻譯需要結合結合語音識別、機器翻譯和語音合成等AI技術共同實現。一般先通過語音識別將發言人的聲音轉寫成文字,再通過機器翻譯得到目標語言的文字,最後通過語音合成獲得目標語言的聲音。