科大訊飛「同傳風波」背後:思考、應變等AI翻譯弱勢短期內難解決

IT時報記者 潘少穎

科大訊飛“同傳風波”背後:思考、應變等AI翻譯弱勢短期內難解決

  上週,在上海接連舉行了兩場高級別的會議——2018世界人工智能大會和中國國際工業博覽會,其主題論壇的屏幕上,除了PPT還多了一個新角色——科大訊飛的訊飛聽見,為現場提供語音識別和翻譯工作。然而,這場AI落地最直觀的“秀”卻在會議結束後引發巨大爭議。

  工博會系列活動之2018創新與新興產業發展國際會議(IEID)的一場高端裝備技術與產業分會上,現場同傳譯員、知乎用戶Bell Wang爆料稱,科大訊飛是在識別出譯員說的中文譯文後,再將譯文投放到屏幕和直播中,此舉事先並沒告知自己,涉嫌冒名使用翻譯成果和侵犯知識產權。

  此後,科大訊飛兩次對此做出回應,強調從未“隱瞞”轉寫同傳聲音,不存在侵犯同聲傳譯知識產權的可能性。最新消息稱,科大訊飛已與Bell Wang進行了溝通,Bell Wang接受科大訊飛的解釋。

  此事之所以引發如此風波,恰因它戳中了人們對人工智能一直存在的心結:機器人會不會替代人類?哪些工種未來會消失?

  人工智能翻譯機自面世以來,就一直被冠以“很好很強大”的標籤,譯員被替代似乎也是一件順理成章的事,但事實證明,要想真正做到“信達雅”,AI的能力還遠遠不夠。

翻譯機暫時還不能幫助譯員

  當Bell Wang爆出科大訊飛翻譯機“引用”了譯員的翻譯成果之後,科大訊飛對此的解釋是“人機耦合”,科大訊飛機器翻譯產品經理劉晨璇向媒體表示,“人機耦合”可以降低譯員工作者工作強度、賦能翻譯人員。但是,記者採訪的幾位同傳譯員都表示,基本上不會接收翻譯機給出的信息。

  小月(化名)是一名從事同傳工作7年的譯員,在她看來,譯員在工作期間基本用不上翻譯機。“在進行翻譯時,以聽和說為主,同傳間電腦上播放演講者的PPT只是作為參考,還要事先準備相關的單詞表,基本沒法分心去看其他資料。而且很多演講者會即興發揮,此時,譯員必須‘拋棄’手中的材料,邊聽邊譯邊說,集中精力很重要。”更為關鍵的是,翻譯機無法保證百分之百的準確率。“尤其是碰到口音比較重的演講者,翻譯機更容易出錯,如果以翻譯機的翻譯結果為準,也會出現差錯或帶來干擾。” 小月說道。

  德英漢譯員高大玉對此也深有同感,她告訴《IT時報》記者,以進行德漢翻譯為例,如果聽到德語方言,在她腦中,首先要把德語方言轉化為標準德語,再把標準德語轉化為漢語。如果由翻譯機來翻譯,對於德語方言的把握不一定很準確,“翻譯機比較固化,設置德漢翻譯,它只能進行德漢翻譯,如果演講者夾雜說幾句英文,翻譯機就會識別錯誤或者識別不出來。翻譯現場會出現很多意外情況,例如一詞多義,是翻譯機沒有辦法應付的。”在高大玉看來,翻譯機最適合做的是說明性文章的翻譯,比較硬性,文學性和口語化程度較低,“人說出的話偏口語化,前後語序會根據演講者的習慣變化,譯員會根據聽到的單詞調整邏輯順序,翻譯機則不行,形式語言不可能代替自然語言。”

會務市場譯員地位很牢固

  在新技術不斷迭代的今天,每天都在舉行數不勝數的會議、論壇,其中很大一部分需要翻譯,當人工智能翻譯機出現後,也有一些會議屏幕上出現了同步翻譯,它們讓譯員們擔心嗎?

  主要承接金融和互聯網會議的會務服務商萬池文化創始人李超告訴《IT時報》記者,目前,很少有客戶在籌辦會議時提出要用翻譯機,基本上大家默認的都是用譯員,因為翻譯機的準確率、應變能力有待考量。“我們會向客戶推薦一些智能產品,但不是翻譯機,目前,翻譯機在會務用途上的佔比還是很低的。”李超說,和翻譯機相比,請譯員要付出的成本會高很多,一個資深譯員每小時至少2000元起,而一個翻譯機也就上千元,而且能夠重複使用,但大家還是傾向於譯員。這個“日進千金”的行業看似風光,實則是對譯員的“腦力壓榨”。

  記者採訪了幾家企業,他們均表示籌辦會議時沒有考慮過翻譯機,第一選擇還是譯員。“我們認為譯員比較靠譜,尤其是一些比較技術性的高端會議或者權威研討,而翻譯機還是旅遊自用比較好。”一家金融科技企業的相關人士表示。

  數據顯示,全球95%的國際高端會議都會採用同聲傳譯的方式進行。陸先生是人工智能語音公司凝趣科技的銷售人員,他告訴《IT時報》記者,他們的產品以個人用戶為主,在會務上推廣翻譯機的難度很大,“會務翻譯對於專業度的要求更高,因此,需要更長的開發週期和更高的研發成本,因此市場佔有率非常小,對於我們來說營銷難度也比較高。”

  在翻譯圈內,譯員們的心態相當樂觀,一致認為譯員的飯碗穩得很,絕不會被機器搶走。

人機耦合要技術也要倫理

  對於Bell Wang的爆料,一位曾在IEID現場參會的同事告訴記者,科大訊飛董事長劉慶峰在當天也有演講,且在演講中坦承,IEID的翻譯採用了人機耦合的方式,並不是機器離線翻譯。這點側面印證了科大訊飛的回應。事實上,現場劉慶峰明確表示,人機耦合是人工智能下一步的關鍵技術之一,“人機耦合將協助我們提高效率,也就是人工智能系統和人類行為協作結合大幅提高工作效率,這種方式不僅僅是技術發展趨勢,更是社會倫理發展的需求。”

  之所以如此強調人機耦合,是因為目前對於語音、語義的識別,人工智能領域內仍有很多難以解決的問題。專注於智能語音、語義理解等人工智能技術研究與應用的捷通華聲CTO李健告訴《IT時報》記者,翻譯機不是一個單一的翻譯系統,它至少融合了語音識別、機器翻譯以及語音合成三項技術的複雜系統,在輸入正確的情況下,有些翻譯確實已經媲美人類,但在語音識別方面,機器與人的差距明顯,“安靜環境下,一般語音識別可以達到90%以上的準確率,但在複雜環境下,特別是嘈雜多人的會議場景中,就算目前最頂尖的語音識別公司,識別率也只有70%-80%,這意味著,當機器翻譯時已經有20%~30%識別是錯誤的,而人類在複雜環境下的語音識別率至少在95%以上。”

  此外,單純從翻譯角度來講,目前基於深度學習的機器翻譯,對於訓練過的文本語料或者類似文本,或許可以翻譯得很好,但對於和訓練文本差異很大的文本,翻譯能力便會大幅度下降,機器不具備人類面對複雜情況的應變能力和麵對錯誤的糾錯聯想能力。

  李健表示,人機耦合是人和機器的優勢互補,達到1+1>2的效果,這點在速記行業已經得到很好驗證,但翻譯是個遠比速記複雜的系統工作,人工智能目前的學習能力還不夠。

  在科大訊飛兩次回應後,Bell Wang表示接受解釋,但同時他也建議,科大訊飛未來與譯員可能合作時,需要得到譯員的知情同意,並簽訂協議;需要使用譯員有知識產權的翻譯內容時,也需要得到許可。這其實是對新技術下的法律和倫理提出了新的要求。

  復旦大學哲學系教授徐英瑾認為,即使人機耦合也有倫理責任,涉及知識產權,“如果人機耦合中,人類並不知道自己的成果被利用,那這並不是真正的人機耦合。”


分享到:


相關文章: