微軟機器翻譯達到人類水平 科大訊飛搜狗承認差距吧!

微軟機器翻譯達到人類水平 科大訊飛搜狗承認差距吧!

不仔細看,會覺得這個研究沒啥水平呀,國內企業水平都比微軟高。

國內的科大訊飛、搜狗和網易都已經推出相關產品,科大訊飛號稱翻譯可以達到英語6級水平;搜狗旅行翻譯寶首日預售量超3000+,搜狗機器翻譯技術在2017年5月的國際學術賽事WMT (Workshop on Machine Translation) 中榮獲中譯英機器翻譯冠軍;網易有道翻譯蛋2.0內置自主研發的神經網絡翻譯技術。

仔細研究後,就會發現國內相關企業機器翻譯技術和微軟機器翻譯技術的差距還是很大。具體有多大,比較容易理解的比喻,國內企業翻譯水平是業餘的,微軟翻譯水平正在向世界上頂級專業翻譯家邁進,並取得實質性突破。

微軟的專業水準

微軟研究團隊稱,研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上達到了人類水平,這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統。

微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,“在機器翻譯方面達到與人類相同的水平是所有人的夢想,我們沒有想到這麼快就能實現。

“由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的算法和系統去應對。”微軟亞洲研究院副院長、自然語言計算組負責人周明表示,機器翻譯是另一種類型的人工智能任務,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。那是因為表達同一個句子的“正確的”方法不止一種。

微軟稱,雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。

微軟亞洲研究院副院長、機器學習組負責人劉鐵巖認為,我們不知道哪一天機器翻譯系統才能在翻譯任何語言、任何類型的文本時,都能在“信、達、雅”等多個維度上達到專業翻譯人員的水準。

即使在這次測試中被雙語語言顧問認為達到人類水平,但微軟清晰認識到,這只是一個開端,離完全解決機器翻譯的問題還有很長一段距離,並且也沒有解決的時間表。

機器翻譯是計算語言學的一個分支,是人工智能的終極目標之一。對於此次成果,微軟的表述具有非常專業水準,誠惶誠恐的態度。

科大訊飛、搜狗:只能滿足日常溝通

國內企業中,科大訊飛、網易和搜狗在機器翻譯中處於領先地位,在市場已經推出相關產品,並且在快速迭代。

科大訊飛的第一代翻譯機產品訊飛曉譯翻譯機銷量已經達到20萬臺。在嘈雜的交流環境和信號不佳的情況保持專業翻譯狀態。基於訊飛大數據引擎和豐富的預料資源庫,更懂中國用戶的口語化的表達以及快速響應。表達在自然度和專業度上媲美真人,達到英語6級水平以上。

科大訊飛董事長劉慶峰稱,人工智能正在深入地進入日常生活,而中國在人工智能的源頭創新上,在很多方面已經跟全世界並跑甚至部分領域領跑。

搜狗旅行翻譯寶首日預售量超3000+,搜狗機器翻譯技術還獲過世界中譯英機器翻譯冠軍。其對話翻譯功能不僅能夠將語音識別為文字,還可以將其翻譯為目標語言並以語音方式播報譯文。

搜狗稱,從整體翻譯效果而言,搜狗翻譯寶在中英互譯上表現不錯,甚至語法上也並沒有什麼不妥,雙方交流基本不存在障礙。但想要機器翻譯達到“信達雅”的水平,這在現階段來說還難以實現,對於出境遊的遊客來說,更沒有必要。讓交流的雙方都能迅速明白對方想要表達的準確意思,基本保證語法結構完整正確即可。

從科大訊飛、搜狗對自己的商品判斷上可以看出,他們目前的目標是滿足日常生活需求方面,也達到這個要求,對於專業需求還處在認識階段。

機器翻譯有多難?

機器翻譯是利用計算機將一種自然語言轉換為另一種自然語言。它是人工智能的終極目標之一。

它起源於20 世紀三四十年代。1954 年,美國喬治敦大學在 IBM 公司協同下,用 IBM-701計算機首次完成了英俄機器翻譯試驗,向公眾和科學界展示了機器翻譯的可行性,從而拉開了機器翻譯研究的序幕。

1966年,美國科學院語言自動處理諮詢委員會,經過兩年的綜合調查分析和測試,全面否定了機器翻譯的可行性,並建議停止對機器翻譯項目的資金支持。

不過,隨著深度學習算法的演變,基於人工神經網絡的機器翻譯技術的出現,現在的機器翻譯的譯文更加流暢、更加符合語法規範,更加容易理解。相比之前的翻譯技術,質量有“躍進式”的提升。


分享到:


相關文章: