科大訊飛的擦邊球:人工智慧並不是「人工」+「智能」

9月20日,用戶名為“Bell Wang” 的王同學在某知識問答平臺上發表《科大訊飛,你的AI同傳操(qi)作(zha)能更風騷一點嗎》一文,吐槽了自己“被 AI”的經歷。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

這位王同學在擔任某次國際會議同聲傳譯的過程中,發現自己及同伴的翻譯成果在不知情的情況下被科大訊飛以文字形式上傳在屏幕上,還使用電子音播放翻譯文本,在某平臺進行直播。

王同學“忍不了”,發佈了自己用手機錄下的視頻證據。事情迅速發酵,科大訊飛於21日下午發表回應:個別同傳譯員對於科大訊飛存在誤解,我們認為僅僅是對會議服務方面的分工溝通了解不清。

有網友調侃:沒被發現就是 AI,被發現了就是誤會。

科大訊飛是否存在主觀“欺詐”難以判斷,但細數一下,這些說不清道不明的“人工”冒充“智能”案例,還真不少。

誤會還是造假?

科大訊飛可能自己也沒想到,找的同聲傳譯工作人員居然在知乎上有個固定專欄。

這讓尋找中國創客想起了幾年前的一個段子,某互聯網公司在招聘時明確表示:有公眾號的不要。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

“Bell Wang”網帖截圖。

事情的經過是這樣的。據王同學在網帖中描述,9月20日,他來到2018創新與新興產業發展國際會議(IEID)的高端裝備技術與產業分會做現場同傳。

當看到會場大屏幕兩側寫著“訊飛聽見”四個字的時候,他就有點心煩:自己不會也要遇上“被 AI” 的事了吧?

會議開始以後,現場屏幕上的實時字幕分為兩部分,右邊是對外文演講嘉賓的英文實錄,左邊是中文翻譯結果。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

字幕分為英文、中文兩部分。

王同學發現,當日本籍嘉賓上臺演講時,其帶有口音的英語並不能被機器很好識別,右側的屏幕上滿是發音差不多但不能構成實際意義的單詞。但在左側,屏幕上卻是準確的中文翻譯。

為什麼明明識別錯了英文原文,卻能給出準確的中文答案?王同學越看越覺得,翻譯部分是直接轉譯的自己同伴人工翻譯的內容。

尤其當搭檔在英譯漢時說出“步態”一次,屏幕上卻錯誤識別為“不太”;王同學自己再漢譯英時說了“Davos Forum”(達沃斯論壇),屏幕上卻出現發音差不多的“Devils Forum”(魔鬼的論壇)後,王同學越加確信,現場大屏上的字幕並非科大訊飛機器翻譯,而是在自己和同伴翻譯內容的基礎上,進行了“語音轉文字”。

當天下午的發現,讓王同學更加火大。

他在一個名為“知領直播”的平臺上看到,該平臺聲稱“引入科大訊飛智能語音技術”“智能翻譯”,但是,對當天的會議進行同傳直播的翻譯文本是他和同伴的翻譯成果,而且播放的語音是合成的機械音。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

知領直播頁面截圖。

“所謂的智能翻譯,就是按照文本讀,而且是不管語義群分割的,文字顯示也並不是語義群同時顯示或鎖定的,那就很顯然是在識別語音,而不是從根據原文在翻譯。”王同學在網文中稱,這是“赤裸裸的欺騙”。

21日下午7時許,科大訊飛作出回應:考慮到專業技術背景及口音等原因,這次2018創新與新興產業發展國際會議,科大訊飛只提供會議轉寫上屏服務,並未提供翻譯服務。至於轉寫譯員翻譯結果並在會場大屏呈現、在直播中合成識別結果,皆是“應主辦方要求”。

科大訊飛表示,“個別同傳譯員對於科大訊飛的誤解,我們認為僅僅是對會議服務方面的分工溝通了解不清”。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

科大訊飛回應全文。

科大訊飛方面再次強調其提出的“人機耦合”概念:科大訊飛發展AI無意於替代任何職業和崗位,我們也多次強調“人機耦合”共同進步的立場和產品追求。

對於“人機耦合”概念,科大訊飛方面給出的解釋是:由機器提供語音轉寫和翻譯結果給同傳參考,輔助同傳降低工作強度並提升效率。

“碰瓷”的AI公司

科大訊飛蓄意造假?

似乎也不是。

就在幾天前的9月17日,科大訊飛董事長劉慶峰還在世界人工智能大會開幕式上特意強調:凡是大家看到翻譯屏幕上兩個語種同時出現的,就是機器翻譯的;翻譯屏幕上只有一個語種的,就是人機耦合的。

劉慶峰稱:“世界機器人大會的十幾個嘉賓演講中,有人工同傳的語音轉寫也有機器全自動轉寫。除了三個是由人工同傳的語音轉寫,探索人機耦合模式的,其餘的全部是機器全自動轉寫的。”

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

知乎某網友將科大訊飛的態度概括為“三不”政策:不主動,不拒絕,不負責。對於大眾將精準的翻譯結果誤解為科大訊飛智能翻譯所為,訊飛方面似乎也是樂見其成的。畢竟這種誤解可以帶來實際的好處。

有智能語義領域創業者告訴尋找中國創客,目前國內包括科大訊飛、搜狗、百度、騰訊在內的幾大研究智能語音翻譯的公司,在技術水平方面並沒有明顯差異,這個時候,誰在大眾眼中的準確度更高,誰就可能取得先機。

科大訊飛技術上可以做到AI同傳嗎?

似乎也不行。

就連科大訊飛董秘江濤也在這次回應中承認:“訊飛從沒講過AI同傳的概念,始終強調是人機耦合的模式。”

有認證為阿里雲的技術人員在網上科普AI同傳的幾個技術環節:

1.ASR(即自動語音識別)識別語音流(易出現誤差,依賴於方言/語種模型與其強化學習程度);

2。同步進行NLP自然語言分析(斷句,分詞等)形成文本(普通出現誤差);

3。翻譯文本(小可能出現誤差);

4。翻譯後的語音內容展示字幕或者TTS(Text To Speech,將文本轉換成語音)進行語音播報(小可能出現誤差)。

在此次事件中,科大訊飛做的只有最後一個環節:將翻譯後的語音內容上傳到屏幕,或者合成為電子音。雖然這一過程也涉及識別同傳人員的語音,但因為同傳人員發音較為標準,這一過程誤識別的概率大大減小(但仍然出現了,比如上文提到的將“步態”識別為“不太”)。

智能語音公司Rokid創始人Misa告訴尋找中國創客,人工智能在自然語言分析、文本翻譯、TTS 方面的問題並不大。

但由於存在口語習慣(比如多語言混合、語法省略)、口音、現場環境、專業術語等問題,人工智能在語音識別方面還存在一些誤差,而且這一現狀目前還難以解決,運用統計方法難以覆蓋所有可能。“人機協作的概念是沒錯的,只是一開始要說清楚,別忽悠大家。”

“人工”冒充“智能”那些事

細數起來,以“人工”冒充“智能”的做法並不鮮見。

不知道還有多少人記得2015年橫空出世的交通銀行客服機器人“嬌嬌”。

這臺機器人憑藉軟萌的聲音、流暢的反應、高度人性化的對答,讓研究人工智能和機器人的公司瞠目結舌,還出現在當年的CES上。

就連谷歌在2018 I/O大會上展示的能打電話預約理髮的語音助手,跟當時的嬌嬌相比都略遜一籌。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

交通銀行客服機器人嬌嬌。

嬌嬌的語音識別、面部識別和語音合成到底是用的哪家技術,居然比谷歌還超前3年?

經過一圈刨根問底,攝像頭+變聲器+人工客服操縱,就是這臺智能語音機器人的全部。

如果你不記得嬌嬌,那你一定還記得被沙特阿拉伯授予公民身份的機器人索菲亞。

當索菲亞的發明者戴維·漢森問她:“你想毀滅人類嗎?”她回答:“我將會毀滅人類。”

在挑逗起人們對人工智能的恐慌後,索菲亞又語帶嘲諷:“你是看了太多馬斯克的話,還是好萊塢電影?別擔心,人不犯我,我不犯人。”

憑藉機智的回答和流暢的反應,索菲亞登上許多知名電視節目,包括《早安英國》、美國脫口秀《吉米今夜秀》、CBS 新聞臺《60 Minutes》甚至湖南衛視的《我是未來》。

終於,人工智能界大牛YannLeCun忍不住開撕:索菲亞之於人工智能,就像魔術之於魔法。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

機器人索菲亞。

2017年6月,在瑞士舉行的“人工智能造福全球人類峰會”上,央視記者和索菲亞也進行過幾輪對話。

在回答記者提前提交給大會的3個問題時,索菲亞的表現一如既往地優秀,但當遇到記者現場隨機提出的問題時,她的對話水平明顯下降。工作人員明確告訴記者:對於特殊問題,在現場回答前都已經提前進行了程序設置。

業內人士也普遍覺得索菲亞違反常識。一個事實是,最先進的人機對話系統也無法達到索菲亞這樣語帶嘲諷又對答如流,這是NLP領域研究者的共識。而索菲亞展示出的主動引導話題的社交能力,被研究者們認定為提前編寫好的對話。

科大讯飞的擦边球:人工智能并不是“人工”+“智能”

除了在各種晚會、智力問答節目上出現的各式抖機靈的機器人,就連自動駕駛領域也有類似情況出現。

據相關業內人士透露,某些自動駕駛公司在進行試乘體驗活動時,會提前根據試駕路段的路況編寫好程序,而非讓這輛根據傳感器數據自主決策、控制。

前述智能語義領域創業者對這一狀況已經司空見慣:“科大訊飛起碼還是有真技術的,只是翻譯結果未必非常準確。很多創業公司連相關技術都不掌握就做假demo,目的無非是 to VC(風險投資機構)、to 媒體或者to 政府。”


分享到:


相關文章: