蘋果 Siri 被 谷歌 Assistant 甩了十條華爾街

蘋果 Siri 被 谷歌 Assistant 甩了十條華爾街

GoogleI/O發佈會上,用戶對Google Assistant說想剪頭髮。

Google Assistant先撥通了理髮店的電話(這個電話號碼應該是用戶提前存好的),進行電話預約剪髮。對話如下:

蘋果 Siri 被 谷歌 Assistant 甩了十條華爾街

這一句“嗯哼”,震驚全場。在人與人的溝通中,想要抓準“嗯哼”的含義,是十分吃力的。當看到Google Assistant巧妙運用“嗯哼”二詞的時候,我的內心是澎湃的,因為覺得自己很幸運,生活在這個科技時代。

相比之下,Siri這個傲嬌貨:

蘋果 Siri 被 谷歌 Assistant 甩了十條華爾街

Siri,我......好像聽到什麼東西碎了!

這也是一項無可厚非的黑科技,Assistant能像你看到的那麼“善解人意”,因為使用了稱之為

“Duplex”的技術

蘋果 Siri 被 谷歌 Assistant 甩了十條華爾街

據谷歌介紹,這項技術是由紐約、特拉維夫和山景城的谷歌工程師和產品設計師聯合開發,該技術可實現一小部分人可以完成預訂餐廳、查看假日時間等通常通過電話進行的活動。所有這些交互都發生在後端——谷歌數字助理Assistant和餐廳之間。

Assistant可以完成一輪對話,具備了理解上下文的能力,特別是她的聲音(現場選用的是女性聲音),給人親切自然的感覺,跟Siri發音完全不同,Siri聲音是挺僵硬的。

另外,Assistant是可以用六種聲音說話的,任你挑。

Assistant如此“善解人意”的原因,是因為“Duplex”解決了自然對話中遇到的很多難題:自然語言難以理解,人類的自然行為很難建模,人類對延遲的耐受性很低所以需要高處理速度,以及生成聽起來自然的語音,其中還要適當地夾雜一些語氣詞。

在技術上,還使用了一個級聯 TTS 引擎和一個生成式 TTS 引擎(其中使用了 Tacotron和WaveNet),根據不同的情境控制語音的語調,這也是Assistant語音能夠那麼親切自然的主要原因,一系列的語氣詞,也是通過這項技術才得以實現的,如你聽的“嗯哼”、“uh”等語氣詞。當級聯TTS需要組合變化很大的語音單元,或者需要增加生成的停頓時,語氣詞就會被添加到生成的語音中,這就讓這個系統可以以一種自然的方式向對方示意“是的我聽著呢”或者“我還在考慮”(人類說話的時候就經常在思考的同時發出一些語氣詞)。谷歌的用戶調查也確認了人類覺得帶有語氣詞的對話更熟悉、更自然。

這是一項完美的技術?非也!畢竟,到現在為止,並沒有完美技術的說法不是嗎

?

雖然目前Google Assistant在語言運用上具備了一定的優勢,但是這並不代表Assistant能夠駕馭任何場合。就算是成功人士,想要輕鬆應對各種場合,也十分吃力的,更何況智能機器。谷歌官方也曾表示:“現在的技術並沒有達到只通過與開發人員對話就學會如何像人一樣說話的水平,為了獲得高精度,我們在匿名電話的會話數據庫上對Duplex的RNN進行了訓練。”

技術的背後,總是辛酸的。為了得到更加精準的數據,谷歌用匿名電話的方式,記錄下了客戶們電話中的通話記錄。這樣的做法備受爭議,因為這直接關係到個人數據隱私和推進技術便利的矛盾問題。畢竟,想要得到精準數據,需要從現實生活中來收集。但這樣的做法又關乎到大眾的隱私問題。

除此之外,Duplex AI的出現暴露了一些安全風險問題,舉個栗子,如何防止某人非法利用公眾人物的錄音來訓練人工智能,並生成偽造的音頻?此外,我們還需要防止偽造視頻的攻擊,鑑於人們已經能夠偽造圖像和視頻(甚至是不健康的),並能夠合併一層虛假音頻,谷歌和Facebook的內容審核工作將面臨著更大的困難。

不管怎樣,AI的發展前景是樂觀的,大眾對谷歌智能AI的發展也是很期待,GoogleAssistant帶給我們的驚喜也很大。隨著國家相關政策的發佈,黑科技的使用會迴歸到科技的本真,造福全人類。

蘋果 Siri 被 谷歌 Assistant 甩了十條華爾街


分享到:


相關文章: