手機語音助手已發展多年,隨著近幾年機器學習的發展,語音助手在語音識別、語義理解等方面已經有了很大的發展。Siri、小娜這些我們都已經聽過很多了,但在國內,手機端智能助手有哪些呢?它們現在的表現如何呢?我們以十一假期五個場景來做一番比較。
注:為了方便比較,四家手機智能助手皆為客戶端APP
Part 1 界 面
可以看出以上四家在界面設計上,出門問問使用酷黑色,整體看起來比較炫酷。另外幾家(度秘、靈犀、深思考)則使用白色或者淺灰色作為背景。
Part 2 老友相聚要擼串
情景:十一假期是一次難得的多年老友聚會擼串的機會,讓我們試試四家助手怎麼帶你去擼串~
三輪對話:
>> 附近有什麼好吃的?(意圖識別)
>> (飯店名)怎麼樣?(個性化推薦)
>> 給我導航一下
出門問問在第一輪中識別出用戶的意圖,並接入第三方軟件“大眾點評”的結果;對於隨後的問題出門問問給出的答案就完全不相關了,它們就沒有沒有對上下文的理解和記憶了,有可能是在美食這個垂直領域他們沒有采用多輪對話的技術。
靈犀也一樣:
度秘會把結果引導到另一個頁面(度秘美食),不過這並不影響它接下來的兩輪對話。
深思考則完全在自己的平臺上展示結果,並在隨後的兩輪對話中表現良好:
Part 3 度 假 出 行
情景:八天長假,難得家人團聚,一起收拾行李,出門旅行~
兩輪對話
>> 幫我定個明天早上去上海的機票(意圖識別)
>> 追問(多輪對話)
度秘接入攜程網
靈犀接入攜程網。我們可以看到靈犀給出的結果會按照第三方的推薦,例如排在第一的是一條鄰近路線和一張晚上8點多的低價票,而不是早上的機票。
出門問問同樣接入攜程網,但相比前兩者結果卻要好很多。
深思考在自己的平臺上完成整個訂票的交易,秒殺兩輪對話。
多輪對話
>> 幫我查一下後天從上海到北京的高鐵
>> ......
其他幾個平臺和訂機票一樣,都只進行到第一步便接入第三方平臺。而深思考可以完成高達七輪的對話。
Part 4 約 ?
情景:假期來了,手挽女神,自然要約約約啦!你懂得~
不限輪數
>> 幫我在中關村附近訂個酒店
>> 大概200到300元之間
>> ……
度秘、靈犀沿襲它們一貫特點:一旦接入第三方服務,就不再具備上下文理解能力了。
深思考也和前面一樣,在自己的平臺上通過不可思議的八輪對話,完成了整個訂房交易,並啟動導航。
值得注意的是,出門問問在這裡也表現出了多輪對話的能力。所以我們可以猜測出門問問也具有一定的多輪對話技術,但在搜索結果中難以應用多輪對話。
Part 5 情 感 計 算
情景:一人的夜總是最寂寞,壓著馬路,賞著秋月~
單輪對話
>> 我不順心,有點鬱悶,很鬱悶
這時出門問問會講一個笑話
深思考會先為你放首歌舒緩一下心情,再利用機器學習根據以往聽歌的愛好,推薦放鬆心情的歌,有點溫暖小貼心哦!
度秘和靈犀的回答就很無厘頭了
這些和小冰比起來顯得真的很雞肋,還是去調戲小冰吧。
Part 6 跨 APP 指令
情景:沒有發神經,就是想測試一下~
在這方面,度秘和靈犀表現很好。
深思考:失敗。
通過多次試驗發現,度秘、靈犀、問問都能夠撥打電話、發送短信,靈犀甚至還能打開相機,但另外幾家做不到這些。而深思考在涉及第三方軟件時毫無招架之力,僅在某些特定場景下可以調用打電話功能,比如“打電話給這家餐廳”。
可以看出,國內這幾家智能手機助手在跨APP指令方面,目前還是處於基礎階段。不過話說,誰會閒著沒事用一個APP去打開另外一個APP呢,除了小編!
Part 7 綜 述
從上面簡單的測試中可以看出四家手機智能助手各有千秋。
度秘和靈犀在系統以及集成度上做得相對較好,但看起來並不能進行多輪交互。出門問問無論在界面還是用戶體驗上都很不錯,也能進行簡單的多輪交互,整體感覺比較流暢。
深思考則在多輪交互方面做得非常漂亮,除此之外,它的另一個特點就是,幾乎所有的任務都會在自己app內一站式完成。總體來說,國內的智能語音助手在某些垂直細分領域遠超Siri等大牌語音助手(你可以把上面的評測對著Siri說一遍),但如果想要做到全面超越,依然還有很長的路要走。
閱讀更多 人工智能學家 的文章