06.04 語音技術誰家強,互聯網巨頭告訴你

語音技術誰家強,互聯網巨頭告訴你

比你更有錢、有技術、有資源、有市場、有人才,這就是現在的傳統語音技術公司面對互聯網巨頭競爭時的困境。

《汽車商業評論》記者 錢亞光

在當下的汽車業,語音基於其交互的自然性,被認為是未來人與車交互的主要入口路徑,以致業內普遍認為,“以語音為入口連接各種服務,構建車聯網生態”。

作為人工智能應用最成熟的技術之一,目前語音交互的核心環節也取得重大突破,語音識別環節突破了單點能力,從遠場識別,到語音分析和語義理解有了重大突破,呈現一種整體的交互方案。

不過,雖然大多數新車可以用語音開啟車載導航,設置行車路線,進行信息查詢,實現一些諸如空調、天窗等功能控制,但距離“以語音為入口連接各種服務,構建車聯網生態”的理想仍然較遠。

語音技術誰家強,互聯網巨頭告訴你

比如,在真實使用場景中,距離麥克風的遠近、交談時是否說方言,以及噪音、斷句等,都會讓語音識別的準確率大打折扣。

目前,業內普遍宣稱的97%識別準確率,更多的是人工測評結果,只在安靜室內的近場識別中才能實現。

更難的是,在交互的過程中,機器對於語音的理解,以及人機多人的交互對話,都存在問題。

人在說話時,往往會一詞多義,人會基於已有知識儲備和上下文環境進行理解,但現在的智能語音技術很難做到。

語音技術誰家強,互聯網巨頭告訴你

它對於說話者的口誤,容錯做得也不理想。用戶往往會追求多樣性,包括使用過程中偶然狀況的多樣性以及場景的多樣性等,因此容錯技術顯得尤為重要。

顯然,目前智能語音的發展遠未成熟,有著巨大的提升空間。再加上智能語音技術的巨大市場空間,互聯網巨頭已經爭相進入這一市場。

在中國,《汽車商業評論》注意到,百度、阿里巴巴、騰訊等諸多互聯網巨頭已經入局,並先後推出自己的產品,以搶得智能語音信息流入口先機。

語音技術誰家強,互聯網巨頭告訴你

隨著互聯網巨頭進軍智能語音領域,轉為全棧的語音技術創業公司,類似科大訊飛這樣的傳統智能語音技術巨頭的不可替代性也受到了不可忽視的打擊,更多這幾年新興的語音技術公司更是命運叵測。

互聯網巨頭雖然入場較晚,但憑藉著自有的雄厚資金和互聯網行業的大數據資源,他們發展自家的人工智能技術,迅速搶佔智能語音市場。

那麼,在未來的車聯網智能語音領域,誰將是主宰?

以百度為例,這家以搜索起家的互聯網巨頭,正在轉型為人工智能公司,並在通用技術、算法和平臺開發等領域發展,對話式AI操作系統百度DuerOS是其語音技術的重要平臺。

從2010年年開始百度就將智能語音作為戰略方向,如今,百度語音技術已經形成從模型算法、開發組件、場景覆蓋到行業應用的全鏈條。

語音技術誰家強,互聯網巨頭告訴你

2018年4月,北京車展上,博泰聯合開發搭載百度DuerOS的人工智能車機系統——東風風神WindLink3.0,在學習能力、計算能力和數據儲備上極具優勢,可極快聽清並真正聽懂人複雜語言,並秒級提供用戶所需答案。

比如,只要用正常甚至很快的語速說“好熱”“幫我看看附近帶泳池和WIFI的酒店”,系統就可以自動調節空調溫度、搜索出對應的結果,直接完成房間的預定,然後再導航到該酒店。

作為人工智能時代開放賦能的生態系統,DuerOS通過自身三大核心技術“喚醒”你的車:讓車聽清你在說什麼;讓車聽懂你想要什麼;讓車滿足你所提出的需求。

互聯網巨頭之所以能夠在AI語音上發展如此迅速,跟其大多是市場驅動的企業有關,明顯的特點就是他們有自己更好的產業落地環境,關注客戶,注重長期,由客戶需要驅動產品發展。

這正是傳統語音技術提供商所欠缺的。

比如百度擁有百度搜索,騰訊擁有微信、QQ及遊戲等龐大的產業落地環境,而阿里擁有淘寶及其線下的零售店,所以在AI語音產業落地上,互聯網巨頭會更有優勢。

而像科大訊飛這樣傳統語音技術提供商是由技術推動業務發展的企業,產品開發期間並不知道最終用戶是否會使用,相對市場驅動來說具有較高風險。

它以B to B模式和B to G模式為主,對全產業提供語音技術,主要聚集在教育、司法、醫療、智慧城市等行業領域佈局。2017年這些業務佔公司營收的比例約為80%。

雖然車聯網也是科大訊飛發展方向之一,也取得了不小的成就,但未來要往前再走一步並不容易,需要它在語義識別方面的人工智能技術方面進一步突破。

人工智能本身是高度的資本密集型、知識密集型產業和數據密集型企業,投入金額巨大,沒有足夠的數據、人員和資金,根本無法在核心賽道上堅持下來。

語音技術誰家強,互聯網巨頭告訴你

百度宣佈語音技術全系列永久免費,包括近場語音識別、長語音識別、遠場語音識別、語音合成、語音喚醒等百度語音核心功能等,並且支持IOS、Android等多平臺接入。

這些百度人工智能開放平臺的核心基礎技術,都是需要長年的純投入,不計回報,只有擁有其他大規模的獲利途徑,才能支撐這樣的研發投入和人才梯隊。

百度選擇了將平臺級技術開放出來之後,令整個行業都在加速,同時也終結了國內基礎技術的重複投入。

類似於開源軟件,開放是一種戰略選擇,是領先者對於後來者的規範制定。行業後來者,必須與百度接軌,融入百度生態。

語音技術誰家強,互聯網巨頭告訴你

隨著互聯網巨頭在智能語音上面大範圍佈局,如今在智能語音技術上它們都是使用自家的語音產品——阿里用自己的阿里YunOS語音識別技術,騰訊的騰訊雲也有自己的東西。

大客戶轉身成為競爭對手,而且他們有自身的現金流業務、場景、數據和用戶,他們會更有競爭優勢,最終可能會在車聯網語音領域形成寡頭格局。如此,傳統智能語音技術企業可能被收編,也可能被消滅。

正是因為擔心這樣的結局發生,《汽車商業評論》注意到,2017年11月,科大訊飛比較在意地宣傳騰訊的小Q機器人採用的是自己的語音識別技術。

或許在這方面,騰訊目前還並不強大,但趨勢已經十分明顯。5月23日,騰訊董事會主席兼CEO馬化騰公開表示,為了抓住萬物互聯時代的機遇,騰訊近年來在語音識別、語義理解、計算機視覺等AI技術上投入大量的精力。


分享到:


相關文章: