語音識別產業穩定增長但企業面臨這些問題科技頭條網

語音識別產業穩定增長但企業面臨這些問題

【中國安防展覽網市場分析】通過利用機器學習技術進行自然語言深度理解，一直是各界關注的焦點。在人工智能各項領域中，自然語言處理擁有交互的自然性，是發展和商業化最早的技術，市場空間巨大。據中商產業研究院數據顯示，2017年中國智能語音產業規模達到105.7億元，與2016年相比增長70%。隨著智能語音應用產業拓展，市場需求增大，預計2018年中國智能語音產業規模將進一步增長，達到159.7億元。

當下，語音識別系統基於深度學習技術得在各個領域都逐漸起到作用。例如，在智能家居領域，智能音箱、智能電視等硬件本身具有入口價值，而找到語音入口是挖掘智能家居背後用戶價值的關鍵。企業可憑藉前端語音交互提供入口，後端互聯網提供服務的方式完成物聯網時代家居場景下商業模式轉換。另外，語音識別技術可以與其他自然語言處理技術如機器翻譯及語音合成技術相結合，構建更加複雜的應用。

不過，語音識別技術與產業的發展也存在一些問題，而要解決這些問題還有待於各方面共同努力。

口音問題首當其衝

儘管在機器學習的加持下，語音識別技術取得了巨大進步，但還不夠完善。其中，口音是語音識別技術的挑戰之一。華盛頓郵報最近進行的一項研究結果顯示，谷歌和亞馬遜研發的智能語音助手識別非美國本地口音準確率要比美國本地口音低30%。對此，語言學家和AI工程師紛紛表示，語音識別“地域歧視”的發生是由於缺乏多樣性的語音數據。也就是說，語音識別的口音問題是由於數據不足產生的，同等條件下，語料庫質量越高，語言模型越多種多樣，語音識別系統準確率越高。

“魯棒性“問題顯著

語音識別包含語音信號處理、靜音切除、聲學特徵提取、模式匹配等多個環節。由於語音信號具有多樣性和複雜性，系統只能在一定限制條件下才能獲得滿意效果。目前業內普遍宣稱的97%識別準確率，只在安靜室內的進場識別中才能實現。而在真實使用場景中，麥克風質量、說話者口音，以及環境噪音等因素，都會讓語音識別準確率大打折扣。此外，語音識別技術對於說話者的口誤，容錯度也有所欠缺。用戶往往會追求多樣性，包括使用過程中偶然狀況以及場景的多樣性，因此容錯技術尤為重要。

跨界競爭激烈商業模式欠缺

語音識別巨大的提升空間和市場空間，吸引了互聯網巨頭爭相加入。當前，以BAT為代表的互聯網巨頭已經入局，並先後推出自己的產品，以搶得行業入口先機。互聯網巨頭的現金流業務、場景、數據和用戶，其產品發展迭代由客戶需求驅動，以上條件正是傳統語音技術提供商所欠缺的。在語音識別領域，科達訊飛擁有多年技術積累，在某些前沿技術上處於領先水平，但其他公司在技術上並沒有本質差別，然而技術本身已不足以成為核心競爭力，大多數公司很難單純依賴技術建立成熟可靠的商業模式。

小結：語音識別技術給人們帶來了諸多便利，但距離技術成熟還有很長的一段路要走，要想做到更好的商業應用，就必須取得突破性進展，這也是未來語音識別技術發展方向。行業方面，只憑技術不足以讓企業建立成熟的商業模式，語音識別行業未來會如何發展？讓我們拭目以待。

(本文據砍柴網、中國經營報、品途商業評論、愛分析ifenxi、中商產業研究院、前瞻產業研究院編輯)

分享到:

閱讀更多 中國安防展覽網 的文章

關鍵字: 中商產業語音識別