語音識別遇上「貴人」 突破這一挑戰或迎新爆發

隨著人工智能的發展,語音識別技術迎來了新的突破,智能程度不斷提升、應用範圍愈發廣泛,市場前景備受看好。不過,口音和方言依然是語音識別普及之路上的“攔路虎”,不得不“除”。


語音識別遇上“貴人” 突破這一挑戰或迎新爆發

語音識別遇上“貴人” 突破這一挑戰或迎新爆發

說句話就能控制所有電器開關、聽音樂只需報出歌名……一直以來,人類都懷揣著與其他生物乃至機器進行語音交流的夢想,而現在,人工智能的飛速發展,正推動這一想象變為現實。如今,語音識別技術的廣泛應用,讓智能語音產品逐漸風靡全球。

語音識別發展突飛猛進

近年來,生物識別領域日趨升溫,語音識別技術取得顯著進步,開始加速從實驗室走向消費市場。眼下,語音助手、客服機器人、智能音箱等應用都用到了語音識別技術,家電、工業、金融、汽車電子等行業成為主要商業化場景。

在國內,語音識別技術的研發始於上世紀50年代,但是由於各方面條件限制,發展一直十分緩慢。到了80年代以後,隨著計算機等技術的發展與普及,國內外語音識別技術的研究都迎來了一股新熱潮。

進入新世紀,藉助深度學習技術突破帶動的人工智能領域崛起,以及大數據等信息技術的進步,包括語音識別在內的生物識別技術取得了突飛猛進的發展。不少科技公司、互聯網企業都將語音識別視為進軍人工智能的橋頭堡,進一步促進了語音識別市場的巨大擴張。

當前,國外語音識別技術發展以蘋果、亞馬遜等企業為尊;而在國內,科大訊飛、BAT三巨頭、搜狗、盛大等公司也在積極佈局語音識別技術,並研發、上市了一批相關產品。在這些公司以及資本市場的推動下,語音識別技術已然成為最為火熱的科技應用之一。

語音識別技術有得有失

在生物識別領域中,語音識別技術是應用最為成熟、使用最為便捷、商業化程度最高的一個細分領域之一。而語音識別技術之所以受到各大科技企業的關注和資本市場的青睞,就在於其所具有的一系列優勢:

一是語音採集較為方便,無需繁複配合、也幾乎不用動手,因而能夠吸引更多的消費者;二是語音識別技術應用成本較低,一般只需一個麥克風配合系統軟件,語音分析、辨別的算法複雜程度也較低;三是更符合消費者的期待與需求,較為適合智能家居等新興業態的發展趨勢。

當然,語音識別技術固然優勢多多,但是在當前階段依然存在著一些缺點,例如:每個人的聲音並不是一成不變,而是會隨著年齡的變化而變化;周邊的環境噪音對於語音的採集有一定干擾,距離因素也是採集過程中不能忽視的問題;另外,還有語音識別準確率及理解能力有待提升等不足都亟需予以重視,並逐步進行完善。

口音或方言是最大挑戰

無論是在國內還是國外,方言或是口音都是切實存在的,而這對於語音識別技術的應用和普及來說,無疑是最大挑戰。因為從經濟效益、商業化推廣等方面考慮,企業在研發階段,一般都是採用所在國最為主流的語言形式,但是在實際應用時,消費者的語言習慣卻並不一定符合預期設定。

一旦用戶有嚴重的口音,或是使用的方言不在識別範圍內,那麼就會導致語音識別系統反應遲鈍、識別率降低,甚至完全無法識別,最終影響消費者的使用體驗,從而造成市場口碑受到質疑。很顯然,如果不能解決這一挑戰,語音識別的普及就將被限定在目前的瓶頸之中。

因此,針對口音和方言展開的新一輪語音識別技術研發,或將成為新的競爭焦點。可以預見,隨著識別語種的愈發豐富及準確率進一步提升,語音識別技術的普及程度將會再度提高,相關的產品將更為公眾所接受,語音識別市場的爆發也就可期了。


分享到:


相關文章: