科大訊飛:物聯網風口不知不覺的形成,努力撞上了機遇

科大訊飛:物聯網風口不知不覺的形成,努力撞上了機遇

聯動原素:“當前語音交互技術普遍已經達到怎樣的程度呢?”

盧:“大家普遍的技術情況這不太清楚,但目前智能音箱的主要玩家,他在有關語音技術層面上,3到5米這段遠距離識別率普遍都會達到97%以上,我們提的專業術語是稱為遠場識別,它用的這個技術模型和阿爾法狗戰勝李世石的那套模型是一樣的,深層神經網絡,大家都是用同樣的計算模型,看誰餵養的數據多,誰模型修正出來就更好,用戶體驗效果就會更好,用的人就會更多,良性循環。而後還有很多其他能力,比如我說了一段話能代表什麼意思,那就是語義分析,那就是後面大家在做的事情,但前面已經能夠做到蠻精準的了。”

聯動原素:“和現有的交互方式相比,語音交互會在物聯網發展中起到什麼樣的作用呢?”

盧:“手機的交互形式,像按鍵、觸屏這些已經漸漸變成我們的使用負擔,每天都需要查看各種信息、APP,不斷的需要雙手操作,甚至現在人們都離不開手機,因此大家會呼喚全新的交互方式出現,而語音交互是最能夠表現人們主觀意圖,是人類特有的從小學習的交互方式,而這項技術想要商用也是挺難的,像訊飛做這部分十幾年,我們為廣大開發者提供服務,在這過程中有許多特殊的需要定製化的服務,都需要從基礎數據研究開始。”

科大訊飛:物聯網風口不知不覺的形成,努力撞上了機遇

聯動原素:“在這些定製化的需求中,會有哪幾個經常被提及?能提幾個實際例子嗎?”

盧:“比如說定製喚醒詞,不同品牌和產品都會需要定製一個他們自己的喚醒詞,這是需要一個聲場修正,我們高識別率的聲場修正需要兩個月的時間,聲場修正後喚醒詞的喚醒率就比較高,達到大概95%以上,你叫它就會答應,這就會帶來用戶體驗上的提升。還有就是不同領域的數據收入,拿海底撈為例,我們有四十多個同事修正了一年半才做完了海底撈80%的菜單名詞,這就是為什麼大家不太瞭解訊飛的原因,我們一直都在做基礎數據研究,訊飛能站在這個風口上和大家聊天絕非偶然,我們要做的這些事情也實屬必然,我們經常自嘲努力撞上了機遇。”

科大訊飛:物聯網風口不知不覺的形成,努力撞上了機遇

聯動原素:“那這些定製化的案列最後會逐漸形成標準化的產品嗎?畢竟只有標準化後價格會降低。”

盧:“我們也試圖在做一個標準化的產品,這就是訊飛為什麼會做一個魔飛麥克風陣列,其實很多人都會問訊飛是支持別人做智能音箱的,為什麼自己開始做產品了,這是因為我們支持了大量的開發者之後,雙方團隊都付出了巨大的努力,但因為某些設定無法將體驗效果最大化,就像產品形態不一定是一個音箱、機器人,也有可能就是一個拾音單元,這個拾音單元可以在一個360度的環境當中,自由的、準確的拾音。我們在做的時候,就是抱著想告訴大家語音識別技術的這類產品應該怎麼做的心態,還有就是我們也想知道在硬件和軟件進行整合部署的時候,過程中到底會有哪些坑。

其實在很早很早之前許多技術就已經不是問題了,真正是需要讓用戶有用的好的產品和服務,硬推技術是不行的,你如果有好的技術,那就運用到實地的場景當中去,不要再說你的技術有多好多,找到剛需的應用場景遠勝於我們去談論技術。”


分享到:


相關文章: