增加粵語、韓語支持,準確率提升10%,騰訊雲發佈專屬語音識別模型

允中 發自 凹非寺
量子位 編輯 | 公眾號 QbitAI

4月29日,騰訊雲正式發佈金融音視頻等多個領域專屬語音識別模型。最新發布的模型不僅識別準確率得到大幅提升,同時也增加了對粵語、韓語的支持,後面會陸續開放對上海話等方言以及日語、泰語、印尼語等國外語言的支持。

正式發佈金融行業專屬模型,字準率業界領先

據瞭解,語音識別在金融行業應用場景廣泛,但是實際場景下,很多用戶都是使用方言在和外呼、客服機器人交流,加上金融領域有著大量的專有句式和詞彙,市場上目前通用的語音識別模型存在識別不準的情況。

基於這些的痛點,騰訊雲AI團隊微信智聆聯合打造了金融行業專屬語音識別模型,這個模型的推出不僅能夠有效解決上述難題,還在識別的準確率上得到大幅提升。目前該模型已經在金融領域的智能外呼、智能客服、電話錄音質檢等多個場景落地。經客戶實測,字準率在業界處於領先水平。

增加粵語、韓語支持,準確率提升10%,騰訊雲發佈專屬語音識別模型

率先打造音視頻專屬語音識別模型,準確率提升10%

隨著互聯網直播浪潮的興起,如何利用智能語音技術快速識別用戶的音視頻內容、進行精準推薦和不健康內容過濾,已經成為各大直播和內容分享平臺在日益激烈的市場競爭中的核心競爭力。但由於音視頻背景環境複雜且屬於半遠場,需要有大量數據積累才能實現準確識別。

憑藉自身在音視頻領域數據的大量積累,騰訊雲在業界率先推出了音視頻領域專屬語音識別模型,目前已在多家音視頻領域直播平臺和電商直播平臺應用,經客戶實測,識別準確率提升近10%。

增加粵語、韓語支持,準確率提升10%,騰訊雲發佈專屬語音識別模型

語種豐富度進一步提升,騰訊雲語音識別加速落地

為滿足不同客戶群體需求,騰訊雲語音識別今年在語種豐富度上持續發力,聯合微信智聆、騰訊國際業務語音技術實驗室、騰訊民漢翻譯等多個人工智能實驗室,在原有常見語種基礎上,開放了韓語、粵語的識別能力,後面會陸續開放對上海話等方言以及日語、泰語、印尼語等國外語言的語音識別能力。經過長期的打磨訓練和效果調優,目前騰訊雲語音識別各語種已廣泛應用於會議記錄轉寫、視頻字幕、電話錄音質檢等業務場景。

增加粵語、韓語支持,準確率提升10%,騰訊雲發佈專屬語音識別模型

實際上,騰訊雲憑藉多年在智能語音領域的耕耘,已經收穫眾多權威機構的認可。在Gartner今年首次正式發佈的《Magic Quadrant for Cloud AI Developer Services》研究報告中,騰訊雲成為中國唯一入選Gartner雲AI開發者服務魔力象限的雲廠商。

騰訊雲AI語音產品負責人周超表示:“騰訊雲AI語音團隊未來仍將繼續打磨技術,提供業界最具性價比的智能語音產品,推動智能語音在產業互聯網的廣泛落地。用更前沿的技術、更極致的產品體驗,幫助合作伙伴和客戶打造高效的專屬解決方案,助力各行各業的數字化和智能化轉型。”


分享到:


相關文章: