國內語音技術哪家強?百度阿里科大訊飛各有千秋

大家好,我是阿邁達,有趣的互聯網軟件工程師。專業角度分析技術原理,幽默的態度解讀科技互聯網資訊。



語音技術是人工智能(AI)的一個重要分支,包括自動語音識別技術(ASR)和語音合成技術(TTS)。語音識別就是可以讓計算機識別人類語音中的詞彙,通過識別到詞彙來進行後續的業務場景處理。語音識別是涉及心理學、生理學、聲學、語言學、信息理論、信號處理、計算機科學、模式識別等多個學科的交叉學科,具有廣闊的應用前景,如語音檢索、自動客戶服務、命令控制、機器自動翻譯等。而語音合成技術是將外部輸入的文字轉成人類可以聽懂的語音技術。它涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術,是中文信息處理領域的一項前沿技術,解決的主要問題就是如何將文字信息轉化為可聽的聲音信息,應用場景包括語音導航、有聲讀物、機器人、語音助手、自動新聞播報等場景。


國內語音技術哪家強?百度阿里科大訊飛各有千秋

隨著人工智能技術的發展,語音技術目前發展的也比較成熟,國內很多雲廠商都提供了語音技術的服務SDK,企業和個人開發者可以根據雲廠商提供的語音技術SDK開發自己的應用場景。開發者更多關注的是應用場景的創新性,而無需關注語音技術底層的實現邏輯,這也是雲廠商提供給開發者的一大福利。目前國內的百度、阿里、騰訊、科大訊飛、搜狗等科技公司都有語音技術的服務,其中,百度、阿里、科大訊飛的語音技術相對成熟,我們可以根據自己的需求選擇任何一家服務商使用。但是三家公司語音服務的付費模式、接入方式、語音庫各不相同,我們如何選擇最為合適的服務商呢?三家服務商的語音技術各自有哪些特點和優勢呢?


國內語音技術哪家強?百度阿里科大訊飛各有千秋



國內語音技術哪家強?百度阿里科大訊飛各有千秋


百度的語音技術產品叫天智人工智能。天智基於世界領先的百度大腦,提供拿來即用的視覺、語音等通用AI能力及行業解決方案、AI開發平臺及培訓服務等。行業客戶可基於自身業務需求及數據,定製出個性化智能應用。而其中語音技術採用國際領先的流式端到端語音語言一體化建模算法,將語音快速準確識別為文字,支持手機應用語音交互、語音內容分析、機器人對話等多個場景。

它的服務包括短語音識別、語音合成、語音自訓練平臺、呼叫中心語音解決方案、遠場語音識別等,其中短語音識別、語音合成常用的兩種服務。百度的短語音識別可以識別中文普通話、英語、粵語、四川話和大多數的方言。短語音識服務一個應用5萬免費調用次數,可以滿足小型應用的需求。語音合成服務包括基礎音庫和精品音庫,都是免費提供給開發者使用的,但是有QPS的限制,精品音庫提供了九種音庫,這可以滿足中小開發者的需求。際精品音庫領先的流式端到端語音

國內語音技術哪家強?百度阿里科大訊飛各有千秋

阿里雲智能語音交互


國內語音技術哪家強?百度阿里科大訊飛各有千秋


阿里雲是國內最大的雲廠商,其雲市場規模國內第一、世界第三,僅次於亞馬遜、微軟。阿里雲不僅面向企業提供雲服務器、數據庫、中間件等軟硬件服務,而且提供視頻、語音技術

。阿里雲的語音技術服務是智能語音交互,它是基於語音識別、語音合成、自然語言理解等技術,為企業在多種實際應用場景下,賦予產品“能聽、會說、懂你”式的智能人機交互體驗。適用於多個應用場景中,包括智能問答、智能質檢、法庭庭審實時記錄、實時演講字幕、訪談錄音轉寫等場景。主要功能包括錄音文件識別、實時語音轉寫、一句話識別、語音合成等。其中語音合成服務,通過先進的深度學習技術,將文本轉換成自然流暢的語音。目前有多種音色可供選擇,並提供調節語速、語調、音量等功能。語音識別和語音合成目前都是按照次數收費,費用相對便宜,100萬次數1000元左右一年。語音合成提供了40多種可選的音庫,支持支持輸出pcm、wav、mp3編碼格式數據;支持設置語速,語調,音量;支持設置男聲/女聲,非常豐富,是企業和個人開發的首選。

國內語音技術哪家強?百度阿里科大訊飛各有千秋


科大訊飛人工智能


國內語音技術哪家強?百度阿里科大訊飛各有千秋


科大訊飛是專業從事智能語音及語言技術研究、軟件及芯片產品開發、語音信息服務及電子政務系統集成,

擁有靈犀語音助手訊飛輸入法等優秀產品,這就是與阿里百度不同的地方,科大訊飛是專門做語音技術的公司,它的技術是最成熟的。其中漢語語音識別技術在國內領先,無人能及。得到、QQ閱讀、咪咕閱讀、起點讀書、高德地圖、滴滴出行、京東、有道翻譯等產品的語音都用的是科大訊飛的技術。科大訊飛語音識別技術已經達到先進水平,語音識別準確率已經達到實用標準。支持中、英、日、韓、俄、法、西7個語種的識別,同時,還支持廣東話、河南話、四川話等方言的識別。在語音合成技術方面,科大訊飛提供中英日韓等18種多語種、川豫粵等多方言、男女聲多風格的選擇,音量、語速、音調等參數。其高質量合成音頻的自然度和清晰度已經超過了普通人的朗讀水平。語音識別和語音合成目前都是按次數收費,收費相比阿里較貴,一萬次58元,是專業的語音產品的首選


國內語音技術哪家強?百度阿里科大訊飛各有千秋

總結


百度的語音技術目前是免費使用的,註冊百度AI平臺就可以使用,但是有QPS限制,小應用可以選擇使用。阿里和科大訊飛都是按量收費,相對來說阿里的比較便宜,如果企業或者開發本身選擇的就是阿里雲服務器,那建議使用阿里語音技術。科大訊飛是專業的語音技術提供商,其語音技術在國內領先,國內很多知名的產品都在使用科大訊飛。科大訊飛語音技術資費相對較貴,是專業語音產品的首選。




分享到:


相關文章: