騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程


騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

大家好,超子能力有限,技術不高,有什麼錯誤的地方,歡迎板磚。超子今天給大家介紹一下,如何使用騰訊雲的錄音文件識別功能,將mp3,wav等音頻文件轉成文字,我們需要4步走。

1.開通騰訊雲錄音文件識別功能,每月累計30小時的免費額度。

2.開通對象存儲 COS 服務,開通後6個月免費。

3.音頻文件上傳到對象存儲服務上,識別的時候,騰訊雲會從對象存儲獲取音頻文件。

4.使用騰訊雲API調試助手,調用服務器接口,完成識別請求。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

先看第1步,我們登錄騰訊雲官網,首頁產品類目下,選擇人工智能大類目下的語音技術,語音識別服務,音頻錄音文件識別就是這個服務下的功能。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

接著進行第2步,還是官網首頁產品下選擇熱門,然後選擇對象存儲。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

我們開通服務,然後立即使用,首次開通後,6個月免費。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

然後是第3步,我們進入對象存儲服務管理後臺,左側導航欄選擇存儲桶列表,我們要創建存儲桶。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

存儲桶名稱我們自己起一個就行,要注意的地方就是紅圈中所示的訪問權限,選擇公有讀寫。然後點擊確定,創建存儲桶。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

創建好後,我們進入存儲桶,上傳我們的音頻文件。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

然後我們進行第4步,語音服務的主頁,點擊入門,我們要找到API調試小助手。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

在新打開的頁面,往下拉找到紅圈中所示的錄音文件識別API文檔。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

然後頁面下拉,找到紅圈中的API 3.0 Explorer,這個就是API在線調試小助手。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

進入小助手後,先點擊查看秘鑰,把SecretId和SecretKey填寫進來。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

新打開的頁面,我們可以看到SecretId和SecretKey,把它們複製過來就行。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

然後我們需要設置5個參數,我們著重看第5個,這個url是從哪來的呢,就是第3步,對象存儲服務中,我們建立了存儲桶,然後上傳了音頻文件,這個url就是音頻文件的位置,我們一起找一下。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

我們來到存儲桶中,文件上傳完畢了,我們點擊音頻文件後面的詳情。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

點擊詳情後,會打開文件的基本信息,紅圈中所示的內容,就是url。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

然後我們選擇在線調試,然後選擇發送請求,接著騰訊雲會返回一個ID,這個ID就是我們查詢識別結果用的,這裡補充一點,就是單次識別,音頻文件的長度不能超過一個小時,如果超過了,就要截斷,分兩個識別。

騰訊雲語音識別ASR,mp3 wav音頻文件轉文字,簡單便捷無需編程

然後我們看最左側的紅圈,我們選擇錄音文件識別結果查詢,然後輸入上一步獲取的ID,然後發送請求,音頻文件越大,識別越慢,如果查詢沒結果,就要等一會,如果成功後,就會顯示識別後的文字,總體上看,識別效果還是不錯的,當然這和每個人的發音有關,發音越清晰識別準確度越高。


分享到:


相關文章: