林志玲為你導航這麼多年,她的聲音究竟是如何合成的?

明星語音導航,你一定不陌生。不管是林志玲有辨識度的聲音,還是李佳琦的“魔性導航”,都讓語音導航在出行方面增添了樂趣。但是,這些各具本人特色的語音導航,

真的是明星本人一條條錄出來的嗎?

林志玲為你導航這麼多年,她的聲音究竟是如何合成的?

語音導航背後的秘密

科大訊飛的董事長劉慶峰曾在2018世界機器人大會上表示,地圖導航上面的林志玲、郭德綱的聲音其實都不是本人原音,而是由他們的機器合成的。

林志玲為你導航這麼多年,她的聲音究竟是如何合成的?


那究竟這些語音是如何合成的?小編來給你普及知識點啦。

林志玲為你導航這麼多年,她的聲音究竟是如何合成的?


第一步:錄製語音庫

首先,在開始合成語音之前,需要先錄製一些語音作為語音庫。為了儘可能覆蓋語言中的元音、輔音、音調,錄製的內容通常需要一定的設計

第二步:預測文本讀音

然後,要預測文本的讀音,這是合成語音的第一步。除了將文本轉換音素序列之外,為了讓生成的聲音更加自然,還要分析文本的節奏、重音,處理文本中的數字、縮寫等等。

第三步:合成語音

最後,進入合成語音。一種方法是從語音庫中逐一尋找與目標一致的音素,並將它們拼接起來;另一種方法則是將第一步預測的音素轉換成每時每刻的語音參數,加上從語音庫中學習到的特徵,再生成語音。

林志玲為你導航這麼多年,她的聲音究竟是如何合成的?


除了上述兩種合成方法,人們還在嘗試使用深度學習端到端的方法完成語音合成任務。不過從結果上看,還是將前兩種方法融合起來效果比較好。

林志玲為你導航這麼多年,她的聲音究竟是如何合成的?


在語音導航中,左轉、減速、掉頭等較短的語句,通常是錄好的內容。關鍵信息總是在變換的長句子,當然是合成的啦!

除了語音導航,AI語音技術早已融入到我們的生活當中,比如:廣播電視應用到的虛擬主播、通過語音喚醒家中的電器或設備(冰箱、電視、窗簾)、在銀行用語音驅動機器人辦理業務等等。在人工智能語音技術方面,科大訊飛也走在了行業的前端。


分享到:


相關文章: