麻省理工的智能語音,可以讓彩虹小馬說“我愛北京天安門”了

麻省理工的智能語音,可以讓彩虹小馬說“我愛北京天安門”了

小馬同人即將迎來新的高峰。

文本智能生成語音的TTS系統現在已經挺成熟的了。先進的TTS系統早就脫離了單純的“機械棒讀”,通過人工智能輔助訓練,在音調和語氣上已經十分接近真人。

最近,MIT一位AI研究員的成果,把TTS往前又推進了一步。他編寫的新AI,極大縮短了訓練需要的樣本數量。最少只要30分鐘的語音素材,就可以用文本生成質量極高的語音。

麻省理工的智能語音,可以讓彩虹小馬說“我愛北京天安門”了

也就是說,哪怕只是把遊戲或者動畫裡某個角色的對話拆出來,跑一遍機器學習算法,AI就能模仿遊戲中角色的語氣生成新的語音。

目前這個AI提供了幾種範例音色,在網上可以供人任意嘗試。有《傳送門》裡的大Boss機器人GLADoS,有《小馬寶莉》裡的紫悅和柔柔,還有《史丹利寓言》裡的旁白君。

其中,兩個小馬的配音質量是最讓人震撼的,外網網友們普遍覺得這個AI已經十分接近動畫裡的語氣和感覺了。當然這兩個角色使用的訓練素材也是最多的,除了全部的9季動畫,據說還“通過各種手段”拿到了無背景音的配音原聲。用這個AI生成的語音自制粉絲劇情,代入感肯定十足。

麻省理工的智能語音,可以讓彩虹小馬說“我愛北京天安門”了

網友透露小馬的音色素材質量和數量都是最好的

其次就是GLADoS,人工智能去學習人工智能呆板脫線的語氣,傳統藝能玩得有模有樣。《史丹利寓言》的旁白和其他幾個聲線,可能因為是人類語氣,素材又少了點,最終的效果還是稍微差一些。

這個AI最大的缺陷還閱讀能力不太過關。根據作者的說明,AI對於多音字的處理比較愚蠢。比如“玩家” Gamer這個詞,你打“Gamer”,AI就會念成“嘎們兒”。非得要打成“Gaymer”,它才能唸對。

麻省理工的智能語音,可以讓彩虹小馬說“我愛北京天安門”了

AI的閱讀能力比較呆板,需要用技巧輔助發音

我調戲了一下這個AI,想要試試能不能教小馬紫悅說兩句中文。我們嘗試了好幾次,發現紫悅在說“我愛北京天安門”的時候,發音和語氣不能兩全。語氣很象樣的時候,發音不太對。發音調對了,語氣又變得有點奇怪了。看來中文對小馬駒來說還是太難了點。

網站上還有兩個非常奇怪的範例角色:一個是《傳說之下》裡的骷髏人Sans,另一個是《傳送門》裡的主角Chell。如果你很好奇這倆人是怎麼TTS的,那麼恭喜你發現了重點。

麻省理工的智能語音,可以讓彩虹小馬說“我愛北京天安門”了

???

下面是我教小馬說中文的視頻:



分享到:


相關文章: