Watson 如何幫助作者賦予書中主角以生命

IBM Watson Text to Speech API,它能夠將文本合成為多種語言、聲音和方言的音頻。這裡面“Allison”的聲音音色很甜、很有吸引力,特別契合我的書中主人公 Hailee Tupper 的年齡和性格特點。

有這樣一種說法,一張圖片勝過千言萬語。但事實上,清晰、措辭得當、音調和發音準確的口頭語言能夠更好地營造最難忘、最美好的畫面。而人工智能已經取得了顯著的進展,能夠完成上述表達要求。

我想知道能否用一個女性人工智能聲音來演繹我所著的“Miraculous”一書中的主角,以讓人信服的方式讓聽眾相信她就是書中的真實角色。

Watson 如何幫助作者賦予書中主角以生命

我如何藉助 Watson API 賦予主角生命

在對多家公司的多個不同的 AI 角色進行試音後,我最終選擇了 IBM Watson Text to Speech API,它能夠將文本合成為多種語言、聲音和方言的音頻。我選擇了“Allison”的聲音,因為她的音色很甜、很有吸引力,同時也契合書中主人公 Hailee Tupper 的年齡。

為了幫助她演繹書中場景,我使用了文本轉語音 API 的表達功能“Expressiveness”,該功能可以使用情感元素擴展 SSML,而該情感元素能夠表達好消息 (GoodNews)、道歉 (Apology) 或不確定 (Uncertainty) 的說話語氣(僅適用於美音 Allison 聲音)。可以進一步瞭解 IBM Watson 情感語音服務 Expressive SSML。

我的書中有數萬個單詞組合,Watson Allison 的聲音能夠以不同的方式處理這些單詞組合。通過單獨使用或組合使用三個情感語音情緒中的一個或多個情緒,並在說話時加上不同的停頓時間,她就能表達更多的情緒。

小說角色說話時會長短不一,因此會影響到一句話停頓的次數和頻率,而這種停頓也需要計算。書中特定場景的總體情緒也會影響停頓的頻率,如說話中止、語氣平靜和歡呼等。

下面,我將通過一個例子來展示上述技術有哪些作用。

若要完成此類項目,你是否必須成為一名 IT 人員或程序員?我不這麼覺得。不論怎麼想,我都不可能成為計算機人員或程序員。但是,我想說的是,耐心、實踐和創意都是非常重要的因素。這就像是一個故事的導演。整個過程會涉及大量的複製粘貼工作。關鍵要知道如何將代碼粘貼至文本中的正確位置,最終達到預期效果。

Watson 如何幫助作者賦予書中主角以生命

假如您對此類項目感興趣,我非常願意與你分享我的知識和專業技能,比如,通過一個免費的視頻,幫助您取得最佳成果。

最後,我想說的是,與 IBM Watson 合作是一段美妙、精彩的經歷。如果有可能,我很希望能夠跟他握手致謝。

本文作者

Watson 如何幫助作者賦予書中主角以生命

Walter D. Rouzer

“Miraculous –A Whale of a Tale”的作者


分享到:


相關文章: