央視直播:科大訊飛“聲音復刻”黑科技,打造首個會15種方言和30種外語的央視主播!

如果你一直把人工智能(AI)當作科學幻想,覺得缺乏真實感,恐怕是受到了文學或影視作品的影響。其實人工智能早已在不知不覺中融入我們生產生活各個領域,用來描繪很多東西,例如有形的機器人、無人駕駛汽車、智能音箱……也可以是蘋果語音助理Siri、谷歌圍棋大師AlphaGo、精通10餘種方言30多種外語的主持人“王小言”等等。

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

12月29日,央視新聞新年特別報道專題《中國永遠在這兒》,坐在央視演播廳內做連線的主持人王言意外發現:有一個和自己極其相似的聲音通過電視直播端傳過來,此時場外連線的是位於安徽合肥·中國聲谷·科大訊飛演示廳內的一臺“會說話”的機器。

這臺機器正在向演播現場發回報道,“王言你好,我是主持人王小言。今天我會在中國聲谷,向大家展示這裡的新變化,也歡迎大家來這裡參觀學習,我會一直在中國聲谷等著你們。”這位“王小言”主播不僅用地道的四川話向觀眾們問好,還用印地語道早安,這讓央視演播廳的王言頗感震驚,感嘆“就像找到了自己失散多年的親弟弟。”

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

據央視記者江凱介紹,主持人“王小言”的聲音來自於科大訊飛個性化智能語音合成的黑科技——聲音復刻。2018年世界機器人大會上,科大訊飛董事長劉慶峰就曾表示,“我們使用的導航軟件裡林志玲、郭德綱的聲音就都是他們合成的。大量且複雜的語言表達讓真人預先錄製顯然不現實,因此使用機器合成的作用越來凸顯。”

語音“黑科技”三分鐘復刻聲音

對多數人來說,最常接觸到的是語音合成技術,賦予機器“開口說話”的能力。更高級的是,科大訊飛AI賦能使機器擺脫了機械化的發音,像真人擁有情感表現力、抑揚頓挫的聲音。目前科大訊飛最新個性化語音合成技術,只需採集十段話語料,訓練三分鐘時間,即可實現“栩栩如聲”的聲音復刻,讓聲音與發音人幾乎一樣。據悉,本次節目播出前,來自訊飛留聲團隊通過採集王言平日節目中的聲音,實現了聲音復刻,最終讓主持人“王小言”驚豔出場。

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

這項“語音黑科技”不僅復刻發音人的普通話,還能根據需求變換口音。據悉,訊飛的聲音復刻能讓機器“講”粵語、四川話、河南話等10餘種方言和英、日、韓、法等近30種外語。然而這一過程並不需要重新採集發音人的語音,而是通過文本輸入就實現了“變聲”。

定製專屬音庫聲音復刻的福祉

聲音復刻技術是劃時代的,並且很有意義。早在2013年,科大訊飛與高德導航合作,將林志林的聲音“代入”地圖導航中,此後接連復刻了包括郭德綱、周星星、王俊凱、王源、易烊千璽、羅永浩、高曉松、黃曉明等大眾所熟知的明星大咖的導航語音包。

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

2018年1月,央視播出的大型紀錄片《創新中國》,科大訊飛利用A.I語音合成技術成功“復活”了已故配音藝術家李易老師的聲音,並通過A.I.完成了紀錄片的全程配音。

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

2018年3月1日,AI虛擬主持人在南方財經報道正式上崗。此次虛擬主持人的全新亮相,是科大訊飛與南方財經全媒體集團跨界合作的創新成果,通過訊飛智聲提供的個性化語音合成和機器學習,完全模仿真實主持人的聲音,並將其應用於財經新聞播報,在我國尚屬首例。

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

復刻自己的聲音拓展使用場景

不用羨慕,這項黑科技並非主持人和明星大咖的專屬,科大訊飛已上線“訊飛留聲Lite”的微信小程序,通過自動建立深度學習模型就可以訓練出用戶的音庫,為用戶提供能快速、便捷、完美復刻聲音的平臺。也就是說,你只需要讀出10段話,就能收穫一個專屬自己的復刻聲音。如此簡便的復刻操作,自己的聲音是否安全呢?會不會被別人盜用呢?對於這些顧慮,科大訊飛研發團隊為確保聲音安全,每個人在訊飛留聲內進行音庫製作都必須經過實名認證,並且復刻的聲音僅限於讓機器朗讀既定的文本,不支持第三方編輯下載,從而保證用戶在體驗黑科技的同時兼顧個人信息安全。

央视直播:科大讯飞“声音复刻”黑科技,打造首个会15种方言和30种外语的央视主播!

如今,科大訊飛將聲音復刻技術產品化做到了極致,先後出品了任意文章資訊小說每天都可以聽的“訊飛有聲”,打造有“所有書都能聽”的訊飛閱讀,多陪孩子一點的“呀呀伴讀”,體現了有溫度的科技。藉助聲音復刻,智能音箱中女朋友的聲音每天準時叫你起床,為你播報天氣,提醒你添衣帶傘;車載導航系統裡,你妻子、孩子的聲音為你保駕護航,提示你安全駕駛,早點下班回家;又或者,你將自己的聲音預置到智能玩具中,讓它替你與孩子互動,伴孩子入眠;即使你遠在外地,依舊能夠“近距離”陪伴家人!

AI技術前沿是無人區,每一步都是挑戰,但也處處收穫驚喜。專注於人工智能和智能語音的科大訊飛獲得國際語音合成比賽13連冠,在相似度、自然度、錯誤率、段落總體感覺等指標上均名列前茅。該語音合成系統也是業界目前自然度指標唯一達到真人說話水平的系統,合成的聲音更具真實感和人情味。可以預見,隨著中國AI力量的不斷崛起,將會在國際上扮演越來越重要的角色。


分享到:


相關文章: