你說不出的蘇州話,AI替你「講」

爺爺奶奶幫帶娃一口鄉音,反而得被娃爸娃媽嫌棄,孩子勉強聽的懂老家話,但說不出,爺孫輩無法用家鄉話交流。在語言學家眼裡,這也是個危機,吳語區方言複雜,“斷代”危機更嚴重。在近日舉行的訊飛輸入法蘇州方言保護文化沙龍上,記者瞭解到,目前利用人工智能,已經可以人工“合成”蘇州話,AI技術的進步,有望給保護方言加碼。

你說不出的蘇州話,AI替你“講”

方言使用斷崖式下跌

蘇州市職業大學吳文化研究院副院長陳璇表示,曾經有新聞說蘇州市青少年能熟練使用蘇州話的只有2.2%,但這個數據是來自一份學生社會實踐報告,可能在取樣上有問題。在新聞發佈之後,他們也曾受委託對蘇州市青少年使用蘇州話的情況做過調查。樣本為6-16歲青少年中,能使用蘇州話交流的,大約在14%左右,雖然沒有2.2%那麼恐怖,但情況也很讓人憂心。

而另外一項研究顯示,中間輩和祖輩使用蘇州話交流的比例大約是93%,而中間輩和小孩之間使用蘇州話交流的,只佔到60%左右,方言使用率確實是在斷崖式下跌的。

人工智能能“合成”蘇州話

和國內和其他方言相比,吳儂軟語自成體系。陳璇曾經教授外地人學習蘇州話,但一個“我”字的發音,就難倒了很多人,再加上覆雜的語法、俚語、變調等等,學習的“門檻”特別高。

“以往保護方言,大多采取視頻、音頻錄製等方式,我們現在想借助人工智能來保護方言。”科大訊飛移動互聯業務部品牌總監、也是“方言保護計劃”發起人之一的李強軍和告訴記者,方言識別一直是語音識別的難點,吳語方言尤其困難。它的中文文本和方言口語不一致,多數人無法用方言閱讀文本,在語料蒐集這一環上,就已經很困難。他們蒐集了大量的蘇州話文本,目前已經“訓練”AI能識別蘇州話,成為首家實現蘇州話方言語音識別的人工智能企業。目前,該技術成果已經在訊飛輸入法方言語音輸入功能中上線。經過一段時間運用,準確率還可以再提高。

此外,AI還能人工“合成”蘇州話,給它一段文本,它能用蘇州話念出來。視頻音頻保留的蘇州話畢竟限於錄製的樣本,“合成”這個功能,有可能幫助在將來“復刻”蘇州話來。

你說不出的蘇州話,AI替你“講”

專家探討方言保護

“在國內,我們已經實現了上海話、粵語、藏語、四川話等多種方言的語音識別,其他方言的攻關也在進行中。”科大訊飛多語種高級研究員祖漪清表示,要保護方言,其實還有不少困難。比如但吳語區常常十里不同音,要都保留下來,數據量巨大,如何保留方言的每個小‘基因’,還需要全社會的努力。

距瞭解,科大訊飛還運用語音識別系統,做了一個方言採集的“方言保護APP”,落地發音人招募,建立個人方言庫。這一年來,通過公益推廣,收集超過20萬條方言語音內容。這些都是寶貴的方言保護材料。


分享到:


相關文章: