用戶5379017525469
需要圖像識別技術中的文本識別,再用TTS語音合成技術轉成聲音,文本識別技術漢王之類企業做的都很好,TTS語音合成訊飛、搜狗、百度都有成熟技術,開發這樣一個功能沒有技術難度。
漢王科技的主打技術就是人臉識別、文本識別之類的圖像識別技術。一個視頻文件是由多幀圖片所構成的,每張圖片中的文本通過漢王的文本識別技術,很容易把當中的文字內容識別出來。生成文本文件。
而TTS語音合成技術就更簡單了。相對於語音識別技術來說,語音合成技術是比較初級的語音技術。在訊飛、百度、搜狗、騰訊、阿里都有自己的語音合成技術,在語音的流暢程度跟語調的控制都非常好的表現力,甚至通過聲紋技術可以把語音合成成任何一個人的語音語調,這樣就能把字幕轉換成任何一個演員的語音語調聲線,天衣無縫的實現字幕轉聲音了。
TT君是新手不是新人
有聲音自動匹配文字的,我沒見過文字自動匹配聲音的。
看劇小胖
可以去視頻美化軟件裡面自動識別
鬼蘭曼珠沙
是不是和我一樣覺得自己聲音不太好聽!
遊歷天邊
這個不會
賣手機的麗麗姐
還真不會