在对话音设计编码方案之前,首先需要了解话音波形的基本特性

在对话音设计编码方案之前,首先需要了解话音波形的基本特性,在这些特性基础上,完成对声音数据的压缩编码、声音的识别以及文本-声音的转换等。

在对话音设计编码方案之前,首先需要了解话音波形的基本特性

话音是由于肺部中的受压空气沿着声道通过声门而产生的。普通男人的声道从声门到嘴的平均长度约为17厘米,这个事实反映到声音信号中,相当于在1 ms数量级内的数据具有相关性,这种相关称为短期相关。

在对话音设计编码方案之前,首先需要了解话音波形的基本特性

声道也被认为是一个滤波器,这个滤波器有许多共振峰,这些共振峰的频率受随时间变化的声道形状所控制,例如口腔为可变共振腔,舌的移动就会改变声道的形状。许多话音编码器用一个短期滤波器来模拟声道。但由于声道形状的变化比较慢,模拟滤波器的传递函数的修改不需要那么频繁,典型值在20 ms左右。

在对话音设计编码方案之前,首先需要了解话音波形的基本特性

压缩空气通过声门激励声道滤波器,根据激励方式不同,发出的话音分成三种类型:浊音(voiced sounds),清音(unvoiced sounds)和爆破音(plosive sounds)。


分享到:


相關文章: