第2章 语音信号的声学基础及产生模型

在研究和分析各种语音信号处理技术之前,必须了解有关语音信号的一些基本特性。为了对语音信号进行数字处理,需要建立一个能够精确描述语音产生过程和语音全部特征的数学模型,即根据语音的产生过程建立一个既实用又便于分析的语音信号模型。本章将讨论这些问题。

语音是在说话人和听者之间互相传递的,传递的媒介是声波。说话人的发音器官做出发音动作,接着空气振动形成声波,声波传到听者的耳朵里,立即引起听者的听觉反应,语音的传递就是这样的一个过程。其中发音动作属于生理现象,空气振动属于物理现象,而听觉反应属于心理现象。

从语音的传递过程出发来研究语音,就产生了语音学的三个分支:①发音语音学(articulatory phonetics)。发音语音学是最早发展起来的语音学,它的目的是从生理的角度研究语音。在没有仪器的时候,通常只能直接观察发音器官的动作来分析语音。由于生理活动不能完全依靠直观分析,因而人们制造出一些仪器来进行辅助研究。这样直观分析和仪器分析的结合,就能够清楚地认识语音的发音部位和发音方法。②声学语音学(acoustic phonetics)。声学语音学是在20世纪40年代开始发展起来的学科。它的目的是从声学角度研究语音的物理性质,同时考察语音物理性质和发音器官之间的关系。随着“频谱仪”(sound spectrograph),以及其他电子声学仪器的发明,声学语音学也发展迅速,人们对语音的声学性质的认识也不断深入。于是,进一步出现了声音模拟、语音合成以及语音识别等研究。③听觉语音学和心理语言学(auditory phonetics and psycholinguistics)。听觉语音学和心理语言学是较新的学科。因为语言的传递从大脑开始,又到大脑结束,或者说,语言的传递起点和终点都在大脑,所以听觉语音学和心理语言学就以大脑作为研究对象。它的目的是要探索大脑通过什么步骤或者方式来处理语音的发出和接收,以及语言信息又是以什么形式在大脑的什么部位存储起来。声音到达大脑的第一关是人耳,即听觉系统的起点在人耳,因此听觉语音学和心理语言学还要研究人耳的构造,以及人耳是如何传递声波的。

本章首先对语音的产生过程及人耳的听觉过程进行分析,接着给出传统的线性语音产生模型,以及目前广泛受到重视的非线性语音产生模型,这些都是从事语音信号处理研究的基础知识。