请解释一下语言学中的”频谱”

Python020

请解释一下语言学中的”频谱”,第1张

语言是由语音(包括元音和辅音)按一定规则编排组合而成.在声学上来看,不同的语音特征,体现在它们具有不同的时间—频率特性上.

1。语言频谱和动态范围

人们日常谈话辐射的声功率平均约为10mW,耳语时最低声功率只有0.001mW;有训练的歌唱家最高可能产生1 W的功率.所以语言信号的功率是不大的,可是它所能传递的信息是无限的.

语言频谱有两种,其一是表示语言整体长时平均特性的长时平均频谱。从现有的多种语言的测量结果来看,各种语言的长时平均频谱是大同小异的.语言信号的频带约在100Hz~10 000Hz;主要频段约为100Hz~4 000Hz.不传送基音的电话语言则定为300Hz~3 400Hz,在每个频带之中语言信号的动态范围约为30dB.再加上不同频带之间低频最强的频率成分(约在300Hz附近)与高频最弱的频率成分还要有30dB~40dB的差别.。

标准的正常说话声级,在距发音人唇部一米处的声级约为65 dB(男人高些,女人低些)。

语言的另一种频谱是短时频谱.发音是一个连续慢变过程.用短时频谱来表示不同语音的声学特征.从声源看,语音声源可分为:准周期激励、噪声激励和脉冲激励三种.有的语音是由它们三者的某种组合构成的,如浊辅音就可能是由第一种准周期激励(声带振动),再加上第二种或第三种噪声激励所构成(如汉语的浊声母r,英语的浊辅音b、d、g).

由于声道的不同形状可产生出不同语音,也就有不同的简正方式,表现在语音短时频谱上,称之为共振峰.

(王德昭、应崇福、李启虎、张家禄)

在matlab中应用fft求傅立叶变换后,如果想画出频谱图,必须用fftshift命令处理变换的结果。

例子如下:

clear

clc

t=0:0.001:2

n=2001

Fs=1000

Fc=200

x=cos(2*pi*Fc*t)

y1=fft(x)

y2=fftshift(y1)

f=(0:2000)*Fs/n-Fs/2

hold

on

plot(f,abs(y1),'r')

plot(f,abs(y2),'b')

频谱定义:\r\n\r\n频谱就是频率的分布曲线,复杂振荡分解为振幅不同和频率不同的谐振荡,这些谐振荡的幅值按频率排列的图形叫做频谱。\r\n\r\n噪声的频谱:\r\n\r\n在弹性媒质中,物体的机械振动由近及远的传播过程称为声波。由于声源的振动,使的组成媒质的微粒在原有的杂乱运动中,附加一个有规律的运动,媒质中出现稠密和稀疏的交替变化,声波的传播实际也就是这种疏密相间状态的传播。声波的传播呈正弦曲线方式。声波在一秒钟媒质质点振动的次数即称之为频率,频率(ƒ)的单位为赫(Hz)。质点振动每往复一次所需要的时间称为周期T,单位为秒(s),每个疏密相间状态之间的距离称之为波长(λ),单位为米。频率ƒ和周期T互为倒数,ƒ \r\n= 1/T。波长λ为周期T与速度V的乘积,λ= T ×V 例:某频率(ƒ)为500 Hz的声波,声波在空气中的传播速度为V=340 m/s,它的周期T = \r\n1/ƒ= 1/500=0.002 s,它的波长λ= T •V=0.002 s×340 m /s=0.68 m。\r\n\r\n频率是描述声音特性的主要参数之一,是研究声音强度(声压级、声强级等)随频率分布的必要条件。声频谱是指组成复音(频率不同的简谐成分合成的声波)的强度随频率而分布的图形。从噪声频谱中,分析了解噪声的成分和性质,称为频谱分析。频谱分析时,通常要了解峰值噪声在低频、中频还是高频范围,为噪声控制提供依据。