请解释一下语言学中的”频谱”

2023-02-16 17:43:02Python020

请解释一下语言学中的”频谱”,第1张

语言是由语音(包括元音和辅音)按一定规则编排组合而成．在声学上来看，不同的语音特征，体现在它们具有不同的时间—频率特性上．

1。语言频谱和动态范围

人们日常谈话辐射的声功率平均约为10mW，耳语时最低声功率只有0．001mW；有训练的歌唱家最高可能产生1 W的功率．所以语言信号的功率是不大的，可是它所能传递的信息是无限的．

语言频谱有两种，其一是表示语言整体长时平均特性的长时平均频谱。从现有的多种语言的测量结果来看，各种语言的长时平均频谱是大同小异的．语言信号的频带约在100Hz～10 000Hz；主要频段约为100Hz～4 000Hz．不传送基音的电话语言则定为300Hz～3 400Hz，在每个频带之中语言信号的动态范围约为30dB．再加上不同频带之间低频最强的频率成分(约在300Hz附近)与高频最弱的频率成分还要有30dB～40dB的差别．。

标准的正常说话声级，在距发音人唇部一米处的声级约为65 dB(男人高些，女人低些)。

语言的另一种频谱是短时频谱．发音是一个连续慢变过程．用短时频谱来表示不同语音的声学特征．从声源看，语音声源可分为：准周期激励、噪声激励和脉冲激励三种．有的语音是由它们三者的某种组合构成的，如浊辅音就可能是由第一种准周期激励(声带振动)，再加上第二种或第三种噪声激励所构成(如汉语的浊声母r，英语的浊辅音b、d、g)．

由于声道的不同形状可产生出不同语音，也就有不同的简正方式，表现在语音短时频谱上，称之为共振峰．

（王德昭、应崇福、李启虎、张家禄）

在matlab中应用fft求傅立叶变换后，如果想画出频谱图，必须用fftshift命令处理变换的结果。

例子如下：

clear

clc

t=0:0.001:2

n=2001

Fs=1000

Fc=200

x=cos(2*pi*Fc*t)

y1=fft(x)

y2=fftshift(y1)

f=(0:2000)*Fs/n-Fs/2

hold

plot(f,abs(y1),'r')

plot(f,abs(y2),'b')

频谱定义：\r\n\r\n频谱就是频率的分布曲线，复杂振荡分解为振幅不同和频率不同的谐振荡，这些谐振荡的幅值按频率排列的图形叫做频谱。\r\n\r\n噪声的频谱：\r\n\r\n在弹性媒质中，物体的机械振动由近及远的传播过程称为声波。由于声源的振动，使的组成媒质的微粒在原有的杂乱运动中，附加一个有规律的运动，媒质中出现稠密和稀疏的交替变化，声波的传播实际也就是这种疏密相间状态的传播。声波的传播呈正弦曲线方式。声波在一秒钟媒质质点振动的次数即称之为频率，频率(ƒ)的单位为赫(Hz)。质点振动每往复一次所需要的时间称为周期T，单位为秒(s)，每个疏密相间状态之间的距离称之为波长(λ)，单位为米。频率ƒ和周期T互为倒数，ƒ \r\n= 1/T。波长λ为周期T与速度V的乘积，λ= T ×V 例：某频率(ƒ)为500 Hz的声波，声波在空气中的传播速度为V=340 m/s，它的周期T = \r\n1/ƒ= 1/500=0.002 s，它的波长λ= T •V=0.002 s×340 m /s=0.68 m。\r\n\r\n频率是描述声音特性的主要参数之一，是研究声音强度(声压级、声强级等)随频率分布的必要条件。声频谱是指组成复音(频率不同的简谐成分合成的声波)的强度随频率而分布的图形。从噪声频谱中，分析了解噪声的成分和性质，称为频谱分析。频谱分析时，通常要了解峰值噪声在低频、中频还是高频范围，为噪声控制提供依据。

频谱频率声波语言声源

# 上一篇：go语言结构体作为返回值传的是指针吗

# 下一篇：apk）systemframeworkjavax.obex.jar