声纹识别技术原理是什么?

JavaScript017

声纹识别技术原理是什么?,第1张

声纹识别技术原理是利用声音的独特性来识别人物的,声纹识别简单地说,就是通过声音进行说话人身份识别的过程。语音信号之所以被形容为“形简意丰”,是因为声音包含有内容、身份、情感、年龄及健康状况等丰富的信息。

人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,理论上说,每个人说话时的短时频谱特征、声源特征、时序动态特征、韵律特征、语言学特征等都有差异,因此声纹就像指纹一样具有唯一性和独特性,可以进行识别。

声纹识别具有的优势。

1、声纹识别在金融领域的很多应用场景都是高频使用,对用户体验方面的需求较高,如果验证方式较为繁琐,往往用户难以接受,声音信息一般不涉及用户隐私问题,声音采集通过一个麦克风或者电话、手机就可完成,用户的接受度比较高;

2、更重要的是,声纹不易纂改,再加之声音信号中含有语言信息、副语言信息和非语言信息,综合利用声音中蕴含的丰富信息可以具备较高的安全特性。

以上内容参考 人民网——闻声识人:声纹识别让金融安全听得见

一、什么是声纹鉴定

声纹,也称 “ 语图 ” ,是由专用的电声转换仪器(语图仪)将声波特征绘制成的波谱图形。声纹鉴定就是把未知人的语声和已知人的语声,通过语图仪分别制成声纹图谱,再依据声纹图上的特征进行分析、比较和判断,确定二者是否为同一人的语声。它是文检技术中近些年发展起来的语音识别的先进科学手段。

目前,许多国家都己把声纹鉴定作为辨认犯罪嫌疑人的重要手段,为侦查工作提供新的线索和证据。

( 1 )在获得了犯罪人的语声录音资料时,如在中进行的恐吓、勒索,或在其他性质的犯罪中录到了罪犯说话的声音,那么可以通过收集嫌疑人语音样本进行声纹鉴定,为认定或否定犯罪人提供鉴定结论。

( 2 )在案件的侦讯或审理中(包括民事案件),通过声纹鉴定可以审查录音证据材料的其伪。

( 3 )通过声纹分析,判断说话人的性别、年龄、方言(生活地区)特征,为侦查工作提供方向和范围。

目前,国际声纹鉴定并行两套系统:

一是声纹的自动识别系统,它以电子计算机为主体,具备分析、储存、检索、鉴定多项功能,可以根据语声进行全自动分析,最后给出结论。但这种结论的准确性同专家设定的特征吻合量(阈值)有关。

二是声纹的人工识别系统,它以语图仪为支持,鉴定人直接观察和分析声纹,寻找特征,测量数据并进行比较与评断,最后得出结论。  在声纹资料的存储技术上,已发展到激光光盘存储。先以激光源对待储声纹图谱进行扫描,获得付利叶光谱,再通过电脑把光谱记录的声纹特征转换成数据,最后通过电脑控制的激光针将待储声纹特征的数据存入光盘纹线中。当需检索时,再用激光针通过电脑系统输出光盘中的信号,即可进行声纹比较。这种存储技术容量很大,一张光盘可以储存数百万人的声纹。

国内也有一些专业公司,可提供声纹鉴定软件和服务。如厦门的快商通,凭借其在声纹技术领域的技术积累并结合以往成功的声纹鉴定经验,其研发的声纹鉴定分析系统可进行录音资料的有效声纹鉴定,提供的服务包括:录音资料话者同一性认定;录音资料内容辨识;录音资料的真实性完整性鉴定;录音资料降噪处理等。

二、声纹鉴定依如下程序和要求进行

1.采集检材

在采集犯罪人或证人的语声作检材时,录音宜采用高保真录音机。天聪采集语声的要求是:  ①录音应当尽量在不被对方发觉的情况下进行,以减少假象的干扰,保证语声的真实;  ②应尽量防止环境噪声和录音设备的干扰。麦克风与被录对象保持适当距离。尽量不用失真大 的袖珍盒式录音机,电源最好用市电,保持电流稳定。电话录音时应使用传感器,不要将听筒直接对着“麦克”录音。磁带应选用优质新带。

2.采集样本

除了遵照采取检材时要求的器材和注意事项外,应尽量保持同采集检材时相同、相近的语声环境、距离、设备及速度;并建议在样本中有与检材相同的词句,以供特征比对。

3.审听和选择

鉴定人员要先对捡材和样本分别反复审听和记录,从中选择正常而清晰的语声段落,再进一步选取相同的字、词、句,作为供比较的部分。然后使用语图仪分别将选好的检材与样本中的字、词、句做出声纹图。

4.声纹特征

在被比较的两种声纹图谱中,分别选取明显、稳定的特征作为比较特征。一般说,共振峰的频率值及其走向是最稳定的特征,而且具有很强的特定性,利用价值最高;而时长、音强、波形等特征稳定性较差,可做参考。在天聪鉴定过程中,还可以从同一个人的语声中选择多个相同字、词或句的语图,在分析比较中抓住其稳定而特殊的特征作为依据。

5.比较

比对检材与样本中相同字、词的声纹中的同类特征(如共振峰频率、走向及波形),进行比较分析,找出相同点和差异点。

6.综合评断

①如果被比较的全部特征完全吻合;或者稳定性强的特征完全吻合,而只是稳定性差的特征有些差异,均可做同一认定结论;

②如果被比较的稳定性强的特征差异较大,还可以补充样本再做语图比较,倘仍有差异,又无法解释,则可做否定结论。

7.送检

说话人在不同的环境和不同的心态下,以及不同的语气、不同的健康状况都会引起语音的某些变异。录音环境(噪音、回声、距离)的干扰以及录音设备不良,也会使录制的语音产生假性变异。因此,送检时,要把录制检材和样本时的环境状况、录制距离、录制方式、使用机器、以及在什么情况下录制等情况加以详细记载,一并提交鉴定人,以便对差异点进行客观的分析评断。

声纹识别,生物识别技术的一种,也称为说话人识别,有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。声纹识别就是把声信号转换成电信号,再用计算机进行识别。