声纹识别技术

声纹识别，生物识别技术的一种，也称为说话人识别，，是一种通过声音判别说话人身份的技术。声纹识别技术有两类，即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术，如缩小刑侦范围时可能需要辨认技术，而银行交易时则需要确认技术。中国人民银行正式对外发布《移动金融基于声纹识别的安全应用技术规范》金融行业标准，这意味着声纹识别技术得到金融监管部门的认可。这也为声纹识别技术进入移动金融领域解决了标准难题。1

基本信息

中文名
声纹识别技术
应用
安防领域
分类
说话人辨认、说话人确认
任务
声纹建模、声纹比对

原理

所谓声纹(Voiceprint)，是用电声学仪器显示的携带言语信息的声波频谱。

人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程，人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大，所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性，又有变异性，不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装，也与环境干扰有关。尽管如此，由于每个人的发音器官都不尽相同，因此在一般情况下，人们仍能区别不同的人的声音或判断是否是同一人的声音。

分类

根据不同的应用场景，声纹识别可分为说话人辨识（SpeakerIdentification，SI）和说话人确认（SpeakerVerification，SV）。SI指的是我们有了一段待测的语音，需要将这段语音与我们已知的一个集合内的一干说话人进行比对，选取最匹配的那个说话人，是一个1对多的判别问题；SV指的是我们有了一段未知的语音，紧接着判断这段语音是否来源于这个目标用户即可，是一个1对1的二分类问题。

应用

在应用上，声纹识别更大的应用前景在于安防领域，比如刑侦破案、门禁、银行交易等等。此外，在智能家居等领域，为了安全，也为了更好的智能体验，比如在人声鼎沸的情境中准确识别哪句话是主人下达的命令等，声纹识别技术也就渐渐受到了重视。

任务

声纹识别的主要任务包括：语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。

优点

1、蕴含声纹特征的语音获取方便、自然；

2、获取语音的成本低廉，使用简单，像麦克风、通讯设备等皆可；

3、适合远程身份确认；

4、声纹辨认和确认的算法复杂度低；

5、配合一些其他措施，如通过语音识别进行内容鉴别等，可以提高准确率。

参考资料

1
央行发布移动金融声纹识别技术规范