尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 声纹识别是一种生物特征识别技术,利用人类语音中包含的特征信息来对身份进行辨认。而语言交流是人类进行信息沟通的基本方式,由于说话者的发声器官:舌头、牙齿、喉咙、肺、鼻腔、发音通道等具有先天性的区别,而且在发育成熟后一般不会发生改变。因... 展开 声纹识别是一种生物特征识别技术,利用人类语音中包含的特征信息来对身份进行辨认。而语言交流是人类进行信息沟通的基本方式,由于说话者的发声器官:舌头、牙齿、喉咙、肺、鼻腔、发音通道等具有先天性的区别,而且在发育成熟后一般不会发生改变。因此,日常生活中人们能够通过声音来判别说话人的身份。随着科技的进步,信息的安全性受到了更多的关注,相比于传统的密码认证技术,声音是独一无二的,不会被遗忘或者丢失,并且易于使用;同时相比于其他生物特征,声纹信息只需麦克风便可完成采集,数据采集极为方便且设备造价低廉,而且声纹识别研究目前仍呈上升发展态势。但是,由于语音信号的获取和处理等包含很多不稳定音素,例如环境噪声、发声时的混响、信道变化等,这些因素都会影响声纹识别系统的性能表现,所以当前的声纹识别研究仍然存在很多关键技术问题急需解决。 本文围绕环境噪声对声纹识别产生的影响,结合降噪与深度学习的思路,提出了一种带有前端降噪的深度神经网络解决方案。本文所提出的网络模型中包含一个前端降噪处理模块以及一个混合型的深度神经网络;前端降噪处理中包含了一个自适应降噪算法,通过对语音信号进行自适应滤波处理,最大程度地保留说话人信息;后端的深度神经网络融合了卷积神经网络与循环神经网络,提取出语谱图中说话人的声纹特征信息。模型建立完成后,在Aishell-1数据集上进行实验,并且得到了很好的识别率;同时与一些传统的声纹识别模型进行了性能对比,实验结果证明了本文提出的方案在噪声环境下具有更好的性能表现。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。