尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 声纹识别是生物特征识别与认证领域的一个重要分支,它通过分析说话人的语音信号,提取合理的声纹特征和建立有效的分类识别模型,对说话人的身份进行校验和鉴别,广泛应用于刑侦、人机交互声纹口令验证、银行声纹身份验证、人体康复指标验证等领域。... 展开 声纹识别是生物特征识别与认证领域的一个重要分支,它通过分析说话人的语音信号,提取合理的声纹特征和建立有效的分类识别模型,对说话人的身份进行校验和鉴别,广泛应用于刑侦、人机交互声纹口令验证、银行声纹身份验证、人体康复指标验证等领域。 论文以面向刑侦身份验证的技术需要为牵引,针对实际采集的声音信号不可避免带有较强的环境噪声和设备噪声、且噪声多为平稳白色高斯的特点,采用具有自适应噪声强度的维纳滤波实现噪声的有效去除,以消除或降低噪声对后续声纹识别的影响;分析了声纹语谱图的时序和空间信息特征,为限制语谱图维度过大,确定了以4秒长度的声纹信号的语谱图特征作为分类识别特征,并采用常见的高斯混合模型(GMM)与通用背景模型(UBM)相结合的声纹识别模型,针对开放的Surfingtech中文普通话语料库,开展了声纹识别实验。实验结果表明,确定的维纳滤波去噪、声纹语谱图特征提取对提高声纹识别准确性的效果明显;在此基础上,为降低声纹语谱图存在的冗余信息,以有利于提高深度学习网络训练学习效率,提出词嵌入语谱图降维方法,并结合具有捕捉信号时序特征的长短期记忆网络(LSTM),提出了基于词嵌入LSTM深度学习的声纹识别方法,对比实验结果表明,基于词嵌入降维LSTM声纹识别方法,其识别准确性和效率均明显提高;鉴于LSTM深度网络仅利用了声纹语谱图的时序特征,没有考虑其空间特征,为进一步提高声纹识别的准确性,充分利用深度卷积神经网络(CNN)对输入图像的空间信息特征具有良好捕捉能力的特点,提出LSTM与CNN相结合的深度学习网络结构设计思想,并通过实验验证,得出先采用CNN网络捕捉语谱图的空间信息、后续采用LSTM捕捉其时序特征有利于提高声纹识别准确性的结论。对比实验结果表明,词嵌入语谱图降维,结合CNN_LSTM混合深度学习网络结构,在标准语音数据集测试集取得了97.42%识别准确率,比采用单一LSTM模型提高了4.25%;针对实际声纹识别任务,在给定10个嫌疑人先验信息条件下,本文提出的维纳滤波、词嵌入语谱图降维、CNN_LSTM声纹识别方法,准确率达到95.48%。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。