尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着移动互联网的快速发展,方便快捷的生物认证技术越来越受到重视。说话人识别又称为声纹识别,是生物认证技术的一种,其凭借更便捷、更安全、更经济的优势迎来了发展的契机,广泛应用于通信网络、商业交易、司法鉴定以及军事安全等领域。 说话... 展开 随着移动互联网的快速发展,方便快捷的生物认证技术越来越受到重视。说话人识别又称为声纹识别,是生物认证技术的一种,其凭借更便捷、更安全、更经济的优势迎来了发展的契机,广泛应用于通信网络、商业交易、司法鉴定以及军事安全等领域。 说话人识别的关键在特征提取与模型训练上,其常用的语音特征有线性预测倒谱系数(LPCC)、梅尔频率倒谱系数(MFCC)以及感知线性预测(PLP),其中MFCC与PLP的识别性能要优于LPCC,但MFCC与PLP分别作为单一特征用于说话人识别仍不能满足一些领域的高精确性要求,而高斯混合模型(GMM)由于其方法简单、识别性能优良运用最为广泛,但简单的初始参数选择方法使其有不稳定、精确性不足等缺陷,基于此本文提出一种新的融合特征PLP-MFCC以及改进的GMM来提升识别的性能,主要工作内容如下: 首先,介绍说话人识别中常用的特征参数LPCC、MFCC、PLP以及它们的提取过程,在分析F比与D比两种特征参数评价方法后,通过F比和D比选出MFCC与PLP中的部分特征进行融合,得到新的融合特征PLP-MFCC; 其次,研究GMM的建模方法,GMM训练模型的过程就是其参数估计的过程,而参数估计中初始参数的选择会影响训练模型的精确性,初始参数的选取通常采用随机法或K均值算法,在分析它们存在的一些问题后,将一种改进的K均值算法运用到GMM参数估计中对GMM进行改进; 最后,在Matlab平台上构建了基于高斯混合模型的说话人识别系统,实验采用标准的TIMIT语音库,将融合特征PLP-MFCC与MFCC、PLP进行对比实验,PLP-MFCC的识别率相比于MFCC、PLP分别提升了4.9%、3.8%,再将改进前后的GMM进行对比实验,改进后的GMM相比于改进前的GMM识别率提升了2.3%,实验结果表明,本文提出的融合特征以及改进的GMM对于提升说话人识别系统的性能有一定的效果。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。