尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 说话人识别是一种生物认证技术,研究的是如何根据人的语音中独有的个性特点,来自动识别说话人身份。目前,凭借其特有的便利性、经济性和正确性,已在某些领域得到应用,是语音处理的一个研究热点,其两个关键部分是说话人特征提取和识别模型建立。... 展开 说话人识别是一种生物认证技术,研究的是如何根据人的语音中独有的个性特点,来自动识别说话人身份。目前,凭借其特有的便利性、经济性和正确性,已在某些领域得到应用,是语音处理的一个研究热点,其两个关键部分是说话人特征提取和识别模型建立。本文重点研究了说话人识别的特征组合方法,主要工作如下: (1)在线性预测系数(LPC)和美尔频率倒谱系数(MFCC)基础上,将LPC系数融入到MFCC参数中,得到线性预测美尔倒谱系数(LPMFCC),用于说话人识别。该方法不会增加特征维数,运算量也相对较少,识别率有较大程度提高。 (2)为提高说话人识别的正确率,同时采用多个特征参数。针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的MFCC、LPMFCC、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法(FMLT参数),该方法有效地结合了人耳的感知、声道和非线性能量方面的特征;另外,提出一种采用改进的升半正弦函数进行加权的组合特征参数(WFMLT参数)。为验证这两种方法的有效性,提出基于PCA的MFCC、LPMFC和TEOCC组合特征参数提取方法(PCMLT参数)进行对比分析。 (3)针对MFCC参数在中高频的计算精度不高的问题,采用滤波器组主要分布在高频部分的翻转美尔倒谱参数(IMFCC)和滤波器组主要分布在中频部分的中频美尔倒谱参数( MidMFCC)相结合的方法,提出基于Fisher比的MFCC、IMFCC和MidMFCC的组合特征参数(FMFCC参数),来改善说话人识别系统性能。 (4)研究基于GMM和BP神经网络的说话人识别系统,将上述特征参数提取方法分别应用到系统中,验证组合特征参数的有效性和可行性以及系统的识别性能。仿真实验表明,FMLT方法与MFCC、LPMFCC、MFCC+LPMFCC、FMFCC以及PCMLT方法相比,识别率在纯净语音环境下分别提高了21.65%、18.39%、15.61%、15.01%与22.70%;在30dB噪声环境下,则分别提升了15.15%、10.81%、8.69%、7.64%与17.76%;并且经加权处理的WFMLT方法的识别性能更优于FMLT方法,在纯净语音环境下提升了2.62%。结果表明,FMLT和WFMLT参数能够有效提高说话人识别率,且具有更好的鲁棒性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。