尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着互联网以及信息化的迅速发展,声纹识别技术在金融、证券、社保、电子商务、银行等远程客户服务的身份确认和公安、军队安全部门的特定人身份自动检测和认证中具有广泛的应用价值和前景需求,是当今世界声音信号处理和生物特征信息检测与识别领域... 展开 随着互联网以及信息化的迅速发展,声纹识别技术在金融、证券、社保、电子商务、银行等远程客户服务的身份确认和公安、军队安全部门的特定人身份自动检测和认证中具有广泛的应用价值和前景需求,是当今世界声音信号处理和生物特征信息检测与识别领域的重要探索方向。近几十年来,在这一领域的研究已经取得了重大进展,但因为说话人个性特征易受外界因素影响以及具体实际环境的复杂多变性,其瓶颈效应也逐渐凸显,因此,在复杂背景下研究有效的语音信息检测方法和更具鲁棒性的特征提取算法对于提高系统的识别率具有非常重要的意义。 复杂背景下的声纹识别技术是在高度复杂噪声情况下,通过检测出声音并进一步进行特征提取后,经过分析处理建立识别模型,最后应用识别模型对说话人进行识别。论文主要研究语音端点检测方法和特征提取方法来提高识别效率,主要工作如下。 首先,在声音预处理阶段,提出了嘈杂环境下的两种语音信号端点检测方法,根据不同背景复杂程度的信噪比高低分别采用基于谱熵的端点检测算法和基于短时能量和过零率的双门限端点检测算法,实验表明,背景为高信噪比情况下基于短时能量和过零率的双门限端点检测算法效果较好,背景为低信噪比情况下基于谱熵的端点检测算法较优。 其次,在特征提取阶段,利用倒谱法计算出基音周期参数,再通过Mel滤波器组将语音信号功率谱转换成Mel倒谱系数(MFCC),然后利用改进特征提取算法将两种参数组成一种声纹特征参量,同时分别对它们进行了实验仿真。 最后,在声纹识别阶段,首先提出带噪特征的识别算法(SEMG)算法,即在复杂背景下对语音信号利用基于谱熵的端点检测算法检测端点后,再利用改进特征提取算法特征提取,最后为每个说话人建立一个高斯混合模型(GMM),并通过实验验证了SEMG算法的有效性,达到了理想结果。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。