尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 尽管在实验室环境下,说话人识别系统已经取得了较好的效果,但是现实中的很多因素使得系统性能明显下降,为了提高系统实用化程度,还需要解决很多问题,其中最关键的问题之一,就是如何在大量集外话者存在的情况下提高系统对集外话者的拒识性能。 ... 展开 尽管在实验室环境下,说话人识别系统已经取得了较好的效果,但是现实中的很多因素使得系统性能明显下降,为了提高系统实用化程度,还需要解决很多问题,其中最关键的问题之一,就是如何在大量集外话者存在的情况下提高系统对集外话者的拒识性能。 对于大量集外话者存在的问题,本文采用高斯混合模型-通用背景模型(Gaussian Mixture Model-Uniform Background Model, GMM-UBM)对说话人建模,以此为基础从说话人集内外分类和说话人确认两个方面研究如何减少系统对集外话者的误识。在说话人集内外分类方面,利用基准说话人识别系统收集的误识数据集和所有目标说话人的训练数据,采用最大化后验概率(Maximum A Posterior Probability, MAP)自适应方法,分别从UBM自适应得到集外模型和集内模型,根据测试语音在集内集外模型的得分进行集内外分类;在说话人确认方面,分别利用冒认者模型和语音特征变化统计量进行确认。冒认者模型是用基准系统收集的该说话人的全部误识数据从UBM自适应来的。语音特征变化统计量确认是本文提出的一种新的说话人确认方法,其主要利用了说话人的特征变化规律,计算目标说话人特征变化统计量,根据测试语音与说话人训练语音统计量的相似度进行确认。为了更进一步地提高系统的拒识性能,本文还采用了多种拒识方法融合的策略。 实验结果表明集内外分类、冒认者辨识和特征变化统计量确认都能很好地提高系统的拒识性能,其中特征变化统计量确认方法不但可扩展性好,而且拒识效果最好,当召回率为95%时,错误接受率降低为基准系统的9%。三种拒识方法结合使用的效果最好,当召回率为95%时,错误接受率降低为基准系统的1.2%。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。