尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着人工智能的发展,人们对机器的智能化研究更加深入,使机器具备和人一样的情感和思维是人机交互的重要难题。语音情感识别是情感识别领域中很重要的分支,在科学研究和商业应用这两个方面都存在很大的潜在价值。 根据语音情感识别的科研与商业... 展开 随着人工智能的发展,人们对机器的智能化研究更加深入,使机器具备和人一样的情感和思维是人机交互的重要难题。语音情感识别是情感识别领域中很重要的分支,在科学研究和商业应用这两个方面都存在很大的潜在价值。 根据语音情感识别的科研与商业需要,本文基于特征选择和优化研究了语音情感识别这个课题。具体研究内容如下: 提取语音中与情感相关的特征。包括四个韵律学特征:语速、基音频率、短时平均能量和短时平均过零率,一个音质特征:共振峰频率,以及一个频谱相关特征:梅尔频率倒谱系数。并获取了上述特征的统计参数。 研究了基于随机森林的语音情感特征选择算法。根据提取到的语音情感特征,研究了几种情感相关特征对不同情感语音的识别准确率。根据基于随机森林的特征选择算法,得到四种情感语音的最优特征组合,对四种情感两两组合获得的六种情感组合,针对每种情感组合得到其最优的特征组合。 研究了基于卷积神经网络的语音情感识别算法。首先,将MFCC与随机森林特征选择得到的特征组合起来作为输入特征,根据输入特征尺寸构建卷积神经网络模型,然后训练卷积神经网络,最终得到不同情感类别的语音的情感识别准确率。实验结果表明:使用卷积神经网络作为最终分类器时,本文的改进方法对四种情感语音的情感识别准确率相对于仅使用MFCC特征的方法提升了3.68%;当对四种情感两两组合时,语音情感识别率在78.80%到98.70%之间。本文的方法的结果均优于仅使用MFCC特征的方法。 研究了基于长短时记忆网络的语音情感识别算法。首先,将MFCC与随机森林特征选择得到的特征组合起来作为输入特征,构建长短时记忆网络模型,然后训练长短时记忆网络,最终对不同情感类别的语音进行识别。实验结果表明:使用长短时记忆网络作为最终分类器时,本文的改进方法对四种情感语音的情感识别准确率相对于仅使用MFCC特征的方法提升了1.14%;当对四种情感两两组合时,语音情感识别率在60.38%到87.14%之间。本文的方法的结果均优于仅使用MFCC特征的方法。 本文的研究成果可应用于人机交互、医学诊断和刑事侦查等多个方面。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。