尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 多音音乐歌声旋律提取在音乐内容分析、版权保护、哼唱识别等领域具有广泛应用,是音乐信息检索领域的一项重要研究课题。各科研院所与产业界研究人员已经针对此课题进行了深入研究,并取得了阶段性成果,然而现有研究仍存在一些问题有待深入研究。 ... 展开 多音音乐歌声旋律提取在音乐内容分析、版权保护、哼唱识别等领域具有广泛应用,是音乐信息检索领域的一项重要研究课题。各科研院所与产业界研究人员已经针对此课题进行了深入研究,并取得了阶段性成果,然而现有研究仍存在一些问题有待深入研究。 本学位论文根据音乐信号的谐波性和时序连续性特点,通过应用数字信号处理、图卷积神经网络、循环神经网络、统计学等理论与技术,对歌声旋律提取算法开展研究,主要工作如下: 1)提出基于图建模的轻量级歌声旋律提取算法 针对通用深度学习模型冗余参数多、可解释性差的问题。本文从音频信号频谱结构特点出发,提出构建无向图来建模音乐信号频谱,其中无向图的节点表示频谱中的节点,无向图的边表示频点之间的关联性。然后,利用对数频率刻度频谱中不同音高的基波与各次谐波具有相同相对位置的特点,构建具有平移不变性的图结构。最后,基于定义的图结构,采用图卷积神经网络逐帧估计旋律音高。本文所定义的邻接矩阵反映了基波和谐波之间的潜在连接关系,使算法具有可解释性。同时本文算法用极少的参数量取得了较好的性能,证实了提出算法的合理性与优越性。 2)提出图建模结合伴奏抑制的歌声旋律提取算法 针对在多音音乐中,乐器伴奏与歌声在时域与频域均相互叠加,乐器伴奏音对歌声旋律提取造成严重干扰的问题。本文提出图建模结合伴奏抑制的旋律提取算法,旨在通过抑制伴奏来提升歌声旋律提取效果。具体地,将歌声旋律提取分成两个步骤:首先,伴奏抑制部分,去除多音音乐中的伴奏分量,进而加强混合音频信号频谱中的歌声分量;然后,采用图建模的方式,对预处理后的音乐信号进行旋律提取。该方法在旋律提取前进行的伴奏抑制能有效提高混合音频信号的旋律-伴奏比,且后续的图建模方法能以较低的参数量获得较好的歌声旋律提取效果。实验结果表明,结合伴奏抑制的旋律提取算法可以提升旋律提取的正确率。 3)提出基于时序谐波图卷积网络的歌声旋律提取算法 针对基于图建模的歌声旋律提取结果常存在突变值,且量化误差使得歌声旋律呈阶梯状的问题,本文从音乐信号频谱具有谐波相关性和时序连续性出发,为增强提取频谱谐波信息与时序信息能力,提出基于时序谐波图卷积网络的旋律提取算法。该方法利用图建模进行输入频谱到旋律音高序列的映射,并引入门控循环单元(Gated Recurrent Unit, GRU)建模时序连续性,采用时序谐波图卷积网络同时建模谐波相关性与时序连续性。此外,该方法还通过构建细粒度显著度函数的方式对歌声旋律音高序列进行微调,在较高准确率的前提下还获得了平滑的歌声旋律轨迹。实验结果表明,该方法取得了显著优于其它参考算法的性能。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。