尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 机器翻译是自然语言处理领域的核心研究方向。随着深度学习技术不断发展,神经机器翻译技术在大规模平行语料、端到端大模型和充足计算资源的共同推动下取得了突破性进展。尽管神经机器翻译模型在标准数据集上表现出优秀性能,但在朝汉神经机器翻译领... 展开 机器翻译是自然语言处理领域的核心研究方向。随着深度学习技术不断发展,神经机器翻译技术在大规模平行语料、端到端大模型和充足计算资源的共同推动下取得了突破性进展。尽管神经机器翻译模型在标准数据集上表现出优秀性能,但在朝汉神经机器翻译领域仍存在一些亟待解决的问题。本学位论文针对朝汉翻译任务中朝鲜语低资源、曝光偏差、译文多样差三个问题,研究了基于强化学习和质量评估的朝汉神经机器翻译方法。 首先,针对朝鲜语资源匮乏导致译文质量评估困难的现状,提出了基于跨语言预训练模型的质量评估模型。该模型借鉴注意力思想采用一种融合跨语言信息的句子嵌入方法,分别从语言学注意力和词项注意力两方面对跨语言信息进行关注。该方法缓解了朝鲜语小样本带来的质量评估困难,增强了跨语言句子编码的表征能力。 其次,针对曝光偏差问题,使用强化学习方法指导翻译模型训练,避免使用主流教师强制的训练策略。在训练过程中神经机器翻译模型作为强化学习的智能体,通过不断与环境进行交互接收奖励,决策出最佳翻译目标句。 最后,针对机器翻译译文多样性差的问题,将质量评估模型引入到翻译任务中。在神经机器翻译模型解码的每个时间步,使用质量评估模型对源句和生成译文片段进行评估,并将强化学习奖励函数设置为BLEU值和QE评估得分的组合,使得模型在快速收敛的同时有效增加了翻译多样性。 本文提出的翻译质量评估模型与质量评估任务领域的主流模型QuEst++、Bilingual Expert和TransQuest相比,皮尔逊相关系数分别提升了0.226、0.156和0.034,斯皮尔曼相关系数分别提升了0.123、0.038和0.026。本文提出的朝汉神经机器翻译模型QR-Transformer与Transformer相比,朝-汉两个语向BLEU值分别提升了9.3和5.63,QE分数分别降低了7.33和5.97。在翻译多样性方面,QR-Transformer与经典beam-search模型相比,P-BLEU值最多下降了14.47。实验结果表明,本文提出的翻译质量评估模型和朝汉神经机器翻译模型有效提升了对应任务的性能,在朝鲜语低资源、曝光偏差和译文多样性方面均做出了显著改善。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。