尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 在信息化、智能化的时代背景下,随着各式各样数据的不断增加,人工智能技术已经对人们的生活产生了深远的影响,而利用自然语言生成文本问题是当下人工智能领域的热点之一,例如利用该方法已成功解决摘要提取、信息检索和文本风格转换等问题。现阶段... 展开 在信息化、智能化的时代背景下,随着各式各样数据的不断增加,人工智能技术已经对人们的生活产生了深远的影响,而利用自然语言生成文本问题是当下人工智能领域的热点之一,例如利用该方法已成功解决摘要提取、信息检索和文本风格转换等问题。现阶段,生成对抗网络是解决生成问题的主流方法之一,其已成功应用于解决图片生成问题,而利用该方法解决文本生成问题的研究成果相对较少,但是生成对抗网络在文本生成方面已经展现出了优异的性能。在利用生成对抗网络进行文本生成任务时,生成器的输出精度影响着生成结果,而文本数据的离散型特点,制约了生成器的输出精度。另外在生成对抗网络的训练过程中,生成器聚焦于局部语义信息的获取,出现生成的文本不够流畅、质量不高、多样性不丰富等现象。对于上述存在的问题,本文提出了改进的生成对抗网络文本生成模型,主要工作内容如下: 一是为解决离散型变量影响生成对抗网络生成器输出精度的问题,本文提出了一种改进的生成对抗网络模型LFMGAN,在该模型中设计了一个Loss函数,判别器利用Loss函数得出的Loss值指导生成器进行优化,使得生成器生成的文本尽可能接近真实文本,让生成器不再只关注某个生成的单词和目标单词是否一致,转而让模型关注整体的生成结果是否合理,促使生成器生成的样本语义分布与原始的样本语义分布更加接近,即让生成器向语义相似度高的方向进行迭代,避免了离散型变量带来的精度影响。本文生成对抗网络的生成器和判别器分别采用GPT-2和RoBerta模型,并使用BLEU、ROUGE和METEOR评价指标与基础模型MaliGAN模型和LeakGAN模型以及基线模型MLE进行了对比。通过在Image_COCO数据集、EMNLP2017WMTNews数据集和《唐诗三百首》数据集上完成的验证和对比实验表明,本文提出的生成模型优于其它对比生成模型,生成的结果合理、文本质量有所提高。 二是由于LFMGAN模型的生成器使用贪心搜索解码策略输出文本结果,使得生成的文本存在多样性不足的问题,模型在全局语义信息获取方面表现不佳。本文通过使用集束搜索解码策略优化LFMGAN模型,选取集束宽的大小为4,既能有效降低计算复杂度、提高学习效率,同时能够有效关注全局语义信息,能够进一步提升文本的多样性与质量。为验证全局语义信息获取的效果,采用了上述实验相同的数据集和评价指标与LFMGAN模型进行了对比,实验结果表明,通过关注全局语义信息,增加生成文本的多样性,评价指标结果有所提升,进一步说明了该模型的有效性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。