尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近年来,人工智能技术发展迅速,人工智能技术的应用领域也不断扩展,如智慧城市、自动驾驶、内容分发和人脸识别等。自然语言处理领域同样也存在着诸多人工智能技术可以落地的场景,文本的自动生成就是其中之一。作为一项基础性工作,本文所研究的文... 展开 近年来,人工智能技术发展迅速,人工智能技术的应用领域也不断扩展,如智慧城市、自动驾驶、内容分发和人脸识别等。自然语言处理领域同样也存在着诸多人工智能技术可以落地的场景,文本的自动生成就是其中之一。作为一项基础性工作,本文所研究的文本生成模型可以作为一个模块未来应用于输入法、文本的特征提取、文本自动纠错等更多的任务上。 目前文本生成任务在学术上的研究主要集中在深度学习模型上,但实际产品中大多使用的仍然是基于模板的文本生成方法。造成这种研究与应用间差异的主要原因在于基于深度学习的文本生成模型还不够完善,对目标文本的模拟不够细致。但是文本生成模板的总结需要大量的人工辅助和先验知识,且只针对特定场景,扩展性不强。因而,对基于深度学习的文本生成技术进行研究更具有现实意义。为突破文本生成的技术瓶颈,本文提出了更加高效的文本生成模型,并在构建的文本数据集上对其效果进行了实验。 具体来说,本文的研究工作可以分为两个部分:一是对文本生成和图像生成两大领域进行了广泛调研,分析比对了单一网络与生成对抗网络框架的优劣。将生成对抗网络中的生成器网络与强化学习技术相结合构建了基础文本生成模型,解决了原始生成对抗网络模型无法处理离散型数据的问题。仿照机器翻译中的相关工作,设计了“相似度得分”指标来衡量文本生成的质量,并使用该指标将基础文本生成模型与传统的循环神经网络文本生成模型在超声检查报告数据集和长篇小说数据集上进行了实验对比。二是深入分析了基础文本生成模型的缺陷。针对蒙特卡洛搜索方法不足量采样导致实际回报函数具有较高的方差的问题和补全文本所需要的大量的采样运算导致模型收敛速度慢的问题,使用卷积神经网络对判别器网络进行了改进。同时,针对反馈信号不足导致强化学习训练的方向性不够明确的问题,采用将判别器网络与生成器网络共享文本特征提取层的方式进行了改进。在超声检查报告数据集和长篇小说数据集上,将改进后的文本生成模型与基础文本生成模型、循环神经网络文本生成模型以及相同领域下的RankGAN文本生成模型进行了对比实验。在两个是数据集上,改进模型都在“相似度得分”这一指标上取得了较好的结果。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。