尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 三元组到文本生成旨在将知识图谱三元组映射到描述其信息的文本,在普遍使用知识图谱作为信息数据存储的大数据时代下,三元组到文本生成技术不仅可以助力互联网数据分析以提高产能和效率,并且对于自然语言中的结构化与非结构化数据转换研究发展具有... 展开 三元组到文本生成旨在将知识图谱三元组映射到描述其信息的文本,在普遍使用知识图谱作为信息数据存储的大数据时代下,三元组到文本生成技术不仅可以助力互联网数据分析以提高产能和效率,并且对于自然语言中的结构化与非结构化数据转换研究发展具有重要的实际意义。从知识图谱生成文本是一项基本任务,任务的完成度取决于生成句子的质量以及对信息描述的准确性,以前的研究大多采用标准的序列到序列方法,这不可避免地无法捕获图结构信息。虽然已有学者针对这一问题制定了一些方法规则,但却不具备良好的领域通用性。同时,在神经网络中如何提高编码解码的准确性,以提高生成句子的忠实度和流畅性,仍然是在该任务中亟待解决的关键问题。针对以上问题,本文对图卷积神经网络展开了研究并融合了自然生成领域相关算法,在这些基础上做出了改进,提出了两种解决方案,同时在自构建的数据集上进行了实验验证。本文的主要研究内容如下: 1)针对如何提高模型编码图信息的问题,本文研究将卷积神经网络作为模型的编码器来替代一般的线性化编码器,以保留输入图本身的结构信息,同时提出一种图增强规划算法(GEP),该算法将输入三元组中的每个关系以及单词嵌入为一个新节点以增强图信息,并且降低了模型嵌入以及特征提取的难度。 2)在图卷积神经网络编码器的研究中,本文提出一种特征融合算法,通过串行的方式保留了全局结点编码与局部结点编码这两种编码计算方式的信息和优势。同时本文研究将图卷积神经网络进行多层堆叠以获取更深层的特征表达,通过加入紧密连接的方式保证模型在训练过程中的梯度稳定和隐藏状态信息传递。 3)在针对如何获取更高质量的生成文本问题中,本文对解码器进行多种算法集成改进,将上下文门集成到LSTM网络中,以在隐藏状态更新过程中保留上下文信息,从而确保忠实于原始含义。同时,本文在解码器中添加了复制注意力和惩罚机制,以解决词汇表外(OOV)问题并提高生成句子的质量。 本文在英文数据集WebNLG以及自构建的中文海洋产业数据集上对模型进行了性能验证。大量实验表明,本文提出的模型方法可以有效地从图结构输入中生成高质量的文本,并在四个自动指标中获得高分,同时在消融实验中也证明了本文所提出的算法的有效性,能够有效地提升三元组到文本生成任务的性能。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。