尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着保险体系的完善,四险一金领域的政策法规文本数量每年都在增长,这些政策法规不仅数量庞大,而且所用语言逻辑复杂,对普通的非法律专业的人们群众来说,想要找到并理解自己所需的政策法规文本非常困难,因此急需一种针对四险一金领域的搜索引擎... 展开 随着保险体系的完善,四险一金领域的政策法规文本数量每年都在增长,这些政策法规不仅数量庞大,而且所用语言逻辑复杂,对普通的非法律专业的人们群众来说,想要找到并理解自己所需的政策法规文本非常困难,因此急需一种针对四险一金领域的搜索引擎来帮助检索所需信息,这种搜索引擎需要能够理解用户提出的各种问题,并根据问句,在知识库中检索对应的答案,要完成这些操作,就需要有知识图谱的支持,而要想使计算机真正理解一个句子,进而完成知识图谱的构建任务,需要对句子进行句法分析,句法分析的方法有很多种,如短语结构句法分析和依存句法分析等,在本文所研究的依存句法分析相较于短语结构句法分析具有易于理解、便于词性标注、形式简洁清晰等优势。本文提出了一种以pointer-net神经网络模型为基础改进的依存句法分析方法,并用该方法实现了为四险一金领域政策法规中的句子构建依存句法树。传统的依存句法分析方法只关注分析栈中的中心词,以它作为决策时的依据,为此,本文提出利用TreeLSTM对每一个时间点形成的依存子树进行编码后输入模型中进行训练,用它代替原方法中的中心词作为对下一步决策判断的特征。最终达到提高依存句法分析精度的目的,对依存句法分析得到的结果我们可以对其进行剪枝操作帮助实现四险一金领域政策法规文本的术语提取等上层应用。 本文的研究主要从以下四个方面展开: (1)提出了一种通过pointer-net神经网络模型进行依存句法分析的方法,本方法区别于传统的基于转移的依存分析方法,在决策时并没有对转移动作进行决策,而是考虑到依存句法分析问题与pointer-net所解决的凸包问题的相似性,即输出都严重依赖于输入,直接使用pointer-net网络和打分函数从输入的词语中选择出合适的依存词。 (2)使用TreeLSTM对依存分析过程中生成的依存子树进行特征提取,在传统的依存分析方法中对依存分析过程中产生的依存子树,只考虑了根节点位置的中心词特征,而忽略了整个依存子树的整体结构特征,TreeLSTM的结构很好的拟合了依存子树的结构,对特征提取的丰富度有一定提高。 (3)针对四险一金领域政策法规文本中专业术语较多的问题,在预训练阶段,我们采用了字串向量编码的方式,将被标注为集外词的词语按字进行编码,将得到的字向量进行算数平均,得到的向量作为该集外词的词向量。这种方法可以将四险一金政策法规语料中众多的集外词分别进行编码,而不是统一使用集外词编码。有助于集外词中语义特征的提取。 (4)对上述提出的方法进行试验验证,证明了本文中提出的pointer-net和TreeLSTM相结合的依存句法分析方法在四险一金领域知识图谱的应用背景下具有有效性与优越性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。