尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 知识库HowNet将义原定义为单词或短语的最小语义单位。语言学家已经付出了许多努力来手动标注词汇的义原信息。尽管已经提出了自动化的方法来帮助解决这个劳动密集型和耗时的手动标注问题,但是这个领域还不够成熟,只有很少的模型被提出来自动求解词... 展开 知识库HowNet将义原定义为单词或短语的最小语义单位。语言学家已经付出了许多努力来手动标注词汇的义原信息。尽管已经提出了自动化的方法来帮助解决这个劳动密集型和耗时的手动标注问题,但是这个领域还不够成熟,只有很少的模型被提出来自动求解词汇的义原信息,并且一些输入信息和义原之间的结构没有被充分利用。随着社会不断发展,词汇库不断增长,很多词汇的语义也在不断变化(包括增加新的语义,原语义变成新的语义等)使得手动标注词汇义原信息变得不可能。面对这个状况,本文提出两个基于深度学习的模型解决现有的问题。 首次,本文提出了基于句子嵌入和汉语字典进行义原预测的模型(SPSECD),SPSECD是一个在统一模型中实现句子嵌入和义原预测的端到端深度神经网络。SPSECD是第一个在义原预测任务中对多义词的不同语义进行分开处理的模型。在预测义原之前,该模型添加了词汇在汉语词典中的释义,并且我们使用循环神经网络(RNN)来学习句子的嵌入。在字典辅助信息的帮助下,我们的模型可以识别出多义词所关注的词的语义,因为在汉语词典中,词的不同语义有不同的释义,因此我们的模型可以为一个词语选择更好的义原。 然后,在SPSECD模型的基础上,本文做了一些改进,提出基于循环神经网络和卷积神经网络双通道的义原预测模型(RNN-CNN-SPSECD)。循环神经网络和卷积神经网络双通道结构用来提取句子特征,进而提升义原预测效果。卷积神经网络(CNN)能够有效提取句子的n-gram特征,将其用于汉语词典释义的句子特征提取能够达到良好的效果。 最后本文在知识库HowNet上面验证模型效果,结果表明SPSECD模型和RNN-CNN-SPSECD模型都能够显著提升义原预测结果的MAP。双通道方法提取出来的句子特征比仅用循环神经网络结构要有效,实验结果支持了这一结论。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。