尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 词义消歧(WordSenseDisambiguation,简称WSD)是自然语言处理领域的一个基础性任务,其根据歧义词所在的上下文语境而判断其正确词义。词义消歧的效果,对于机器翻译、文本分类、语音识别和信息检索等多个下游任务具有重要影响。词义消歧方法主要分... 展开 词义消歧(WordSenseDisambiguation,简称WSD)是自然语言处理领域的一个基础性任务,其根据歧义词所在的上下文语境而判断其正确词义。词义消歧的效果,对于机器翻译、文本分类、语音识别和信息检索等多个下游任务具有重要影响。词义消歧方法主要分为基于知识库的词义消歧方法和有监督的词义消歧方法。基于知识库的词义消歧方法通常根据上下文中的词汇信息,如词汇的词性、词义等知识,来推断词语的词义。尽管基于知识库的词义消歧方法具有较高的消歧覆盖率,但是其效果往往不如有监督的词义消歧方法。有监督的词义消歧方法通过将词义消歧任务转换成分类任务,将带有标注的语料库作为训练数据,使用有监督的算法学习上下文和词义注释之间的关系来进行词义消歧。有监督的词义消歧方法之间最大的区别并不是它们的模型架构,而是它们使用外部知识的方式。然而,现有工作往往存在简单且粗暴地利用词义注释和其他外部知识的情况。鉴于此,本研究期望通过使用深度学习方法来挖掘并利用词义注释和其他外部知识中的有效信息,以提升词义消歧方法的性能。 本文的贡献主要体现在以下三个方面: (1)针对现有方法无法充分利用上下文和词义注释之间相互关系的问题,本文提出了基于文本匹配技术的词义消歧方法。该方法通过构建上下文-词义注释文本对,将上下文与目标歧义词的所有候选词义注释进行匹配,从而将词义消歧任务转换为文本匹配任务。最后,通过判断同一文本对中上下文与词义注释之间的匹配程度来确定目标词的正确词义。实验结果表明,该方法可以有效挖掘上下文与词义注释之间的交互特征,从而提高词义消歧模型的性能。 (2)针对现有方法仅简单粗暴地使用拼接的方式来利用多种外部知识的问题,本文提出了一种基于多知识交互的词义消歧方法。该方法设计了一个多知识交互模块,通过将例句知识与词义注释进行交互,捕捉两者之间的关系以达到增强词义注释表示的目的。最后,通过计算目标歧义词分别与词义注释和例句中目标歧义词之间的相似度得分来确定目标歧义词的正确词义。实验结果表明,该方法可以捕获多种外部知识之间的交互特征,并以此提高词义消歧模型的性能。 (3)针对现有方法忽略同一上下文中不同目标歧义词之间相互关系的问题,本文提出了一种基于记忆增强机制的词义消歧方法。该方法设计了一种有效的记忆增强机制,通过存储同一上下文中其他歧义词消歧后的词义注释与目标歧义词的表示进行交互,来增强目标歧义词的表示。最后,通过计算目标歧义词与其候选词义注释的相似度得分,以达到对歧义词进行消歧的目标。实验结果表明,该方法能够有效利用同一上下文中已识别歧义词的表示来增强当前目标歧义词表示,从而提升词义消歧模型的性能。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。