尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着电商行业以及各类社交媒体的蓬勃发展,大量用户在互联网平台上发表了产品评论。社交媒体平台的兴起为情感分析任务提供了广泛的数据基础。使用自然语言处理技术对网络上的评论数据进行合理处理具有巨大的商业价值和社会价值。基于此,本文以特定... 展开 随着电商行业以及各类社交媒体的蓬勃发展,大量用户在互联网平台上发表了产品评论。社交媒体平台的兴起为情感分析任务提供了广泛的数据基础。使用自然语言处理技术对网络上的评论数据进行合理处理具有巨大的商业价值和社会价值。基于此,本文以特定领域的评论文本作为研究对象,对该任务进行重点研究。 由于网络中的情感表达或含蓄或奔放、或笼统或具体,各具特点,故而情感分析任务成为自然语言处理中一项较为复杂的问题。现阶段的情感分析系统大多通过标签数据训练神经网络模型,忽略了情感分析任务本身的特性,导致了以下几个问题:第一,用户的情感表达在面向不同领域时通常具有不同的特点,而领域特征却常常被忽视,没有得到充分的利用;第二,人类的语言表达通常既简洁又丰富,许多隐藏在句子中的信息人类不言而喻,然而网络中的评论语句却不会对这类知识进行补充说明,因此很难实现机器对人类语言的充分理解;第三,传统的情感分类框架仅仅编码了评论语句的文本语义信息,忽视了句法结构信息,但句法特征也能够为情感分类模型提供参考。 针对以上不足,本文分别从领域特征的利用、先验知识的引入两个角度进行深入探究,以实现现阶段情感分类研究的知识增强。同时,本文在两种研究方案中都引入了句法依赖信息以及评价对象与上下文之间的交互关系,使得情感分类模型的整体性能得到了有效提升。具体来讲,本文的主要工作如下: (1)本文在解决细粒度情感分类问题时,首先针对现有的词向量模型没有对特定的领域进行优化的问题,提出了通过卷积神经网络将评论文本的通用表示与其领域特征进行融合的策略,实现了通用表示与领域特征的双嵌入。其次为了解决通用的文本表示方法无法获取与词语相关的概念知识与背景知识的缺陷,本文通过引入MicrosoftConceptGraph中的实体概念知识,改进了词向量的特征表达能力,提高了特征的多样性。实验结果表明,领域特征和实体概念等先验知识可以有效提升模型的分类结果。 (2)在编码过程中考虑词性信息与评论语句的句法结构是增强知识的另一种渠道。本文通过依存句法分析获取了文本中的词性信息以及词与词之间的句法关系,将单词作为节点、词与词之间的关系作为连边,构建了依存句法图。在词表示阶段后的特征抽取框架中,本文通过图卷积网络充分提取了文本的词性和句法信息,同时也考虑了评价对象与上下文的交互作用对该任务的重要影响。相关实验结果证明句法依存关系对细粒度情感分类任务有着积极的影响。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。