尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近年来,互联网技术已趋于成熟,人们生活的方方面面都已经离不开互联网,越来越多人们开始在互联网平台上发表带有自己主观色彩的评论,这个文本信息能为商家和其他用户的行为提供指引,所以研究这些文本背后的情感倾向具有重要的实际意义,同时这些... 展开 近年来,互联网技术已趋于成熟,人们生活的方方面面都已经离不开互联网,越来越多人们开始在互联网平台上发表带有自己主观色彩的评论,这个文本信息能为商家和其他用户的行为提供指引,所以研究这些文本背后的情感倾向具有重要的实际意义,同时这些蕴含情感倾向的文本信息是研究情感分类任务的主体数据来源。情感分类任务已成为自然语言处理领域的研究热点,各种情感分类模型被提出,模型的分类性能也有了很大的提升。特别是最近BertGCN模型因其良好的文本分类性能而受到研究者的关注。 虽然情感文本分类任务的研究已取得了很大的发展,但仍然存在一些问题。在为基于GCN的模型构建异质图的时候,如果仅使用语料库中的原始文档,可能丢失一些有效信息。并且,原始数据集中类内文档相似度差异较大时,可能导致构建的文档节点相比于其他类的文档节点没有区分度,进而无法准确进行待测文本的分类。因此,本文构建了一个基于跨文档学习的三流BertGCN情感分类模型。首先,本文提出了一种针对训练集文本的处理方式:计算训练集文本的类内相似度;根据类内相似度将文档进行组合,得到了组合文档(CD)。这样得到的组合文档类内相似度差异较小,各类文档之间具有较强的区分度;同时这种处理方式,将数据进行了跨文档的组合合并,实现了数据增强,更加充分地挖掘了文本信息。其次,将上述跨文档学习过程(文本相似度计算、依据相似度进行文档组合)重复进行三次,得到了三组组合文档。根据得到的组合文档构建模型异质图,训练得到多个单流BertGCN模型。最后,将多个单流BertGCN模型进行了模型融合,得到了最终的多流BertGCN模型,通过模型融合进一步提高了模型的分类性能。 为了验证模型性能,选取了两个数据集(MR和SST)进行测试,并将本文提出的模型与一些典型、先进的模型(比如,基于CNN的模型、基于RNN的模型、图模型和BertGCN模型等)进行了对比,实验结果表明,在这两个数据集上,本文提出的模型有更高的准确率,表明模型具有更好的分类性能。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。