尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着大数据应用的普及和互联网平台的快速发展,人们的信息获取和交流方式也随之发生了改变。在当今新媒体环境下,在线新闻文章逐渐取代了传统的报纸和杂志,网络新闻的实时发布和在线交流引起人们的广泛阅读与讨论,文章中所表达的主旨和观点对舆情... 展开 随着大数据应用的普及和互联网平台的快速发展,人们的信息获取和交流方式也随之发生了改变。在当今新媒体环境下,在线新闻文章逐渐取代了传统的报纸和杂志,网络新闻的实时发布和在线交流引起人们的广泛阅读与讨论,文章中所表达的主旨和观点对舆情控制和事件发展有着重要作用,如何快速及时地挖掘和了解新闻内容中的情感信息,快速感知热点事件的发展态势,对于信息决策者来说有重要意义。 由于新闻文本的信息量大且内容较多,当前用于短文本的情感分析方法无法准确地判断它们的情感倾向,因此为了提高篇章级文本的情感分析效率,本研究以新闻文本的情感分析为研究目标,结合词表规则、机器学习和深度学习技术及模型,提出了一种多策略融合的情感分析方法,首先识别和抽取新闻的核心关键句,然后基于关键句来判断文章的情感倾向,主要包括以下两个方面的工作: (1)改进关键句抽取模型。本研究从以下两方面对传统的TextRank算法进行了优化和改进:1)改进句子相似度计算的方法。利用Word2vec模型将文本向量化,通过计算句子向量的余弦相似度来衡量句子相似度;2)优化句子权重计算。考虑到新闻文本的特征,通过对句子和标题的相似度、句子位置、标点符号、线索词以及情感特征这5个影响因子的研究改进了句子权重的计算。 (2)利用BERT预训练语言模型进行情感分类。针对抽取得到的文本关键句,本文通过对BERT预训练语言模型进行微调来完成文本情感分类任务,也就是通过调整模型参数来优化分类结果,再利用数据增强、伪标签和集成学习等方法进行模型优化来提升分类性能。 通过实验对比分析,相较于传统的TextRank算法,使用本研究改进后的算法抽取的关键句更具有代表性,不仅提升了情感分类准确率,还提高了新闻文本的阅读效率。此外用BERT模型进行情感分类时的分类准确率远高于传统的机器学习和深度学习模型,情感分类的准确率和F1值达到85.72%和81.34%,相较于分类准确率较高的TextCNN模型,该模型的准确率和F1值分别提高了6.42%和9.61%。而且使用数据增强、伪标签与集成学习等方法进行模型优化后进一步提升了分类效果,准确率和F1值达到了86.83%和82.43%,验证了本研究中所提出的模型在情感分类上的有效性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。