尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着互联网的发展,各种具有社交功能的互联网平台也应运而生,网民在互联网上所产生的文本数量迅速增长,形成了微博、博客、新闻等多种形式的文本信息。面对大量的、充满情感的文本,可以考虑通过挖掘这些文本的潜在价值为人们服务,准确地识别隐藏... 展开 随着互联网的发展,各种具有社交功能的互联网平台也应运而生,网民在互联网上所产生的文本数量迅速增长,形成了微博、博客、新闻等多种形式的文本信息。面对大量的、充满情感的文本,可以考虑通过挖掘这些文本的潜在价值为人们服务,准确地识别隐藏在文本中的情感,能够有效地监控、预警和疏导舆论,对于社会舆论生态的健康发展,具有十分重要的作用。本文提出了基于预训练和深度学习的互联网新闻情感分析模型RBLM将情感分为消极、中性、积极三类,并在此基础上构建了相应的文本情感分析系统。本文主要研究内容如下: (1)中文文本划分。本文所使用的实验数据平均每篇新闻1199个字符,而预训练模型RoBERTa最大输入512个字符,此外由于实验数据为中文文本,考虑到中文文本独有的特性即中文首尾多为文段重点且蕴含较为丰富和明确的情感,故将一篇新闻分为三部分分别输入到预训练模型中并进行词向量转换。 (2)基于深度学习构建互联网新闻情感分析模型。考虑到新闻文本情感表达较为客观中立且上下文之间联系密切等因素,本文提出在预训练模型(RoBERTa)基础上,通过双向长短期记忆网络(Bi-LSTM)和最大池化(Max-Pooling)融合构建深度学习模型RBLM以达到对互联网新闻情感进行有效分析,并通过一系列对比实验验证了该模型的性能较为优异。 (3)设计并实现了中文文本情感分析系统。基于研究的RBLM模型设计了一个中文情感分析系统。该系统可以完成对单文本和批量文本的情感分类,还可通过关键词搜索热点新闻并判断相关新闻的情感极性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。