尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着社会的不断发展,信息呈现爆炸式增长,同时由于人力成本的逐年上升,因此对于从大量文本中快速获取文本信息并帮助总结文本的能力便成为了相关工作人员迫切需要的一个的需求。而随着深度学习技术的不断发展,自然语言处理技术也得到了不断的发展... 展开 随着社会的不断发展,信息呈现爆炸式增长,同时由于人力成本的逐年上升,因此对于从大量文本中快速获取文本信息并帮助总结文本的能力便成为了相关工作人员迫切需要的一个的需求。而随着深度学习技术的不断发展,自然语言处理技术也得到了不断的发展,特别是使用自然语言处理处理摘要和文本改写方向更是成为了研究热点。 基于以上背景,本文设计与实现了一套基于BERT的辅助阅读系统,能够有效地辅助用户获取原文重要信息,同时生成一份总结概括示例。本文对辅助阅读系统的实际需求与工作流程做了详细的分析与介绍。 系统的实现存在着许多挑战,面对不同的挑战,本文首先使用了更加细粒度的句子拆分,使摘要的最小单位变得更小,因此结果也就更加准确;本文采用了BERT这个目前最为流行的语言模型作为文字表示模型。首先使用微调后的BERT生成句子表示,通过一个改进后的CNN——DGCNN来判断是否为摘要句,随后使用NEZHA来改写摘要,作为源文本的改写总结。本文还使用了Elasticsearch+模型模糊生成的混合策略来完成模糊检索的功能。最后采用SpringBoot、Mysql、Elasticsearch等开发技术完成系统的开发。系统划分为5个核心模块,摘要生成模块用于获取用户上传文本的抽取式摘要;数据管理模块用于管理和维护后台数据;文本改写模块用于将摘要重新改写成连贯的总结;自动标签系统用于为文本智能打标签以方便用户查看;智能检索模块负责混合检索关键词,为前端返回最合适的搜索结果。 本系统能够帮助用户快速的获取目标文本的核心句并给出文本对应的标签,并给出一个改写总结。减轻了用户阅读大量本文以及二次创作的负担。系统以网页形式构建前端界面,贴合用户实际使用场景,提供了人性化的交互方案,能够显著提高用户的工作效率。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。