尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 自动文摘是指通过计算机对文本信息进行一定处理,提取原始文本信息中的中心内容或对用户有价值的内容。自动文摘为人们提供了一个简洁和高效的获取信息的途径。 本文提出了一种基于句子权重和篇章结构的自动文摘算法。首先,通过句子信息统计算法... 展开 自动文摘是指通过计算机对文本信息进行一定处理,提取原始文本信息中的中心内容或对用户有价值的内容。自动文摘为人们提供了一个简洁和高效的获取信息的途径。 本文提出了一种基于句子权重和篇章结构的自动文摘算法。首先,通过句子信息统计算法,在基于游标的截取字符分旬算法的基础上,实现对文章句子信息的精确统计,不仅可以获得句子长度和句子位置等基本信息,还可以在对句子信息进行统计的同时获得文章内容的基本结构划分。然后,在对词语和句子信息进行精确统计以及对篇章结构进行划分的基础之上,细化和改进了词语评分公式和句子权重计算公式,使得自动文摘算法能够获得一个更有价值的候选文摘句排序结果。最后,在抽取文摘时,引入了基于分层的句子相似度计算方法,使得抽取的文摘句子具有较小的冗余度和相关性。除此之外,在进行文摘抽取时,用户还可以根据自身喜好,设置用户偏好词,从而对文章摘要进行更有针对性的抽取。 实验结果表明,采用本文提出的方法生成的自动文摘在准确率和召回率上均优于大多数同类型的算法以及Word自带的摘要生成工具,完全可以为用户提供良好的自动文章摘要。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。