尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 伴随 INTERNET 网的普及,人们进入了一个信息爆炸的时代,如何从这些海量信息里快速、准确得到自己需要的信息,成了一个迫切需要解决的问题。文本分类是解决该问题的一个关键所在。本文的主要目标,就是结合软计算方法改进现有的文本分类方法。 ... 展开 伴随 INTERNET 网的普及,人们进入了一个信息爆炸的时代,如何从这些海量信息里快速、准确得到自己需要的信息,成了一个迫切需要解决的问题。文本分类是解决该问题的一个关键所在。本文的主要目标,就是结合软计算方法改进现有的文本分类方法。 文章共分五个部分。在绪论中介绍了文本分类问题的研究背景及意义、介绍了现有的文本分类系统的特点、国内外在文本分类问题上的研究现状和不足之处、文本分类系统的应用价值、并创新性的提出用软计算方法对文本分类问题进行优化研究。第二章主要介绍了文本分类的概念、目前常用的文本分类方法:比如简单向量距离算法、朴素贝叶斯、神经网络算法,K近邻(k Nearest Neighbors,简称:KNN)和支持向量机(Support Vector Machine,简称SVM)等进行了介绍和分析,为后续章节的研究提供了理论和实验基础。第三章对软计算方法进行介绍、深入探讨了针对文本分类系统具有复杂性、非线性、不确定性的特征、结合人工神经网络自学习自适应处理能力、模糊系统的专家处理、遗传算法的优化计算等特点。第四章是基于软计算方法改进的文本分类算法设计,算法思路为:用传统文本分类方法提取特征项,用神经网络根据特征项形成规则,再用遗传算法对规则进行筛减,得到基于软计算的文本分类系统。第五章是本文实证部分,结合具体数据验证该方法,证实其良好的分类性能,并对本文研究的不足以及有待进一步研究的问题进行说明。 本文在研究传统分类算法和遗传算法、人工神经网络的基础上,提出一种文本分类的改进算法,称为FNN-GA-KNN/SVM算法,并用MATLAB语言实现核心算法,C++语言实现成文本分类系统。该系统经实例分类讨论后,证明较原算法而言,有更高的分类准确率,且正确率都达到了85%以上,有较强的使用价值。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。