尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 现如今是一个科技高速发展、信息快速流通的社会,人与人之间的交流愈加密切,生活也愈加便利,各个领域都充斥着各种类型的数据信息。从这些数据之中提取有用信息,就需要分析这些数据。数据挖掘技术之中,聚类分析是分析工具的一种,并且一直受到数... 展开 现如今是一个科技高速发展、信息快速流通的社会,人与人之间的交流愈加密切,生活也愈加便利,各个领域都充斥着各种类型的数据信息。从这些数据之中提取有用信息,就需要分析这些数据。数据挖掘技术之中,聚类分析是分析工具的一种,并且一直受到数据挖掘领域的广泛关注,已经被应用于各个领域,包括图像识别、Web搜索、信息安全、商务智能等。K均值作为一种经典的聚类算法,是基于划分技术,具有原理容易理解、收敛速率快以及易于实现等优点,并且在对大规模数据处理过程中K均值聚类分析时效率比较高,因此在数据挖掘相关领域之中得到了较为广泛的运用。由于数据挖掘技术不断的创新发展,许多学者还将智能优化算法较好地应用到K均值之中。 混合蛙跳算法是进化计算领域兴起的一种新型智能优化方法,其由于理论容易理解、调整参数较少、计算速率高、全局寻优能力强、易实现等优点,而被应用于多个领域之中并取得了喜人的研究成果,在人工智能领域中已经成为了热门和重点之一。 本文针对K均值对于初始聚类中心的选择较为敏感、初始聚类中心选择的不同会造成差异较大的聚类效果等问题,提出了基于混合蛙跳算法的K均值的合并算法,具体工作如下: (1)简述了数据挖掘、聚类分析、K均值、混合蛙跳算法的相关概念,分析了两种算法的算法过程、相似性度量方法、优缺点等。 (2)提出一种改进的混合蛙跳算法。对混合蛙跳算法引入了随机分组思想。随着种群每一次的迭代进化进行一次随机分组,来达到先小组寻优后种群寻优的目的。并且该算法通过引入惯性系数来调节局部寻优的移动步长,进一步防止了算法陷入局部最优解的可能性,提高了混合蛙跳算法的全局寻优的能力。 (3)将改进后的混合蛙跳算法运用到改善后的K均值中,利用两种改进算法在数据集中各自寻优的优势,提高了原始算法的性能。本文选取所要聚类数据集中的每一条数据为一个青蛙,以簇内变差为目标函数,进行最优解的优化,最终使K均值在指定初始质心情况下进行聚类分析。 (4)运用基于随机分组的混合蛙跳算法的K均值的改进算法对我国近二十年内的国内生产总值、老年抚养比、少儿抚养比、人口出生率以及人口死亡率五项指标进行了数据聚类分析,根据聚类结果对每一项指标进行相关性分析,从而进一步分析所选五项指标相互之间的相关性,结果表明该算法具有良好的应用前景。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。