尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 在数据挖掘领域中,聚类分析是一项重要的研究课题.与分类不同,聚类的目标是在没有任何先验知识的前提下,根据数据的相似性将数据聚合成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大,因此又被称为非监督分类.聚类分析作为数据挖... 展开 在数据挖掘领域中,聚类分析是一项重要的研究课题.与分类不同,聚类的目标是在没有任何先验知识的前提下,根据数据的相似性将数据聚合成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大,因此又被称为非监督分类.聚类分析作为数据挖掘系统中的一个模块,既可以作为一个单独的工具以发现数据库中数据分布的深层信息,也可以作为其他数据挖掘分析算法的一个预处理步骤,因此研究如何提高聚类算法的性能具有重要的意义.目前,人们提出了很多种聚类算法.其中,典型代表是基于距离的聚类算法和基于密度的聚类算法.该文主要研究以k-means算法为代表的基于距离的聚类算法和以DBSCAN算法为代表的基于密度的聚类算法,探讨用来提高聚类性能的空间索引技术,在此基础上提出了基于四叉树索引的快速聚类算法QTCDBSCAN.该算法改进了DBSCAN算法扩展簇的方法,大大减少了区域查询的次数;在利用四叉树进行区域查询提高查询速度的同时,尽量压缩构造四叉树的时间,因而从整体上提高了聚类性能.为了测试各种聚类算法的性能,该文设计并实现了一个聚类实验系统CES.该系统可以方便地实现数据采集、聚类分析以及二维数据的可视化.实验验证了DBSCAN系列算法可以发现任意形状的簇,而k-means系列算法的执行速度非常快但是容易陷入局部最优解.实验表明新算法QTCDBSCAN是有效的,使用空间索引对提高聚类性能起到举足轻重的作用. 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。