尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法.聚类的应用是非常广泛的,无论是在商务上,还是在市场分析、生物学、Web文档分类等领域中都得到了充分的应用.目前,聚类算法大体上分为划分的方法、层次的方法、基于... 展开 聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法.聚类的应用是非常广泛的,无论是在商务上,还是在市场分析、生物学、Web文档分类等领域中都得到了充分的应用.目前,聚类算法大体上分为划分的方法、层次的方法、基于密度的方法、基于网格的方法和基于模型的方法.这些算法存在如下的问题:符号属性问题、算法的效率问题、初值的选择问题、对输入顺序的敏感性问题、最优解问题、算法对输入参数的依赖性问题.K-means算法是一种基于划分的聚类算法,它把n个对象划分成K个类,其中的聚类数目K是输入参数.该算法是通过不断地迭代来进行聚类,当算法收敛到一个结束条件时,就终止迭代过程,输出一个聚类结果.但是由于K-means算法在选择初始聚类中心时是随机选取K个点,因此,一旦这K个点选取不合理,将会误导聚类过程,得到一个不合理的聚类结果.该文在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,进行类中心的搜索.从实际应用中可以发现,改进后K-means得到的聚类结果更加稳定,对初始聚类中心的依赖性减弱了.最后,作者将改进后的聚类算法应用到作者实习的公司开发的日志分析系统中,对人员上网的日志数据进行聚类,验证改进算法的有效性和正确性. 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。