尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着信息技术的快速发展,特别是计算机技术的不断普及,“数据丰富而信息贫乏”这一矛盾显得日益突出,数据挖掘技术正是迎合了这一需求,同时结合数理统计、人工智能、神经网络和信息技术等学科出现的一项新技术,并得到了迅速发展。数据挖掘的主要目... 展开 随着信息技术的快速发展,特别是计算机技术的不断普及,“数据丰富而信息贫乏”这一矛盾显得日益突出,数据挖掘技术正是迎合了这一需求,同时结合数理统计、人工智能、神经网络和信息技术等学科出现的一项新技术,并得到了迅速发展。数据挖掘的主要目的是从数据集中发现隐含的、事先未知的和用户感兴趣的知识。作为一种有效的数据分析技术,近年来分类(Classification)已成为数据挖掘领域中的一项重要研究内容,并广泛应用于商业、电子商务、基因工程和医学等诸多领域。 复杂网络作为一门新兴学科,在不同的领域(如生态、人口、经济、社会、地理、军事、医学)中有着很强的应用背景,倍受广大学者的青睐和关注,已成为一个充满生命力的交叉研究领域。一切事物都是相互作用的表现,大多可以通过复杂网络来表现,如物理学研究物体间最基本的相互作用;化学研究分子间的相互作用;生物学研究基因、蛋白质以及生物体之间的相互作用;社会科学研究人和各种人类组之间的相互作用;分类问题研究数据点之间的相互作用。因此,事物作为系统,其结构可以抽象为网络,各类作用体抽象为网络节点,各种相互作用抽象为节点之间的连接线或边。基于这种思想,本文将数据集按照某种度量抽象成为复杂网络,结合复杂网络的理论、成果和已有的某些分类、聚类方法对数据挖掘分类问题进行了相关研究,提高了对大型数据库中的数据进行分类的能力,具有一定的研究价值。 复杂网络的社团探测与数据挖掘中分类、聚类问题在本质上是一样的,因而社团探测的研究和分类问题的研究在某种角度上是一脉相承的。 本文在复杂网络的基础上,对分类问题做了以下三个方面的工作: 提出了一种基于K-means聚类算法的复杂网络社团结构划分方法,丰富和发展了复杂网络社团探测理论和方法。算法基于Fortunato等人提出的边的信息中心度,定义了节点的关联度,并通过节点关联度矩阵来进行聚类中心的选择和节点聚类,从而将复杂网络划分成K个社团,然后通过模块度来确定网络理想的社团结构。该算法时间复杂度为线性的,适合大型网络的社团发现。通过Zachary Karate Club和CollegePootball Network两个经典模型验证了该算法的可行性。 遗传算法作为一个成熟的理论,在分类方面有着很大优势,结合复杂网络的部分新理论和遗传算法的思想,提出了一种新的分类方法。该方法将数据集按给定的相似度公式构造出具有社团结构的网络,在此网络的基础上用遗传算法的思想进行分类。算法引进社团模块度作为适应度函数,并且提出了节点归类错误率(NCM)对每次迭代产生的解进行纠错,提高了分类质量和速度。实验证明该方法在分类精度和分类速度方面都非常理想,并可实现并行性,将遗传算法的优点发挥到极致。 医学图像分类对实现智能化诊断系统有着重要的实际意义,是典型的分类挖掘问题之一,同时也是一个热点的应用研究课题。为了建立高效的肿瘤自动诊断系统,克服因医学MIR图像的复杂性带来的直接从图像中看出肿瘤及良、恶性质的困难,结合复杂网络的部分理论成果和K-means聚类算法的思想,提出了基于加权复杂网络聚类的医学图像分类器。该分类器对医学图像进行预处理,建立图片特征库,构建图片加权复杂网络,在此基础上根据网络节点的加权网络特征值和连接度选取初始聚类中心进行聚类,有效地克服了传统K-means聚类算法对初始化选值敏感性的问题,从而大大提高了分类精度。通过对某医院PACS系统中的部分MIR脑部图片进行分类,表明了该方法的分类精度比传统的K-means聚类算法平均提高了8%左右。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。