尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 离群点检测技术是数据挖掘领域的一个重要研究分支,其在入侵检测、欺诈检测和医疗卫生检测等领域发挥着重要的作用。近年来,国内外学者提出了众多离群点检测方法,但是这些方法都存在着各种缺陷,在很多数据集上存在检测精度不佳的问题,因此本文针... 展开 离群点检测技术是数据挖掘领域的一个重要研究分支,其在入侵检测、欺诈检测和医疗卫生检测等领域发挥着重要的作用。近年来,国内外学者提出了众多离群点检测方法,但是这些方法都存在着各种缺陷,在很多数据集上存在检测精度不佳的问题,因此本文针对现阶段的离群点检测方法存在的问题进行研究,提出了新的离群点检测方法。 首先,针对基于近邻关系的离群点检测方法存在边界区域点检测精确度不高和内部点计算耗时的问题,提出了一种基于近邻差波动因子的离群点检测新方法。该方法依据离群点的相互近邻点数远小于k近邻点数这一特点,给出了一种基于近邻关系的剪枝方法;定义近邻差的概念来刻画数据对象与其邻居点的分布特征,在变化的参数k下,离群点和内部点的近邻差的变化不同,采用近邻差波动衡量每个数据点的离群程度,进而检测出离群点;并对所提算法进行正确性和时间复杂度的分析。 其次,针对基于图标签传播的离群点检测算法存在只能检测聚类离群点和参数k难以确定等问题,提出了一种基于局部信息图标签传播的离群点检测新方法。算法依据相互近邻关系,设计了一种自适应参数k值的计算方法;利用参数k和近邻关系构建局部近邻图,生成局部相似性矩阵和转移概率矩阵,再循环标记每个数据点,对每个数据点进行有限次的标签传播,离群点和内部点标签传播收敛速度不同,统计每个点的收敛值差;将数据点的收敛值差和相互近邻个数相结合作为离群因子,刻画数据对象的离群程度,进而检测到离群点;并分析了所提算法的正确性和时间复杂度。 最后,以精确率、召回率和AUC值为评价指标,在人工数据集和真实数据集上对所提算法和其它几种算法进行实验对比,验证了本文所提算法的有效性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。