尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 在大数据时代,海量的高维数据更加频繁的进入我们的日常生活中。社会信息化程度提高为我们带来便利的同时,也使传统的数据挖掘方法面临冲击。在处理高维数据时,传统数据分析方法往往会遭遇“维数灾难”,解决该问题的有效途径是先对原始数据进行维度... 展开 在大数据时代,海量的高维数据更加频繁的进入我们的日常生活中。社会信息化程度提高为我们带来便利的同时,也使传统的数据挖掘方法面临冲击。在处理高维数据时,传统数据分析方法往往会遭遇“维数灾难”,解决该问题的有效途径是先对原始数据进行维度约简,再对约简后的数据进行分析。维度约简可以有效地在保留关键信息的同时降低原始数据空间的维度,然而,伴随着技术的发展,采集到的数据从规模和复杂程度上都已经将要超出传统方法所能处理的范畴,经典算法的性能难以发挥,表现不尽人意。基于非负矩阵分解的方法由于其特性,一直以来受到广泛关注和欢迎。因此,本文研究基于非负矩阵分解的维度约简模型,分析传统算法存在的问题并探索解决方案。本文主要的工作和成果如下: (1)首先,在对现有工作进行充分调研和总结的基础上,统合已有算法的优势,提出一种基于流形学习和稀疏约束的非负矩阵分解方法,将其用于维度约简工作。针对大数据时代来源数据维度高、结构复杂、可能存在大量冗余的特点,通过引入去噪处理、显式附加稀疏范数进行约束和添加基于流形学习思想的图正则化的方法分别予以解决,从而更加有效地对原始数据进行特征提取,克服了经典算法在处理该类型数据时的不足。 (2)其次,在前一方法的基础上,进一步提出一种基于二部聚类思想的非负矩阵三分解方法。该方法针对传统二分解过程中存在的,原始数据矩阵行和列之间蕴含的潜在联系可能被忽略的不足,将算法进行进一步的延伸,避免了单独从一个维度展开分析可能造成来自另一维度关键信息的丢失,进而影响算法准确率的问题。该算法有效提升了对具有特定结构的原始数据进行维度约简的效果。 (3)为了验证方法的有效性,我们考虑算法在实际研究中的应用。考虑到基因分析领域的实际研究需求和其数据的典型特征,选择来自真实采样的基因表达谱数据集进行仿真实验,并将结果与经典方法进行对比。实验结果验证了算法的有效性和在结果上的显著优势。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。