尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着感知技术、网络传输和存储技术的不断发展,数据的产生、收集和存储能力大大提高,数据的规模以几何级数方式迅猛增长。海量的数据为信息分析和挖掘带来了巨大便利,同时也提出了巨大的挑战,其中数据缺失问题极大地影响数据的可用性,是数据质量... 展开 随着感知技术、网络传输和存储技术的不断发展,数据的产生、收集和存储能力大大提高,数据的规模以几何级数方式迅猛增长。海量的数据为信息分析和挖掘带来了巨大便利,同时也提出了巨大的挑战,其中数据缺失问题极大地影响数据的可用性,是数据质量研究中的重点和难点问题之一。如何预测缺失数据,准确还原物理世界的原始信息,用以支持高级的数据挖掘应用,具备重要的理论研究和实际应用价值。本文针对这一关键问题展开研究。主要工作如下: 首先,本文利用极限学习机(ELM)的回归原理填补缺失数据,针对待填补缺失数据集往往先验知识不足,激活函数选择困难,或待填补数据集本身复杂,难以选择合适激活函数的问题,重点研究了基于改进的差分优化算法自适应的选取激活函数的算法。该方法根据缺失数据填补问题的特点,改进了种群优化算法,进而提出了适用于缺失数据填补的自适应的极限学习机(A-ELM)。并详细介绍了自适应的极限学习机(A-ELM)填补缺失数据的可操作性及其填补步骤。 然后,本文针对待填补缺失数据集自变量间存在线性关系时,利用极限学习机(ELM)进行填补,求解广义逆矩阵会导致准确率低甚至病态解问题,提出了岭回归极限学习机(B-ELM)。重点研究了基于广义交叉验证法选取岭参数k的方法,岭回归极限学习机(B-ELM)能有效处理变量间有相关性的缺失数据集。并综合总结出泛化性强、填补准确率较高的缺失数据填补工具自适应的岭回归极限学习机模型(AB-ELM-MD)。自适应的岭回归极限学习机模型(AB-ELM-MD)可以对那些无法确定激活函数的不完备输入数据集进行填补,同时可以以较高的准确率对各维度之间高度相关的不完备数据进行填补,也可以对综合含有上述问题的不完备数据进行填补。 最后,本文以两组真实的高维DNA微阵列数据、一组真实的数据量较大的交通轨迹数据为例,利用支持向量机回归机(SVR)方法、极限学习机(ELM)方法、自适应的岭回归极限学习机缺失数据填补模型(AB-ELM-MD),针对含有上述问题数据集,以不完备数据回归的结果为基础进行缺失数据的填补。证明了本文提出的自适应岭回归极限学习机缺失数据填补模型(AB-ELM-MD)可以有效填补缺失数据,且对维度较高的、各维度间高度相关的、难以选取激活函数的、数据量较大的不完备数据集填补效果良好。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。