尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 复杂的非线性、非平稳数据分析已成为现代统计学和数据科学领域研究的热点问题,探求复杂时序数据的自适应数据分解、变量选择和统计学习方法,具有重要的理论意义和应用价值。如何挖掘数据的关键信息,建立高效的预测方法实现精准推断,是一项重要且... 展开 复杂的非线性、非平稳数据分析已成为现代统计学和数据科学领域研究的热点问题,探求复杂时序数据的自适应数据分解、变量选择和统计学习方法,具有重要的理论意义和应用价值。如何挖掘数据的关键信息,建立高效的预测方法实现精准推断,是一项重要且具有挑战性的研究。本文以非线性非平稳的时序数据为研究对象,以自适应分解和机器学习理论为核心,构建新的深度森林方法,为丰富和发展数据科学方法提供有力的理论支撑。本文主要研究内容包括: (1)提出改进哈里斯鹰算法优化的正则化变分模态分解方法。变分模态分解在变分方程构造过程中使用的岭回归惩罚,以放弃无偏性,降低精度为代价,而导致分解后重构的准确度不佳。针对这一问题,提出了正则化的变分模态分解方法。在变分模态分解维纳滤波过程中的二次惩罚基础上引入一次惩罚项,提高分解的效率和准确性。针对变分模态分解算法分解个数和惩罚因子的参数选择问题,本文提出由包络谱熵和重构误差确定的分解平衡因子作为适应度函数,建立基于改进哈里斯鹰算法优化的变分模态分解方法。 (2)构建最小共同冗余最大相关的自适应弹性网变量选择方法。鉴于数据的非线性和高维属性,考虑变量间的依赖性,本文结合系数压缩和互信息理论,提出最小共同冗余最大相关的自适应弹性网方法,对自适应弹性网的惩罚项进行加权估计,利用最小共同冗余最大相关准则给出权重的计算方式,探索建立基于数据驱动的无模型假设的变量选择方法。该方法充分考虑了候选变量和已选变量,目标变量间的冗余信息,达到了既控制冗余变量,又选择相关变量的目的。 (3)提出两阶段加权的深度森林方法。针对深度森林算法训练过程中学习器异质性弱且同权重的问题,提出两阶段加权的深度森林算法。在多粒度扫描阶段,为不同粒度的窗口产生的增强特征加权,以体现不同扫描粒度的贡献,增强特征的表示能力。在级联森林阶段,从增加分类器的多样性角度考虑,组建不同的学习器,同时,对级联森林阶段的分类器赋予权重,降低拟合性能不好的学习器的负面影响,提升强学习器的作用。 本文对复杂的非线性非平稳的时序数据展开研究,利用改进哈里斯鹰算法优化的正则化变分模态分解方法,最小共同冗余最大相关准则的自适应弹性网变量选择方法,两阶段加权的深度森林分类算法,建立了一套完整的数据预测框架。在每步算法提出过程中,使用模拟数据从不同评估角度验证了所提出方法的有效性,并将其应用于生物医学的癫痫脑电信号识别和机械工程领域的滚动轴承故障诊断案例中,在实证分析环节进行了和传统模型的对比实验,并通过统计检验证明了所提方法的优越性。所提出的模型可以适用于其他领域的时序数据分析问题,本文的工作为复杂的非线性非平稳的时序数据分析奠定了理论基础。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。