尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着计算机软硬件技术的不断发展,新一代人工智能技术已逐渐展现出其在智能制造上的应用价值。计算机视觉作为人工智能技术的重要驱动,能够有效促进智能制造中智能感知的实现。作为三维视觉领域中的一项底层任务,单目深度估计因其成本较低、结构简... 展开 随着计算机软硬件技术的不断发展,新一代人工智能技术已逐渐展现出其在智能制造上的应用价值。计算机视觉作为人工智能技术的重要驱动,能够有效促进智能制造中智能感知的实现。作为三维视觉领域中的一项底层任务,单目深度估计因其成本较低、结构简单且部署灵活等特点,已经成为近年来学术界和工业界的研究热点。随着深度学习技术的快速发展,单目深度估计技术也取得了巨大的进步,特别是基于单目视频序列的自监督单目深度估计因其不需要真实的深度信息作为监督信号,更是受到众多学者的广泛关注。 本论文面向工业场景下AGV在巡检过程中的底层深度估计任务,针对其存在的室内外深度估计精度不足和冗余深度信息较多等问题,开展了基于自监督学习的单目深度估计算法研究,主要研究内容如下: (1)针对室外自监督单目深度估计算法特征提取能力不足、多尺度预测结果利用不充分,导致深度估计精度不足的问题,本论文提出了一种融合软硬注意力机制的自监督单目深度估计算法——SHdepth。具体地,针对网络特征提取能力不足的问题,通过结合注意力机制,设计了相应的软注意力模块,来加强网络在空间和通道维度上的特征提取能力;针对多尺度预测结果利用不充分的问题,通过采用一种硬注意力策略,来改进不同尺度下光度损失函数的权重分配,从而加强对生成的多尺度深度估计结果的融合。在多个室外场景数据集上的实验结果表明,提出的SHdepth算法达到了同期最好的室外自监督单目深度估计性能,并在室外场景中物体边缘等细节上的深度预测更加准确。 (2)针对室内自监督单目深度估计存在大量低纹理区域、相机姿态复杂,导致生成的深度图精度不足的问题,本论文提出了一种基于改进结构相似性(StructuralSimilarity,SSIM)和多光度损失的自监督单目深度估计算法——IndoorDepth。具体地,针对室内场景存在大量低纹理区域的问题,设计了一种基于改进SSIM的光度损失,通过调整新的结构相似性函数中超参数k的取值,来平衡室内场景中低纹理区域和噪声区域对训练的不同影响,从而在整幅图像内获得更多有效的结构相似性指数,最终使得模型训练更加顺利;针对室内场景下相机姿态过于复杂的问题,设计了一种新的姿态估计网络,该网络通过不同阶段的多个光度损失来分别约束相应的多个残差姿态块,从而使得姿态估计网络更容易收敛,最终实现对复杂相机姿态的准确估计。大量实验结果表明,提出的IndoorDepth算法不仅在多个室内场景数据集上达到了最佳性能,同时在实际采集的面向AGV移动工作站的车间环境数据集上拥有较好的泛化性能。 (3)针对当前自监督单目深度估计算法生成的稠密深度图对于后续三维重建、目标定位等高阶视觉任务存在冗余信息较多、资源开销较大的问题,本论文提出了一种联合目标检测的自监督单目深度估计优化方法。首先为了更好地辅助后续深度图的优化,提出了一种对多尺度特征图进行分类再提取的目标检测算法,相关实验表明该算法能有效提高模型检测目标的能力;其次结合上述目标检测模型的输出结果,计算出包含目标区域位置信息的二进制掩膜;然后设计了该掩膜与自监督单目深度估计模型进行融合的相应模块,最终实现了深度图的优化。本论文以驾驶场景为例,对该优化方法进行了相应测试。实验结果表明提出的自监督单目深度估计优化方法不仅能为后续高阶任务提供更有价值的深度信息,且能大幅减少后续资源开销从而提升系统的实时性。 本论文以实验室承担的国家重点研发计划和兴辽英才计划等课题为支撑,研究了当前自监督单目深度估计存在的多个重点问题,实现了自监督单目深度估计在一定程度上的性能提升,为后续相关研究和工业应用提供了一些参考依据。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。