尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近年来,随着人工智能技术的快速发展以及硬件设备计算速度的提升,智能机器人已经广泛进入日常生活。移动机器人是智能机器人领域中一个重要的研究方向,其需要的自主导航能力是完成各项任务的基本要求。三维重建技术是机器人视觉导航领域的核心技术... 展开 近年来,随着人工智能技术的快速发展以及硬件设备计算速度的提升,智能机器人已经广泛进入日常生活。移动机器人是智能机器人领域中一个重要的研究方向,其需要的自主导航能力是完成各项任务的基本要求。三维重建技术是机器人视觉导航领域的核心技术之一,深度估计则是三维重建的重要模块。传统三维重建方法中的深度图估计模块计算量较大,是影响重建精度和速度的重要因素。针对上述传统算法存在的不足,本文使用自监督学习的方法来完成深度估计和三维重建任务。 基于自监督学习的深度估计的一个关键问题是其精度相对于传统基于几何的方法和有监督学习的方法较低。因此,本文首先提出了基于双鉴别器生成对抗网络的自监督单目深度估计方法,以解决仅使用局部像素损失函数进行训练造成的自监督单目深度估计精度较低的问题。其次,为了解决由于真实场景中的遮挡和物体运动导致基于单目视频的自监督深度估计精度下降的问题,提出了基于场景辨识的自监督单目深度估计方法。最后,结合传统方法成熟的框架与自监督方法在深度估计速度两方面的优势,使用基于自监督学习的深度估计网络取代传统三维重建方法COLMAP中的深度估计模块,构建了基于自监督单目深度估计的三维重建框架。 论文的主要研究内容及成果如下: (1)基于双鉴别器生成对抗网络的自监督单目深度估计方法 针对使用立体图像对进行训练的自监督单目深度估计方法通常使用局部像素损失进行训练,无法保证全局一致性的问题,提出了一种基于双鉴别器生成性对抗网络的自监督单目深度估计方法。该方法利用生成性对抗网络(Generative Adversarial Networks,GAN)合成视觉上可信的图像方面的优势,进一步提高了自监督单目深度估计的精度。首先,为充分利用重建图像,在Wasserstein生成性对抗网络(WGAN)的基础上进行改进,构建了双鉴别器结构。双鉴别器对生成器的要求和训练目标更加严苛,避免了由于只在左图像或右图像上引入鉴别器而造成的信息损失。其次,针对该网络的结构,提出了一种局部-全局一致的损失函数,保证了像素的真实性和局部-全局内容的一致性。最后,在KITTI基准测试集中与单目深度估计的相关代表方法进行了比较,实验结果表明该方法有效地提高了单目深度估计的精度,具有较好的深度估计性能。 (2)基于场景辨识的自监督单目深度估计方法 为了解决由于真实场景中的遮挡和物体运动导致单目深度估计精度下降的问题,提出了一种基于场景辨识的自监督单目深度估计方法。首先,对遮挡像素和非遮挡像素类型进行识别,从而切换损失函数对其建模,解决了仅使用平均像素损失或最小像素损失造成损失过大或过小的问题,在解决遮挡问题的同时提高了精度。其次,在训练进入稳定阶段后加入了自动掩膜静止像素操作,该操作能够适应动态场景,同时提高了深度估计的精度。最后,通过在KITTI基准集中进行测试证明了所提出的自监督单目深度估计方法能够提高遮挡和场景动态环境下的估计精度。 (3)基于自监督单目深度估计的三维重建方法 针对传统基于几何的三维重建方法中深度估计模块估计时间复杂度较高的问题,提出了一种基于自监督单目深度估计的三维重建方法。首先,利用传统方法成熟的框架与自监督方法在深度估计速度方面的优势,使用基于自监督学习的深度估计网络取代传统三维重建方法COLMAP中的深度估计模块,构建基于自监督单目深度估计的三维重建框架。其次,通过几何一致性对深度图滤波,使用基于可见性的融合算法将不同视图的深度图集成到统一的点云中。最后,在多视图立体数据集DTU上进行实验,结果表明所提出的自监督三维重建方法具有更低的时间复杂度和更好的深度估计性能。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。