尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 三维重建是根据三维物体的图像,利用计算机视觉技术重建物体三维信息的过程,被广泛应用于文物重建、医学图像处理、自动驾驶和大型场景重建等领域。传统的多视图立体视觉(Multi-ViewStereo,MVS)三维重建算法虽然具有较高的重建精度,但在光照条件... 展开 三维重建是根据三维物体的图像,利用计算机视觉技术重建物体三维信息的过程,被广泛应用于文物重建、医学图像处理、自动驾驶和大型场景重建等领域。传统的多视图立体视觉(Multi-ViewStereo,MVS)三维重建算法虽然具有较高的重建精度,但在光照条件发生剧烈变化或者在缺少纹理的场景中,其存在深度估计不完整且重建成本高等劣势。随着图像采集设备的成本越来越低,近年来深度学习算法被广泛应用于三维重建。但受深度假设的影响,大部分MVS网络的预测精度和效率在深度范围较大的场景下难以实现计算量和精度之间的有效平衡。如何在不过多增长计算量的情况下提高深度估计的精度和完整度是值得去探讨的问题。基于此,本文立足于深度学习的多视图立体视觉三维重建,进行了如下研究: (1)提出一种基于多头自注意力机制的三维重建算法。该算法将基线网络与多头自注意力机制相结合,有助于网络有效且完整地恢复图像的三维结构信息,在多尺度特征提取的同时能够共享参数,融合全局信息和捕捉更高维度的信息,从而提升重建的完整度。为减少多层卷积和多头自注意力机制带来的参数增加,解决计算量变大和运行速度变慢等问题,本文采取减小特征提取的层数来获得更轻量级的模型来减少显存的占用、加快运行时间。实验结果表明,该算法在DTU数据集的测试中完整度误差为0.271mm,比基线网络减少0.006mm,有效提高了重建的完整度,通过减少特征提取的层数有效了缩短重建时间,同时在大场景数据集上的重建充分证明了该方法具有良好的鲁棒性和泛化能力。 (2)提出一种融合稀疏图初始化和Loss优化的三维重建算法。针对深度图随机初始化方式、单一损失函数提出对应的改进方案,通过借鉴传统方法初始化深度图来提升重建精度,联合使用损失函数来减小深度图噪声,解决边缘不平滑问题。利用以上改进算法,结合基于多头自注意力机制的多尺度特征提取网络,在提升重建模型的精度和完整度的同时获得更轻量级网络结构、更快的训练速度和更少的显存占用。实验表明,改进算法在DTU数据集的测试中重建出的点云精度误差为0.384mm,比基线网络提升10.1%,显著提高了重建的精度,且噪声杂点更少、边缘处理更平滑。 (3)完成基于MVS三维重建应用系统的开发。为了促进对青铜器的保护和传承,本文设计了操作简单方便的青铜器三维重建系统,非专业人员也能轻松使用该系统实现对青铜器的三维重建。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。