尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 随着计算机视觉的发展和计算能力的提升,基于多视角图片的三维重建技术得到了快速发展,该技术成本低廉,容易获得场景的纹理信息,适用于大规模场景,三维重建在无人驾驶、古建筑数字化、数字城市、游戏与电影等行业都有着广泛的应用。从多视角图片... 展开 随着计算机视觉的发展和计算能力的提升,基于多视角图片的三维重建技术得到了快速发展,该技术成本低廉,容易获得场景的纹理信息,适用于大规模场景,三维重建在无人驾驶、古建筑数字化、数字城市、游戏与电影等行业都有着广泛的应用。从多视角图片重建场景的三维模型包括图像特征提取与匹配、稀疏重建和稠密重建三个阶段。大场景下,图像特征提取与匹配耗时较多,在后续稀疏重建阶段,传统的增量式从运动恢复结构(Structure from Motion,SfM)算法依次计算图片的相机参数和场景结构,精度高,但计算耗时长;传统的全局式SfM算法根据所有相机的约束关系,计算所有的相机参数和场景结构,计算速度快,但鲁棒性较差、精度较低。 本文针对传统的SfM存在的问题,设计了混合式SfM算法。主要工作包括:1、针对上述问题,在特征提取阶段,研究了SIFT(Scale-invariant feature transform)特征的CUDA(Compute Unified Device Architecture)实现,加快特征提取速度,在匹配阶段,研究了词汇树的数据结构,加快特征匹配速度。2、在稀疏重建阶段,设计了混合式SfM,将大规模图像集合分割成小的子集,先通过增量式SfM计算每个子集的相机参数,再通过全局式SfM计算所有的相机参数,最后计算场景的稀疏模型,该算法避免了增量式SfM耗时长和误差累积的问题,也避免了全局式SfM精度较低和鲁棒性较差的问题,兼顾了重建的精度和效率。3、在稠密重建阶段,利用深度图融合的多视图立体视觉(Multi-View Stereo,MVS)算法将稀疏模型稠密化,得到场景的稠密模型,使得三维模型的效果更加真实。 在Tanks and Temple基准数据集上进行测试,结果表明SIFT的CUDA实现相对于CPU(Central Processing Unit)节约了70%以上的时间,词汇树的匹配策略相对于穷尽式节约了50%以上的时间,而且匹配结果与穷尽式几乎相同。混合式SfM相对于增量式SfM在点云数量相当的情况下,节约了40%以上的时间。混合式SfM相对于全局式SfM在点云数量约为其2倍的情况下,误差降低了2%左右。最后,通过深度图融合的MVS算法得到场景的稠密模型,更加准确地还原真实场景。通过采集实际场景进行测试,结果表明重建模型的轮廓清晰,符合研究工作要求。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。