尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 在二十一世纪的今天;人类进入了信息时代。随着互联网和计算机技术等信息产业的不断发展;以及数码相机、智能手机、平板电脑等拍照终端的普及;视觉数据呈现了爆炸性的增长。因此;如何对图像、视频、3D模型这些海量视觉数据进行有效的索引一直是工业界... 展开 在二十一世纪的今天;人类进入了信息时代。随着互联网和计算机技术等信息产业的不断发展;以及数码相机、智能手机、平板电脑等拍照终端的普及;视觉数据呈现了爆炸性的增长。因此;如何对图像、视频、3D模型这些海量视觉数据进行有效的索引一直是工业界的关注重点之一。针对不同的商业需求;大量成熟的视觉搜索引擎被开发用以提供更符合用户兴趣偏好的检索结果。 在计算机视觉领域;物体检索长期以来一直是一个前沿且基础的研究热点。物体检索的研究往往对图像识别、物体检测、人脸验证、视频安防等相关领域的发展有着重要的促进作用。一般来说;一个典型的物体检索系统包含三个主要模块;包括用于视觉表示的特征学习模块、用于排序初始化的匹配排序模块以及用于后处理的重排序模块。本文将主要针对基于相似度学习的重排序模块进行深入的研究;就提高重排序过程的高效性、准确性、理论性和通用性等方面提出了一系列新颖的算法。本文的主要贡献有: 1) 提出了一种快速高效的重排序算法――稀疏上下文响应。不同于基于图模型的传统算法;该算法将相似度学习定义在向量空间;这使得重排序过程可以很容易地在广义杰卡德度量下通过向量比较来完成。为了降低重排序过程的计算开销;稀疏上下文响应首次将倒排索引结构引入重排序过程;并严谨证明了倒排索引使用杰卡德度量的可行性。在众多的检索标准数据集上;该算法不仅取得了优异的检索性能;而且能够在毫秒级的时间内返回检索结果;在速度上遥遥领先大部分同类算法。 2) 提出了一个张量阶相似度学习的理论框架。该框架通过揭示张量乘积扩散过程的工作机理;从而首次在理论上阐释了其相较于其它扩散过程变种的优势。不同于现有的基于迭代的算法;其核心贡献在于定义了一个用于量化流形结构的高阶光滑度的标准;来同时正则约束图模型中的四个顶点。基于这个核心发现;本文进一步提出了张量乘积扩散的两个变种用以处理跨域检索和超图检索。进而;该框架成为物体检索领域里的一个通用工具;可以在大部分常见的检索场景中进一步提高基准相似度的检索性能。在各类数据模式和检索设定的标准数据集上;该框架取得了一系列的成功并展现了其极强的泛化能力。 3) 提出了一个完备的相似度融合框架――融合扩散。融合扩散不仅继承了扩散过程本身具有的捕获流形结构的出色能力;更是能够充分挖掘多种相似度之间的互补性来大幅提高检索性能。考虑到大部分融合扩散算法对噪声相似度的敏感性;本文最新提出的集成扩散引入了动态的权重学习机制;从而有效 提升了算法对噪声相似度的鲁棒性。更为重要的是;集成扩散可以高效地使用迭代过程近似求解;从而保持和标准扩散过程同等的计算复杂度。该方法在3D模型检索和图像检索任务上;尤其是在拥有多个输入相似度的情况下;取得了当时业界最好的结果。 4) 探讨了重排序算法在大规模物体识别和检索场景下的应用。以大规模3D形状检索竞赛和大规模行人再识别为应用背景;对重排序算法进行进一步的分析和定制;以满足识别和检索过程中实时性和规模性的要求。大量的实验结果证实;本文提出的重排序算法在处理大数据的场景下有着极大的潜力。 综上;本文以视觉物体检索为主线;以基于相似度学习的重排序过程为研究重点;取得了大量突破性的研究成果。本文所提出的模型和算法对计算机视觉、机器学习、模式识别、人工智能等相关研究领域;以及实际的检索系统具有理论的指导意义。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。