尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 图像是人们对视觉感知到的信息的再现,与声音和文字相比,它包含的信息量更大,传递方式更为直接,接收方式更为简单,正因如此,基于图像信息的识别与处理已成为当前人工智能发展的主流。 目前,随着科技的进步与发展,海量的图像信息囊括了生活... 展开 图像是人们对视觉感知到的信息的再现,与声音和文字相比,它包含的信息量更大,传递方式更为直接,接收方式更为简单,正因如此,基于图像信息的识别与处理已成为当前人工智能发展的主流。 目前,随着科技的进步与发展,海量的图像信息囊括了生活中大部分事物,图像的尺度多种多样,随之而来的分类问题逐渐增多。对于深度卷积网络的图像分类,由于全连接层的存在,在网络进行训练和测试时需要固定输入图像的尺寸。当遇到多尺度的图像时,需将图像利用裁剪和变形等手段转换成固定尺寸,但是,裁剪会导致图像信息的丢失,变形会导致位置信息的扭曲,从而破坏了原始图像所包含的详细信息。尽管基于池化层组的方法可以将可变大小的特征图转换为固定大小的特征图,解决了多尺度图像分类问题,但是由于池化操作会丢失信息,造成识别准确率显著降低。为此,本文开展了基于胶囊网络的多尺度图像分类问题的研究,主要工作如下: 1. 针对卷积神经网络在不改变卷积结构和参数时不能直接处理多尺度图像的问题,提出了使用共享转换矩阵路由(Shared Conversion Matrix Routing, SCMR)层作为通用网络层,以取代卷积神经网络的全连接层。在SCMR层中,采用RECOMBINATION方法,使其可以根据输入图像的规模动态地增加或减少胶囊的数量,以保证卷积层和SCMR层的正常运行。同时,通过共享SCMR层中的变换矩阵,建立新的动态路由算法,使SCMR层可以接收卷积多维特征图并生成固定维度的图像特征输出,实现多尺度图像分类。该算法使每个胶囊都有相应的权重,避免了特征丢失的问题。此外,通过增加胶囊向量的维度来创建新的胶囊向量,以解决反向传播中的梯度爆炸问题。 2. 针对SCMR层内存占用大和时间效率低的问题,提出了Rocket路由算法。在内存占用上,胶囊网络由于使用了大量的姿态变换矩阵从而导致网络模型运行时内存的急速上升。为此,Rocket算法中使用特定的卷积运算来代替算法中的矩阵运算,较好的减少了内存的占用。在时间效率上,SCMR算法通过迭代机制不断的更新上一层胶囊向量的所占权重,而网络运行消耗的时间却随着算法的迭代次数增加而增长,通过在Rocket算法中采用非线性函数来代替SCMR的迭代过程,进一步提高网络运行效率。 3. 在 ImageNet2012 子集、IIC(Intel Image Classification)以及 ASL(American SignLanguage)三个数据集上进行了实验验证。实验结果表明,在以不同的架构(AlexNet、ZFNet、VGG11)为基础模型框架上,加入SCMR层的模型在准确率上优于SPP以及RoI系列(RoI、RoI-Align、GLGOD-RoI、Couple-RoI)的方法,分类精度提高了约0.5%-3%。另外,在 ASL 数据集上开展了 Rocket 算法与 SCMR 算法的对比实验。结果表明,在AlexNet基础框架上Rocket算法比SCMR算法整体运行内存减少了约60%且运行时间加快了约92%;在ZFNet模型架构上Rocket算法内存占用减少了约56%,时间加快了约91%;在VGG11模型架构上Rocket算法内存占用减少了约58%,时间加快了约91%。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。