尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 基于视频的人体行为识别,在智能监控、安防、基于内容的视频标注、智能人机交互等各个领域应用广泛,可以解决传统的基于人工的监控视频处理对人力资源的巨大消耗问题。同时自动化的人体行为识别,也解决了智能人机交互中的输入问题。传统的基于图像... 展开 基于视频的人体行为识别,在智能监控、安防、基于内容的视频标注、智能人机交互等各个领域应用广泛,可以解决传统的基于人工的监控视频处理对人力资源的巨大消耗问题。同时自动化的人体行为识别,也解决了智能人机交互中的输入问题。传统的基于图像处理和计算机视觉技术的人体行为识别存在着准确率低、计算量大、算法逻辑复杂、对算法研究人员和工程人员背景知识要求高等缺陷。近年来,深度学习算法在计算机视觉的各个应用领域取得了全面突破,将深度学习算法引入行为识别领域有着诸多优势。基于深度学习的特征提取算法,能解决传统行为识别算法中,基于人工手动设计特征提取算法的一些缺陷,在提高行为识别准确率的同时,还大大简化了算法的设计和实现流程。 为了进一步研究深度学习算法在行为识别中的性能,本文以深度学习网络结构的优化作为出发点,设计并实现了两种基于深度学习的行为识别算法。两种算法分别基于三维卷积神经网络和用于序列处理的长短期记忆网络实现。基于三维卷积网络的算法,使用了多个小卷积核堆叠代替大卷积核的方法实现,加深了神经网络深度的同时,还降低了网络的参数量,并且在三维卷积网络中增加了最新的批量归一化算法提升训练速度。基于长短期记忆网络的行为识别算法,使用本文实现的三维卷积网络作为前置的空间域和时间域特征提取器,然后将三维卷积网络输出的特征图展开为特征向量,使用长短期记忆网络来提取视频序列中包含的前后帧相关信息。最后在UCF-101数据集以及HMDB-51数据集上验证了本文所实现算法的各项性能,在 UCF-101 数据集上最高可达到 94%的准确率,在HMDB-51数据集上最高可达到68%的准确率。研究工作证明了基于三维卷积网络在行为识别应用中的可行性,同时说明了基于不同深度学习网络的融合算法对视频序列处理的优越性。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。