摘要 : 为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单元。为降低模型... 展开
作者 | 吕文浩 支小莉 童维勤 |
---|---|
作者单位 | |
期刊名称 | 《计算机工程与设计》 |
期刊英文名称 | 《Computer Engineering and Design》 |
页码/总页数 | P.699-706 / 8 |
语种/中图分类号 | 汉语 / TP391 |
关键词 | 软硬件协同优化 现场可编程门阵列 轻量级卷积神经网络 移位量化 并行计算 硬件加速 开放式计算语言 |
DOI | 10.16208/j.issn1000-7024.2024.03.009 |
基金项目 | 山东省自然科学基金项目(ZR2019LZH002);中国高校产学研创新基金项目(2020HYA02011);上海市科委人工智能支撑专项基金项目(22511106005)。 |
收录情况 | BDHX CSTPCD |
机标主题词 / 分类号 | 卷积;人工神经网络;粒子加速器 / O177.6;TP18;TL5 |