尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 近年来,新兴的图神经网络应用因其强大的图学习和推理能力,得到学术界和工业界的广泛关注,被认为是推动人工智能领域迈入“认知智能”阶段的核心力量。图卷积神经网络是图神经网络的重要分支之一,其融合传统图计算和神经网络的执行过程,使规则与不... 展开 近年来,新兴的图神经网络应用因其强大的图学习和推理能力,得到学术界和工业界的广泛关注,被认为是推动人工智能领域迈入“认知智能”阶段的核心力量。图卷积神经网络是图神经网络的重要分支之一,其融合传统图计算和神经网络的执行过程,使规则与不规则的访存、计算共存,形成混合的执行行为。由于访存的能耗开销远大于计算的能耗开销,且大规模的不规则图拓扑与节点特征引发超大规模的访存量,因此图卷积神经网络的执行性能主要受到访存的制约,对该方面的优化具有很强的研究与应用价值。 尽管现有工作已在图卷积神经网络的访存优化方面取得了一些成果,但仍存在①没有系统地对图卷积神经网络的访存特征进行量化分析;②包含大量冗余的片外访存、片外访存效率低下;③片上访存局部性差、片上数据复用率低下这三个问题。为解决上述问题,本文从多个角度量化图卷积神经网络的访存特征,并在量化分析结果的指导下,依次针对片外访存和片上访存进行优化,从而对图卷积神经网络应用的访存优化展开系统性研究。具体研究内容如下所述: ①图卷积神经网络应用的访存特征分析:第一个研究点对图卷积神经网络的访存行为进行了详实的实验评估与量化分析,从而深入解析其复杂的混合执行行为。该研究点通过大量的实验分析发现,图卷积神经网络的加速瓶颈在于不规则且复杂的访存过程,且现有的专用加速结构中仍存在冗余片外访存多和片上访存局部性差的严重问题。该研究点通过量化分析,深入探索访存行为的硬件优化机遇,能够有效指导后续的专用加速结构优化设计。 ②基于双方向融合执行的片外访存去冗:第二个研究点针对研究点①中所述的加速结构执行图卷积神经网络时存在大量冗余片外访存的问题,提出一个创新性硬件单元BiFusion,其可适配加入具有混合结构的加速结构中。BiFusion能够为加速结构在每层选择适合的执行方向,并使能阶段间的融合流水,从而通过避免不必要的重复访存来有效降低片外访存量,进而优化整体执行性能。实验表明,将BiFusion集成入业界最先进的图卷积神经网络加速结构HyGCN中,能够与原结构相比有平均3x的性能提升,和最高85%的访存量降低。 ③基于动态调度的片上访存局部性挖掘:第三个研究点针对研究点。①所述的加速结构执行图卷积神经网络时存在的片上数据复用性差、局部性待挖掘的问题,提出具有混合数据预处理与动态调度机制的优化加速结构PreSch-GCN。该项研究提出基于节点度数与节点相连关系的混合预处理策略,通过离线与在线预处理相结合的方式挖掘现实场景不规则图的潜在数据局部性,从而有效提取热点数据。同时,该项研究还提出了灵活的动态调度机制,保障了加速结构中不同种类计算单元的负载均衡。与HyGCN相比,PreSch-GCN能够达到平均2.1×的性能提升,片外访存量有最高77.6%的降低。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。