尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 通用图挖掘系统是从图数据中发现特定结构模式的重要工具,当前图挖掘系统相关研究的核心目标是保证快速准确得到挖掘结果并减少挖掘过程中的资源消耗。随着图数据规模的急剧增长以及各领域对复杂图结构快速挖掘的需求不断增长,现有的系统已经不能适... 展开 通用图挖掘系统是从图数据中发现特定结构模式的重要工具,当前图挖掘系统相关研究的核心目标是保证快速准确得到挖掘结果并减少挖掘过程中的资源消耗。随着图数据规模的急剧增长以及各领域对复杂图结构快速挖掘的需求不断增长,现有的系统已经不能适应大规模、高复杂度的图挖掘任务,其原因主要在于(1)没有对模式图特征进行分析,未能充分利用模式图中包含的约束信息;(2)未能充分考虑到不同挖掘路径和挖掘顺序的选择会对系统性能产生的影响;(3)图挖掘过程中保存不必要的中间结果,消耗过多内存空间。 为了应对以上的挑战,设计并实现PMiner系统。该系统通过深入分析模式图中各节点间以及各边间存在的约束关系,提出约束包含关系的概念,即共端点的多条边在挖掘过程中存在挖掘结果互相包含的关系,以此设计了基于约束包含关系的模式图分割方案,将挖掘任务的规模减小数倍至数十倍。同时提出节点选择度与覆盖度的概念,节点选择度是指节点在真实图中进行挖掘时候选集的最大规模,节点覆盖度则指的是单个节点在模式图分割时所能覆盖的最大节点数占原模式图的比率。由此,结合模式图分割实现了更好的挖掘计划生成过程,给出当前挖掘任务下最优的挖掘路径与顺序。最后设计实现了基于模式图分割的挖掘计划执行流程,对中间结果集的生成和更新提出复制赋值方法和共享赋值方法,从而避免了大量的冗余计算以及对不必要中间结果集的存储。 实验结果表明,对于8个不同规模的真实图数据集,PMiner系统在进行复杂模式图挖掘任务时其执行速度快于最新的图挖掘系统GraphPi和Peregrine,平均速度提升分别达到了52倍与61倍。同时测试证明使用模式图分割方案可以有效缩减挖掘过程中产生的中间结果集大小,对内存的消耗缩减达到2~4倍。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。