微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:图模式挖掘是近年来大数据领域的研究热点。图模式挖掘是一个计算密集型的应用,挖掘过程涉及大量的顶点对检查,如枚举所有潜在的顶点对并检查它们的连接性或者计算顶点对的公共邻居。图形处理器(GPU)因其大规模并行处理的能力而具有加速图模式挖掘应用的潜力。尽管许多减少错误候选集的方法已经被提出,如指定匹配顺序,提前终止,自同构检查等等,现有框架仍然因为处理过多的错误候选集而有很大性能损失。这些错误候选集会消耗大量计算资源,加剧负载不均衡问题,导致GPU效率低下和系统性能不佳。本文提出了一种新的解决方案AntiRF,利用图数据和模式的特征来避免冗余(Redundancy)和无效(Futility)的搜索。AntiRF通过避免已被检查的顶点对的重复枚举来减少冗余搜索,并采用连接性预采样策略跳过无边顶点对检查从而避免无效搜索。相比于领域前沿的GPU图挖掘系统,AntiRF在V100 GPU集群上取得了最高305倍的性能提升。
讲者简介:谭光明,研究员、博导、中科院计算技术研究所高性能计算机研究中心主任。国家杰出青年基金获得者,参与了曙光系列高性能计算机系统研制。发表学术论文100余篇,曾任IEEE TPDS编委和多个国际会议的程序委员。曾获得国家科技进步奖二等奖、北京市科技进步奖一等奖、卢嘉锡青年人才奖和全国向上向善好青年称号。