高性能图计算体系结构和系统软件 
报告题目:稀疏图计算支撑高效点云
演讲摘要:随着人工智能在更广泛场景的应用与落地,3D点云神经网络已经在物体检测、语义分割等各种3D感知应用中发挥着不可替代的重要作用。目前,已经出现了一些基于GPU或基于专用架构的点云计算方案。然而,点云数据具有高度稀疏的特点,并且稀疏性来源于实际物体本身的深度和表面信息,需要在运行时动态处理稀疏点云。在现有点云网络的推理计算过程中,存在访存量大、访存效率和计算单元利用率低的问题。并且随着算法的不断更新,感知范围扩大、场景扩大,点云数据变得越来越庞杂;并且需要同时运算多帧、处理融合多模态的数据。在这种背景下,访存和计算单元利用率低的问题会越发严峻,无法满足端侧应用的实时性、低延时、低能耗的需求。因此,目前3D点云神经网络处理系统仍需要1-2个数量级的效率优化。面向3D点云神经网络,我们在计算流图、并行算子、硬件架构三个层面,从访存和计算两个角度,对3D点云计算系统进行细粒度优化,形成了快速高能效的GPU点云计算系统和架构设计,最终将3D点云算法计算性能提升1.5至4倍。未来,我们将继续开展广泛人工智能场景下快速高能效稀疏计算的系统与芯片研究,支撑人工智能向下一个时代的发展与进步。
讲者简介:上海交通大学长聘教轨副教授,清源研究院定制计算中心(CCC,Customized Computing Center)Co-PI,人工智能设计自动化创新实验室(DAI Group,Domain-specific Artificial Intelligence & Design Automation Innovation Group)负责人。分别于2014年和2019年在清华大学电子工程系获得工学学士和博士学位,发表电路设计自动化、异构计算、体系架构等领域高水平国际期刊、会议论文30余篇,谷歌学术施引800余次。发表论文荣获ASP-DAC 2019 最佳论文奖,DATE 2023/DAC 2022/DATE 2018最佳论文提名,WAIC 2022优秀青年论文奖。个人曾获WAIC 2022云帆奖、NeurIPS21 BIGANN竞赛全球冠军、北京市优秀博士毕业生、清华大学优秀博士毕业生、清华大学优秀博士毕业论文等荣誉。戴教授曾参与指导学生获ACM 2021 SRC全球第三,MICRO 2020 SRC全球第一。作为项目负责人,戴教授承担了包括国家自然科学基金青年项目等在内的多项纵横向项目。