在线直播

面向新基建的计算机系统结构

简介

以云计算、大数据和人工智能等技术为代表的新型基础设施建设的快速发展对计算机系统结构提出了新的挑战。本论坛将讨论面向新型基础设施建设的计算机体系结构相关的重要和关键问题，包括存储系统技术和器件架构、分布式系统和近数据计算技术、持久可靠和安全一致等年度热点问题和技术挑战，促进以智能、协同、融合为标志的新型基础设施建设体系的研究和发展，构建通用平台支撑服务，形成安全可控的计算机体系架构，加快数字产业化进程，推进算法、算力和数据之间的协同发展。此次论坛深入讨论这些问题，并达成共识，促进我国学术界与工业界在新基建的计算机系统结构方面的研究与发展。

直播

日程

时间：10月22日 16:00-18:00

地点：三层重庆厅

时间	报告题目	讲者	回放
16:00-18:00	移动模拟器的创新设计与工业应用	李振华	回放
基于近数据计算对大数据应用的优化技术	薛春	回放
基于 RDMA 的高效分布式内存计算系统栈	陈榕
闪存存储重构与系统设计	陆游游	回放
基于数据中心同步网络的若干高速分布式容错与区块链系统	崔鹤鸣
面向下一代计算需求的 GPU 探索与优化	张献伟	回放
HotRing: A Hotspot-Aware In-Memory Key-Value Store	孙园园	回放

主席

华宇

个人介绍：曾在加拿大麦吉尔大学，美国内布拉斯加大学林肯分校做博士后研究工作。研究方向是新型存储器件、云存储系统、非易失存储系统等。主持和参加国家重点研发计划、973、863 重大、国家自然科学基金、教育部创新团队等项目，在 OSDI、MICRO、FAST、USENIX ATC、SC、ACM ToS、IEEE TPDS/ TCAD/TC 等会议和期刊上发表 150 多篇学术论文，出版专著一部。在 ACM APSys 2019 和 IEEE NAS 2019 会议担任程序共同主席，OSDI、FAST、USENIX ATC、ASPLOS、ISCA、MICRO、HPCA、SC、 EuroSys 等学术会议上担任程序委员 (PC 或 ERC)。研究成果获得 2018 年湖北省科技进步一等奖和 2011 年中国电子学会信息科学技术二等奖。

嘉宾

回放

李振华

报告题目：移动模拟器的创新设计与工业应用

演讲摘要：移动模拟器在移动操作系统（Android 和 iOS）及其应用的研发、测试、调试、自动化部署、跨平台执行方面具备基础性支撑作用。过去的 20 年里，伴随云计算和虚拟化技术的发展，移动模拟器的核心架构经历了从动态二进制翻译（QEMU）、全虚拟化（VirtualBox）、类半虚拟化（Xen）、硬件辅助虚拟化（Intel-VT）到操作系统虚拟化（Windows 上的 Linux 子系统）的代际变迁。每一次核心架构的升级，都进一步缩小了移动模拟器和宿主机之间的性能差距，同时又可能损失兼容性和安全性，总的来说对于复杂多样的模拟需求“没有银弹”。从 2017 到 2020，我们和腾讯公司多个团队密切合作，研发出匹配各种（极端）需求的移动模拟器产品，包括和腾讯安天实验室联合研发的基于动态二进制翻译的“物联网蜜罐云”，和腾讯应用市场联合研发的基于全虚拟化的“悬浮窗医生”和“API 医生”，以及和腾讯游戏部门联合研发的基于操作系统虚拟化的“手游助手”。本次报告期待与大家交流分享这一系列实用模拟器产品中的创新设计和运维经验。

个人简介：主要研究移动云计算及新型网络协议。主持国家自然科学基金优青和面上项目、CCF- 腾讯犀牛鸟基金科研和创新项目、北京信息科学与技术国家研究中心青年创新基金项目等。已发表论文 90 余篇、他引 1600 余次，四次登上国内外重要期刊封面《中国科学：信息科学》《中国计算机学会通讯》《IEEE 云计算汇刊》《清华学报》，多项研究成果被百度、腾讯、小米等公司实际采用，受益用户过亿。曾获得 2009 年中国大学出版社图书奖一等奖、2015 年中国人工智能学会优秀博士论文奖、2015 年教育部自然科学一等奖、2016 年 CCF- 腾讯犀牛鸟科研优秀奖、2017 年 ACM 多媒体系统年会（MMSys）最佳学生论文奖、2019 年清华学报高被引优秀论文奖、2019 年 ACM 移动计算年会（MobiCom）最佳系统演示奖等。

嘉宾

回放

薛春

报告题目：基于近数据计算对大数据应用的优化技术

演讲摘要：随着云计算、5G、物联网等技术产业的快速发展，传统计算机架构的计算能力已经没有办法满足大数据的增长需求。近数据计算技术（Near Data Computing）的出现突破了大数据的瓶颈，将新型介质和硬件加速模块融合到计算机系统中已经成为一个必然的趋势。一方面，我们可以在靠近数据存储位置加入硬件加速模块，帮助 CPU 加速处理部分计算单元，本报告将从数据库读和写两方面来介绍硬件加速对系统性能的提升：（1）利用 FPGA 加速以读操作为主的关系型数据库查询，如 MySQL。利用 FPGA 的高效并行模块加速过滤大量冗余数据。（2）利用 FPGA 加速对写性能有高要求的键值存储数据库，如 LevelDB。这类数据库中的垃圾回收问题（Compaction），会造成数据库的性能抖动，利用 FPGA 可以加速 Compaction 操作，来减少性能抖动带来的影响。另一方面，我们可以用新型的 NVM 内存代替传统的 DRAM，本报告将以加速神经网络训练为例，分析在基于 NVM 的 CNN 训练过程中，训练精度和性能之间的平衡问题。

个人简介：主持完成了包括香港政府科研计划及公司合作在内的 20 余个科研项目。在国际顶级学术会议和期刊上发表论文 200 余篇，包括存储以及系统领域顶级会议 FAST，ATC，调度算法领域顶级会议 RTSS，体系结构领域顶级期刊 TC、TCAD，数据处理领域顶级期刊 TKDE 等。担任 Transactions on Storage (TOS)，Transactions on CPS 等多个国际期刊的副主编，担任 DAC，DATE 等多个国际会议的审稿人。主要研究方向包括移动与嵌入式体系结构、非易失性存储架构、存储与大数据。

嘉宾

陈榕

报告题目：基于 RDMA 的高效分布式内存计算系统栈

演讲摘要：以远程直接内存访问（RDMA）为代表的高性能硬件特性在数据中心计算场景中受到越来越多的关注。本次报告将与大家分享我们在基于以 RDMA 为核心的新型硬件体系构建高效分布式内存计算系统栈方面的一系列工作，将主要围绕如何利用 RDMA 和其他新型硬件特性支持在大规模图数据上的低时延、高并发操作（如，查询、分析和学习等）。

个人简介：主要研究方向为并行与分布式处理、内存计算和操作系统。在 SOSP、OSDI、NSDI、 EuroSys、Usenix ATC 等本领域重要学术会议与期刊发表论文 20 余篇，获得 EuroSys 等三项最佳论文奖，受邀多次担任 OSDI、ASPLOS、EuroSys、Usenix ATC, VEE 等国际会议 PC。

嘉宾

回放

陆游游

报告题目：闪存存储重构与系统设计

演讲摘要：以闪存带来了存储系统的颠覆性革新需求。由于磁盘作为外存的主要设备已经历 70 余年，现有的存储系统过多地针对磁盘特性进行设计与优化，难以发挥闪存的优势。本报告基于过去十年的探索，汇报软件直管闪存新架构及存储系统软件新设计。首先探讨面向闪存的存储系统在存储结构上 65 的变革，介绍基于裸闪存设备（也被称为 Open-Channel SSD）的软件直管闪存结构。接着从文件系统存储管理、命名空间管理及并发感知的数据布局等多个方面介绍闪存文件系统的研究进展。最后，介绍分布式闪存存储系统的设计，并总结基于闪存的存储系统设计中的机遇与难点。

个人简介：主要研究方向是非易失性存储、文件系统及分布式存储等，在 FAST、USENIX ATC、 ASPLOS、EuroSys、SC、VLDB、DAC 等国际顶级会议以及 ACM ToS、IEEE TC、TPDS 等国际顶级期刊上发表论文 20余篇。以第一作者在存储领域最高水平会议 FAST 2013和 FAST 2014上连续发表论文，并获得 IEEE NVMSA 2014 大会最佳论文奖和 MSST 2015 最佳论文提名奖。曾获得中国计算机学会优秀博士学位论文奖、ACM 中国操作系统分会新星奖、教育部技术发明一等奖（第 2 完成人），并入选首届中国科协青年人才托举工程。

嘉宾

崔鹤鸣

报告题目：基于数据中心同步网络的若干高速分布式容错与区块链系统

演讲摘要：数据中心网络层的一系列硬件与软件技术潮流，包括远程直接数据读写和软件定义网络等，极大促进了单数据中心或多数据中心互连网络的数据包分发的可靠性与同步性，这为高速分布式容错与协商系统的研发，提供了丰富的潜力。这些分布式容错与协商系统，不仅包括可容忍计算机单点失效的传统分布式容错系统，还包括可容忍拜占庭失效、可支持前沿区块链业务（例如去中心化的证券交易所和票据结算业务）的系统。本报告将介绍我在港大工作期间与我的博士生们研发的若干高速分布式容错系统，包括：（1）Plover，基于远程直接数据读写硬件的高速虚拟机容错系统；（2） BIDL，基于软件定义网络的低延迟、高吞吐量的区块链并行工作流。实验数据表明，Plover 和 BIDL 的吞吐量，均比国际上相应的最高性能的软件系统（例如 VSphere FT 和 Hyperledger Fabric）优数倍。

个人简介：他的研究兴趣包括分布式系统，大数据平台，分布式人工智能训练与服务等，并专注于构建新型的软件体系结构和工具，来极高地提升这些领域的软件的可靠性与安全性。崔老师最近五年的论文发表在国际知名系统软件会议和期刊，包括 SOSP ，NSDI，ATC，DSN，SOCC，ACSAC， SRDS，JSAC 和 TPDS。最近两年，崔老师受邀加入 NSDI，ATC，DSN，EuroSys，SOCC 和 ICDCS 等国际知名系统软件会议的编程委员会。作为项目主负责人，崔老师获得 2016 年香港求搓基金会前瞻科研大奖（500 万港元科研奖金），获两项华为创新科研计划奖励（其中一项为旗舰项目），三项香港研究资助局基础科研基金的奖励。在加入港大工作前 , 崔老师于清华大学计算机系获得本科与硕士学位 , 并于纽约市哥伦比亚大学计算机系获得博士学位。

嘉宾

回放

张献伟

报告题目：面向下一代计算需求的 GPU 探索与优化

演讲摘要：随着高性能和智能计算的飞速发展，以 GPU 为代表的加速设备已成为算力核心；而未来 E 级超算和以数据中心及 AI 为代表的“新基建”将对算力设施提出更迫切的需求。新算力时代，GPU 面临并行、能耗和易用性等多方面挑战，因而需要在硬件和软件层面作出一系列提升。硬件方面，如何提升效能及快速可靠的探索验证潜在方案？软件上，如何更快捷准确的优化应用程序？围绕以上问题，本报告将探讨 GPU 计算前沿问题，介绍在模拟平台（simulation）、硬件设计（design）和程序分析（profiling）等方面的研究工作。

个人简介：2017 年于美国匹兹堡大学获得博士学位，2017 至 2020 年任职于 AMD 公司从事 GPU 软硬件研发。研究集中在计算机系统结构和高性能计算领域，包括处理器、存储和系统模拟等。研究成果有十余篇论文发表在 HPCA、PACT 等会议，并获得 ISLPED’2013 最佳论文奖。AMD 工作期间，作为核心成员参与了 PathForward 和 Frontier 超算项目，完成多项专利申请和技术转让，荣获 Spotlight 杰出贡献奖。

嘉宾

回放

孙园园

报告题目：HotRing: A Hotspot-Aware In-Memory Key-Value Store

演讲摘要：In-memory key-value stores (KVSes) are widely used to cache hot data, in order to solve the hotspot issue in disk-based storage or distributed systems. The hotspot issue inside in-memory KVSes is however being overlooked. Due to the recent trend that hotspot issue becomes more serious, the lack of hotspot-awareness in existing KVSes make them poorly performed and unreliable on highly skewed workloads. In this paper, we explore hotspot-aware designs for in-memory index structures in KVSes. We first analyze the potential benefits from ideal hotspot-aware indexes, and discuss challenges (i.e., hotspot shift and concurrent access issues) in effectively leveraging hotspot-awareness. Based on these insights, we propose a novel hotspotaware KVS, named HotRing, that is optimized for massively concurrent accesses to a small portion of items. HotRing is based on an ordered-ring hash index structure, which provides fast access to hot items by moving head pointers closer to them. It also applies a lightweight strategy to detect hotspot shifts at run-time. HotRing comprehensively adopts lock-free structures in its design, for both common operations (i.e., read, update) and HotRing-specific operations (i.e., hotspot shift detection, head pointer movement and ordered-ring rehash), so that massively concurrent requests can better leverage multi-core architectures. The extensive experiments show that our approach is able to achieve 2.58× improvement compared to other in-memory KVSes on highly skewed workloads.

个人简介：分别于 2014 年和 2019 年在华中科技大学获得学士和博士学位。主要研究领域为云存储系统、安全数据库等。在 FAST、USENIX ATC、DAC、SoCC、MSST、TPDS 等国际会议和期刊上发表多篇论文。在 MSST’20 等会议上担任程序委员，TPDS、TOS、JCN 等多个期刊担任审稿人。

微信扫一扫：分享