AI大模型应用与基础系统创新 
报告题目:面向大模型的低精度自适应数值类型
演讲摘要:大模型的算力需求两年内增长了240倍,远超遵循摩尔定律的芯片制程所带来的提升。因此,计算架构的演进以及计算数值格式的革新成为了计算效率提升的关键。在本次分享中,我们深入分析了大模型中的数值分布特征,并设计了能够自动调整数值类型以贴近大模型中不同的张量分布,从而将大模型的计算数值位宽缩减到了4比特。在此基础上,我们也为自适应数值设计了对于存储子系统友好的编码格式,能够以极低的硬件开销发挥自适应数值类型的计算效率优势。
讲者简介:冷静文为上海交通大学计算机科学与技术系长聘副教授,主要研究方向为面向人工智能的新型计算系统的设计以及性能、能效、可靠性优化,主持和参与了多项自然科学基金以及龙头企业横向项目。在国际一流的会议和期刊上发表了四十多篇论文和相关国内国际专利,获得过DAC, PACT等多个国际会议的最佳论文提名奖。