演讲摘要:本报告提出了一种“通专融合”方式,旨在构建兼具强泛化性与深度专业能力的通用人工智能系统。通过三层技术体系--基础模型层的高效泛化能力构建、融合协同层的泛专结合、自主进化与交互层的具身自主学习,我们正在发展一套能高效适应并解决现实世界复杂问题的通用人工智能系统。报告将探讨这一系统的实现路径与关键问题,并结合最新的技术进展做出解析。
讲者介绍:周伯文,上海人工智能实验室首席科学家,清华大学惠妍讲席教授、电子工程系长聘教授,IEEE/CAAI Fellow,国家新一代人工智能治理专业委员会委员、新一代人工智能发展研究中心专家委员会委员,科技创新2030-“新一代人工智能”重大项目首席科学家。曾任IBM Research人工智能基础研究院院长、IBM Watson Group首席科学家、IBM杰出工程师;京东集团高级副总裁、集团技术委员会主席、云与AI总裁。 周教授具备丰富的国际化科学研究与管理经验,长期开展人工智能国际前沿基础理论研究、技术创新、人才培养及大规模产业化应用,不仅推动了“产-学-研-用”的全链路整合贯通,更在国际视野下实现了这一链条的无缝衔接与高效协同,荣获我国智能科学最高奖“吴文俊人工智能杰出贡献奖”等。 在国际一流期刊及顶级学术会议上已发表上百篇论文,获引用数万次,其中多篇开拓性论文单篇他引数千次,在人工智能技术和产业界大规模应用核心领域取得杰出成就,有较高的国际影响力。2016年,周教授带领团队在国际上首次提出与下游任务无关的自注意力与多头机制等表征新机理与新方法,奠定了Transformer架构的理论基础之一,推动通用人工智能、语言大模型表征新进展,是实现生成式AI的重要里程碑。周教授其他两篇生成式AI代表性论文总计被引5000余次。产业落地上,曾先后领导了IBM Watson平台及京东NeuHub平台的技术路线,推动了人工智能技术在产业界的大规模商业化。2003年,牵头研制出了世界第一个完全嵌入式的大词汇量的语音到语音双向实时翻译系统。