演讲摘要:随着语言大模型和多模态大模型的迅速发展,机器人具身智能逐渐成为研究热点。在此背景下,本报告首先介绍采用最优数据训练的机器人具身大模型和采用最优及次优数据训练的强化决策大模型。然后,关注强化学习设计的机器人小脑,针对强化学习的采样效率低下问题和奖励函数设计困难问题,分别介绍我们团队近期在离线强化学习、迁移强化学习、自主奖励函数设计等方面的最新工作。最后,简单介绍强化学习与控制理论的耦合方法,有效缓解机器人的仿真真实差异问题。
讲者简介:王东林,博导,西湖大学人工智能领域主任,西湖机器人公司创始人,国家科技创新2030重大项目首席科学家。西安交通大学电信学院工学学士(2003)和硕士学位(2006),加拿大卡尔加里大学电子与计算机工程系博士学位(2010)。2017年加盟西湖大学,建立了机器智能实验室(MiLAB),主要研究强化学习和机器人具身智能,深入研究离线强化学习、模仿学习、人类反馈强化学习和机器人具身大模型及软硬件耦合等领域,发表ICML、ICLR、NeurIPS、CVPR、RSS等人工智能和机器人顶会顶刊论文150余篇,授权十余项国家发明专利。近五年主持承担了科技部重大项目、国家自然科学基金委等多项国家重要项目。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn