2022CCF青年精英大会
  • 登录
  • 注册
  • 欢迎您:hlladmin 退出
报名
分享

微信扫一扫:分享

微信里点“发现”,扫一下

二维码便可将本文分享至朋友圈

  • 首页
  • 会议报名
  • 会议动态
  • 本期嘉宾
  • 会议日程
    大会日程详细日程
  • 资料下载
  • 参会指南
  • 合作单位
  • 组织机构
  • 首页
  • 会议报名
  • 会议动态
  • 本期嘉宾
  • 会议日程
    大会日程详细日程
  • 资料下载
  • 参会指南
  • 合作单位
  • 组织机构
  • 欢迎您:hlladmin
  • 退出
  • 登录
我要报名

会议日程

大规模强化学习的未来之路

简介

近年来,深度强化学习研究取得了巨大成就,已在游戏、机器人等领域展现了出色性能,但强化学习所需样本量却远远超过人类。大规模深度强化学习模型(如AlphaGo、AlphaStar、OpenAI Five等)通过收集足够多的样本可以缓解样本效率低等问题,但又需要强大的算力支撑。在新一代信息技术大计算、大融合的背景下,分布式深度强化学习、海量多智能体强化学习等大规模强化学习研究迎来了新的发展机遇。然而,大规模强化学习尚未建立完整的科学技术体系,面临可解释性、稳定性和公平性等突出问题。论坛将围绕“大规模强化学习的核心科学问题是什么,如何工程落地,未来如何发展?”等问题邀请业界知名专家做演讲并参与讨论。

直播回放

CCF数图-直播回放
CCF视频号
WIZ直播
蔻享学术直播

说明:CCF视频号 直播,请使用【手机微信】扫描或识别二维码后进行观看

日程

时间:6.11  13:30 - 17:30
地点:在线V1
  • 时间

  • 演讲嘉宾

  • 演讲题目


  • 俞扬,CCF杰出会员,南京大学教授

  • 数据驱动的强化学习及其工业应用


  • 安波,新加坡南洋理工大学教授

  • 强化学习求解大规模复杂博弈


  • 郝建业,天津大学副教授

  • 大规模强化学习的未来之路


  • 张伟楠,CCF高级会员,上海交通大学副教授

  • 大规模离线强化学习


  • 卢宗青,北京大学助理教授

  • Advances in Multi-Agent Reinforcement Learning


  • 陈令奎,OPPO数智工程事业部机器学习部高级专家

  • 强化学习在oppo多场景落地的挑战

执行主席

钱宇华,CCF YOCSEF太原 荣誉AC委员、模式识别与人工智能专委会执委,山西大学计算机与信息技术学院教授、博导

个人简介:钱宇华,CCF YOCSEF太原 荣誉AC委员、模式识别与人工智能专委会执委,山西大学计算机与信息技术学院教授、博导,国家高层次人才,全球高被引科学家,国家优青。研究领域为人工智能、大数据、数据挖掘与机器学习等,在数据挖掘及人工智能领域的期刊和国际会议发表论文100余篇。曾获山西省自然科学一等奖、中国计算机学会优博奖、全国百篇优博提名奖等。

执行主席

魏巍,山西大学教授

个人简介:魏巍,山西大学教授,博士生导师,计算机与信息技术学院副院长,CCF YOCSEF太原候任主席。主要研究方向为数据挖掘、机器学习、粒计算。近年来,主持和参与国家重点研发计划项目、国家自然科学基金重点项目、国家自然科学基金面上项目、山西省自然科学基金项目10余项;主要围绕强化学习、度量学习、数据降维等领域的基础科学问题开展研究,先后在《IEEE TKDE》《Machine Learning》《Information Fusion》《Information Sciences》、AAAI等国际国内重要期刊和会议发表论文30余篇。

嘉宾

俞扬,CCF杰出会员,南京大学教授

演讲题目:数据驱动的强化学习及其工业应用
演讲摘要:强化学习现已成为机器学习最受关注的子领域之一,在游戏环境中表现出超越人类的决策控制能力。如何让强化学习走出游戏,用于生产力的提升,是报告人关注的问题。针对这一问题,报告人对数据驱动的强化学习开展了研究,并尝试使用在工业中应用。本次报告将汇报数据驱动强化学习的理论与技术进展,以及在工业中的应用案例。
个人简介:俞扬,CCF杰出会员,南京大学人工智能学院教授,主要从事机器学习、强化学习的研究工作。入选国家万人计划青年拔尖人才计划、AI's 10 to Watch。获CCF-IEEE青年科学家奖,首届亚太数据挖“青年成就奖”,并受邀在国际人工智能联合大会 IJCAI'18 作“青年亮点报告”(Early Career Spotlight)。研究工作获4项国际论文奖励和3项国际算法竞赛冠军。

嘉宾

安波,新加坡南洋理工大学教授

演讲题目:强化学习求解大规模复杂博弈
演讲摘要:近些年人工智能一些重要的突破(如德扑系统Libratus和安全博弈论)归功于大规模博弈求解技术在最近十年来的进展。然后博弈求解技术无法解决一些复杂的大规模博弈问题,学术界开始尝试将深度学习技术用来求解复杂博弈问题。 报告将讨论近年来这个方向的重要进展以及面临的挑战。
个人简介:安波是新加坡南洋理工大学计算机科学与工程学院的校长委员会讲席副教授和南洋理工大学人工智能研究院联席院长,于2011年在美国麻省大学Amherst分校获计算机科学博士学位。主要研究领域包括人工智能、多智能体系统、算法博弈论、强化学习、及优化。当选为国际智能体及多智能体系统协会理事会成员、AAAI高级会员及ACM杰出科学家。

嘉宾

郝建业,天津大学副教授

演讲题目:大规模强化学习的未来之路
演讲摘要:本报告首先会介绍深度强化学习背景与基础,然后从如何学的好、学的快、学的稳三方面介绍大规模深度强化学习所面临的挑战及相应的解决方案,同时介绍深度强化学习在自动驾驶控制、5G网络优化、供应链物流优化等场景的应用。
个人简介:郝建业,天津大学副教授,博士生导师。主要研究方向为深度强化学习、多智能体系统。发表人工智能领域国际会议和期刊论文100余篇,专著2部。 主持参与国家基金委、JKW、科技部、天津市人工智能重大等科研项目10余项,研究成果获ASE2019、CoRL2020最佳论文奖等、NeurIPS20-21黑盒优化比赛BBO、MineRL、求解器黑盒优化等冠军。研究成果在游戏AI、广告及推荐、自动驾驶、网络优化等领域落地应用。

嘉宾

张伟楠,CCF高级会员,上海交通大学副教授

演讲题目:大规模离线强化学习
演讲摘要:近年来深度强化学习已经成为人工智能研究界最受关注的方向之一,尽管如此,深度强化学习算法总是有样本效率低、和真实环境交互有风险等问题,这阻碍着该技术广泛落地到现实应用的进程。从2020年开始,离线强化学习技术开始被学术界关注,并在近期获得了较快的发展。离线强化学习限制智能体在训练阶段只能基于给定的经验数据集,不能和真实环境有交互,由此最大限度地使用了经验数据,并避免了还未训练好的智能体和真实环境交互的风险。因此可以看出,离线强化学习的成功发展能够大大推进强化学习技术的落地。在本次报告中,我将介绍离线强化学习的问题定义和核心科学问题,讨论近年来学术界关于离线强化学习的研究进展和前沿探索课题。最后我将讨论离线强化学习大模型研究的最新进展和未来发展的趋势。
个人简介:张伟楠,博士,现任上海交通大学长聘教轨副教授、博士生导师,科研领域包括强化学习、信息检索和数据科学,相关的研究成果在国际会议和期刊上发表超过100篇学术论文。张伟楠长期担任ICML、NeurIPS、ICLR、KDD、AAAI、IJCAI、SIGIR等机器学习和数据科学的会议(高级)程序委员和JMLR、TOIS、TKDE、TIST等期刊的评审以及FCS的青年编委。获得国家自然科学基金项目资助,入选上海市科委英才扬帆计划、中国科协青年人才托举工程,获得吴文俊人工智能优秀青年奖和达摩院青橙奖。张伟楠于2011年在上海交通大学计算机系ACM班获得学士学位,于2016年在伦敦大学学院计算机系获得博士学位。

嘉宾

卢宗青,北京大学助理教授

演讲题目:Advances in Multi-Agent Reinforcement Learning
演讲摘要:多智能体强化学习具有广泛的应用前景,近年来受到机器学习领域的广泛关注。本报告将介绍多智能体强化学习基础算法(值函数和策略梯度)的最新进展及应用。具体包括集中训练去中心化执行学习算法、去中心化学习算法、以及多智能体强化学习在现实场景中的应用。
个人简介:卢宗青,北京大学计算机学院助理教授(博雅青年学者),人工智能研究院研究员,决策智能课题组负责人,主要研究方向强化学习。他于2014年在新加坡南洋理工大学获得计算机博士学位,2014至2017年在美国宾州州立大学从事博士后研究,2017年9月加入北京大学。

嘉宾

陈令奎,OPPO数智工程事业部机器学习部高级专家

演讲题目:强化学习在oppo多场景落地的挑战
演讲摘要:近几年,强化学习在工业落地的建模上有了一些突破,能够在一些广告场景落地来解决部分决策问题,但是由于算法落地成本高,OPPO的算法工程师并没有享受到足够的强化学习带来的技术红利。如何来降低强化学习接入门槛,并给予算法工程提供足够丰富的衍生的算法服务仍是在OPPO落地的核心问题。本次报告将分享强化学习在OPPO的应用分发、浏览器等场景落地的技术挑战和解决方案,以及沉淀出的强化学习平台及服务的介绍。
个人简介:陈令奎,OPPO数智工程事业部机器学习高级专家。15年加入京东,参与了京东云的图像系统建设;18年加入阿里妈妈先后负责品牌广告,淘宝展示广告的机制策略;19年加入微博整体负责信息流及视频等业务的推荐算法。21年加入OPPO,整体负责强化学习平台建设。

版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn

京ICP备13000930号-4 京公网安备11010802032778号