2023中国多媒体大会
  • 登录
  • 注册
  • 欢迎您:hlladmin 退出
报名 团报
分享

微信扫一扫:分享

微信里点“发现”,扫一下

二维码便可将本文分享至朋友圈

  • 首页
  • 会议动态
  • 组委会
  • 会议日程
    日程总览详细日程
  • 讲习班
  • 技术论坛
    多媒体女性菁英论坛技术论坛:人工智能与艺术创作技术论坛:大模型时代的多媒体内容理解与生成高峰论坛:数据和知识双轮驱动:从机器学习到学习机器技术论坛:人才发展论坛技术论坛:中科院计算所刊群论坛——三维媒体分析技术论坛:跨媒体智能分析与推理技术论坛:开放环境下的多媒体计算技术论坛:多模态媒体信息智能传播与分析技术论坛:三维点云数据分析、压缩与处理技术论坛:标注受限场景下的多视角和多模态学习技术论坛:AI4Food:食品和健康计算青年论坛(快手冠名):智能视频压缩技术论坛:媒体计算与可信传播技术论坛:大模型背景下的语音信号理解理论与技术
  • 参会指南
  • 大会征文
  • 注册与投稿
  • 资料下载
  • 诚征赞助
  • 会议照片
  • 线上直播
  • 首页
  • 会议动态
  • 组委会
  • 会议日程
    日程总览详细日程
  • 讲习班
  • 技术论坛
    多媒体女性菁英论坛技术论坛:人工智能与艺术创作技术论坛:大模型时代的多媒体内容理解与生成高峰论坛:数据和知识双轮驱动:从机器学习到学习机器技术论坛:人才发展论坛技术论坛:中科院计算所刊群论坛——三维媒体分析技术论坛:跨媒体智能分析与推理技术论坛:开放环境下的多媒体计算技术论坛:多模态媒体信息智能传播与分析技术论坛:三维点云数据分析、压缩与处理技术论坛:标注受限场景下的多视角和多模态学习技术论坛:AI4Food:食品和健康计算青年论坛(快手冠名):智能视频压缩技术论坛:媒体计算与可信传播技术论坛:大模型背景下的语音信号理解理论与技术
  • 参会指南
  • 大会征文
  • 注册与投稿
  • 资料下载
  • 诚征赞助
  • 会议照片
  • 线上直播
  • 欢迎您:hlladmin
  • 退出
  • 登录
我要报名

ChinaMM 2023高峰论坛 | 数据和知识双轮驱动:从机器学习到学习机器

发布时间: 2023.05.24

ChinaMM 2023 高峰论坛

数据和知识双轮驱动:从机器学习到学习机器


一、          论坛介绍


       推动人工智能第三次崛起的深度学习目前面临黑盒效应之涟漪、可解释性差、泛化能力弱等不足,迫切需要突破人工智能理论模型的天花板桎梏。从经过上百年的发展,科学研究或工程实践领域内积累了大量的多模态知识(如规则、逻辑、物理方程以及直觉经验等)。因此在人工智能模型中引入恰当的观察偏差、归纳偏差和学习偏差等约束,将多模态知识嵌入机器学习过程,不断增强机器学习模型的泛化能力,就可以扩充输入信息来源,有望打破模型泛化效果提升的瓶颈,即建立数据和知识双轮驱动机器学习模型,这是使得人工智能具有更泛化能力,以解决不可预知场景任务要突破的核心问题。从机器学习(machine learning)到学习机器(learning machine),是智能算法心之所向,让我们素履以往。

       本次论坛邀请数据与知识表示学习、跨媒体语义理解与推理、知识增强的模型设计、跨媒体应用等领域的专家学者介绍领域当前的研究现状、研究理念、方法与实践经验,并共同探讨数据与知识双轮驱动的人工智能新理论模型和技术发展趋势。


二、          论坛主席


吴飞,浙江大学

简介:浙江大学求是特聘教授,博士生导师。主要研究领域为人工智能、多媒体分析与检索和统计学习理论。浙江大学人工智能研究所所长、美国加州大学伯克利分校统计系访问学(2009.10-2010.8)。国家杰出青年科学基金获得者(2016年),教育部人工智能科技创新专家组工作组组长(2018.8-2020.12)、科技部科技创新2030“新一代人工智能”重大科技项目指南编制专家。担任中国工程院院刊《Engineering》信息与电子工程学科执行主编、中国工程院信息学部分刊信息电子前沿《Frontiers of Information Technology & Electronic Engineering》编委、中国计算机学会多媒体技术专业委员会常务委员。 著有《人工智能导论:模型与算法》(高等教育出版社出版)、浙教版普通高中教科书信息技术选择性必修教材《人工智能初步》(浙江教育出版社出版)和《走进人工智能》(高等教育出版社出版)等。在中国大学MOOC(爱课程)开设国家级一流本科课程(线上课程)《人工智能:模型与算法》慕课(https://www.icourse163.org/course/ZJU-1003377027)。曾获高等学校科学研究优秀成果奖(科学技术)科技进步一等奖(2022年度)、世界人工智能大会最高奖“卓越人工智能引领者奖”(2021年度)和中国电子学会科技进步一等奖(2021年度)。



 

赵洲,浙江大学

浙江大学计算机学院教授、博士生导师。主要研究方向为自然语言理解、计算机视觉计算和生成式模型,在国际期刊和会议上发表50余篇论文,谷歌学术引用8000多次。获教育部科技进步一等奖(2022年)、中国电子学会科技进步一等奖(2021年)。


三、          论坛嘉宾

 

庄越挺,浙江大学

报告题目:基于大模型的跨媒体智能

讲者简介:庄越挺,国家杰出青年基金获得者,教育部长江学者特聘教授,973项目首席科学家,“百千万人才工程”国家级人选,享受国家政府特殊津贴,中国人工智能学会会士,中国图像图形学学会会士,浙江省特级专家。曾任浙江大学计算机学院院长,浙江大学人工智能研究所所长,中国图像图形学学会副理事长。现任浙江大学求是特聘教授,浙江大学学术委员会副主任, 教育部人工智能协同创新中心主任,数字图书馆教育部工程研究中心主任,中国人工智能学会常务理事,浙江省计算机学会理事长。主要从事人工智能、大数据智能处理、多媒体信息检索、跨媒体计算理论等领域的研究。作为第一完成人,曾获国家科技进步奖二等奖、浙江省科技进步奖一等奖等多项奖励。

报告摘要:大模型可视为一种特殊的数据结构,通过模型参数学习的方式,从海量预训练数据中隐式学习与存储了丰富的世界知识,从而支撑了跨媒体的搜索和推理生成(AIGC)。本次报告将回顾跨媒体智能的历史,亟待解决的关键科学问题,结合自己的研究,探讨了大规模预训练模型在跨媒体智能研究中的前沿技术和实践,包括如何结合大模型实现细粒度语义对齐(如LOUPE)、个性化内容可定制的跨媒体综合推理系统(如HuggingGPT)、自主数据工作流(Data-Copilot)等,最后对跨媒体智能的发展趋势做了展望。


 

黄庆明,中国科学院大学

报告题目:数据与知识联合驱动的跨媒体内容管理与服务

讲者简介:黄庆明,中国科学院大学讲席教授、博士生导师,国家杰出青年科学基金获得者,百千万人才工程国家级人选,IEEE Fellow,CCF会士,CCF理事,CCF多媒体技术专业委员会副主任,IEEE CASS北京分会主席,中国图象图形学学会常务理事,北京图象图形学学会副理事长。主要研究领域为跨媒体计算、计算机视觉、模式识别、机器学习等,累计发表IEEE/ACM汇刊论文和CCF-A类会议论文200余篇。承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点项目和重点国际合作项目、973课题、863课题等重大项目,获得吴文俊人工智能自然科学一等奖、教育部科技进步一等奖等多项国家学会和省部级奖励。

报告摘要:当前,网络跨媒体内容呈现爆炸性增长趋势,深入渗透人类社会活动的方方面面,对海量人群的生产生活方式产生重要影响。跨媒体分析推理是在对图像、视频、文本等模态组合信息的贯通计算基础上,实现对跨媒体内容的深度理解和搜索、问答、推荐等形式的内容交互,是支撑清朗网络空间构建和多元化跨媒体内容服务的重大共性关键技术。本报告围绕传统数据驱动方法的固有缺陷和跨媒体知识结构复杂性等问题,介绍团队提出的数据与知识联合驱动的跨媒体分析推理方法框架,包括面向复杂应用场景的解耦学习与曲线优化学习方法、跨媒体知识图谱构建与知识表征方法、面向多元化应用需求的跨媒体推理与内容交互,以及在跨媒体内容管理与服务方面的技术应用等。最后,结合当前生成式AI的快速发展趋势,对跨媒体内容管理与服务技术的发展前景进行展望。



赵耀,北京交通大学

报告题目:跨模态多元医学数据协同理解与知识获取

讲者简介:赵耀,长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才、IEEE Fellow。现任北京交通大学信息科学研究所所长,“现代信息科学与网络技术”北京市重点实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数字媒体内容安全,媒体内容分析与理解,人工智能等。主持了科技创新2030——新一代人工智能项目、973计划、863计划等项目30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获北京市科学技术奖一等奖等省部级奖励5项。指导的博士生8人获北京市和中国计算机学会优秀博士论文奖。受邀担任了 IEEE Transactions on Cybernetics、IEEE Transactions on Circuits and Systems for Video Technology等多个国际杂志编委。他是“信息与通信工程”学科国务院学科评议组成员,科技部重点研发计划云计算与大数据专项总体组专家。

报告摘要:跨媒态多元医学数据的涌现以及AI技术的发展为实施智慧医疗奠定了基础。然而,对于广泛存在的跨媒态多元医学数据,存在着典型的多态异构、多源异质、完备性不足、非结构、以及动态时序等特性,由此导致智慧医疗技术在实际落地应用中普遍面临着结构混杂、内容缺失、主诉模糊、标注困难、语义黑箱等关键难题。跨模态多元数据协同理解与知识获取是打破医疗数据信息孤岛现象、实现多元异构医疗数据的知识聚合、提升智慧医疗水平的基础和关键。从适应医学场景出发,本报告从多元医学数据的统一表征、关联建模、多重本体知识协同、及知识主动获取几个方面重点介绍我们最近的一些相关研究进展。借此次报告机会,希望增强与国内同行对相关技术的交流与探讨,共同推进跨模态技术在医学领域的发展。

  

 

余正涛,昆明理工大学

报告题目:数据与知识融合的南亚东南亚低资源语言机器翻译

讲者简介:余正涛,昆明理工大学教授,云南省人工智能重点实验室主任,博士生导师,国家首批万人计划科技创新领军人才,国家百千万人才,国家有突出贡献中青年专家,云南省科技领军人才,中国中文信息学会常务理事,中国自动化学会理事。主要从事自然语言处理、机器翻译、语音识别及合成等方向研究,主持完成国家重点研发计划项目、国家自然科学基金重点项目、国家自然科学基金联合基金重点项目、云南省科技重大专项项目等60余项,在TIP,PR,SIGIR,ACL,EMNLP等顶级会议及期刊发表论文百余篇,以第一获奖人获得云南省科技进步特等奖、云南省自然科学一等奖、云南省科技进步一等奖等各类科技奖励10余项。在东南亚语言信息处理与机器翻译方面取得多项创新性成果,研发的南亚东南亚语言机器翻译系统—云岭翻译在网信,网安,政务,旅游及公众服务等领域得到广泛应用。

报告摘要:“一带一路”背景下,南亚东南亚低资源语言机器翻译有着重要的产业需求。南亚东南亚语言翻译面临对齐数据资源稀缺、语言形态复杂、翻译知识融合困难等问题,翻译效果还不理想。本报告首先介绍南亚东南亚低资源语言翻译数据及知识自动构建方法、然后介绍多粒度语言知识融合的南亚东南亚词法句法解析方法,在此基础上,从翻译数据有效利用、语言知识融合、翻译模型结构优化等方面介绍南亚东南亚语言翻译关键技术,最后面向应用场景介绍南亚东南亚语言翻译平台及翻译产品研发方面的进展。


  

 

薛向阳,复旦大学

报告题目:基于重建的组成式视觉场景表示学习

讲者简介:薛向阳,复旦大学计算机科学技术学院教授,博士生导师。主要从事计算机视觉、多媒体内容识别和类脑智能等研究,在IEEE TPAMI、TIP等国际权威期刊和CVPR、ICCV、ICML、NeurIPS、AAAI、IJCAI、ACM MM等CCF推荐A类会议上发表百余篇论文,曾获ICME 2017最佳会议论文奖和IEEE TMM 2016年最佳论文提名奖。作为主要完成人,他先后荣获国家级科技进步奖一等奖和二等奖各1项、省部级科技奖一等奖6项。他目前担任复旦大学大数据研究院和类脑智能科学与技术研究院副院长。

报告摘要:组成式视觉场景表示学习是目前计算机视觉领域一个较偏基础的研究任务,它通过学习场景中以物体为中心的视觉概念表示,实现对视觉场景的解析,具有较强的可解释性。这类方法主要基于场景图像重构实现深度神经网络模型参数学习,能大幅度减少对数据标注的要求,可实现完全无监督学习。现有的组成式视觉概念学习与场景解析方法在比较复杂的合成场景数据上取得了显著的研究进展,并在简单真实场景数据上表现出良好性能。本报告首先从视觉场景建模和场景表征推断的角度,概述基于重构的深度神经网络组成式场景表示学习的当前进展,然后介绍我们提出的先验知识引导的视觉场景无监督学习方法,最后进一步讨论了现有方法的局限性和未来研究方向。




于俊清,华中科技大学

报告题目:视觉跟踪的研究进展与趋势分析

讲者简介:于俊清,博士,教授,博士生导师,国家一流本科课程负责人,湖北省优秀基层教学组织负责人,本科和研究生课程责任教授,长期从事智能媒体计算、网络安全和信息化领域的教学科研工作,华中科技大学智能媒体计算和网络安全研究团队负责人,华中科技大学副校长、CERNET华中地区网络中心主任,武汉金银湖实验室副主任,中国计算机学会多媒体专业委员会常务委员、中国图学学会常务理事、中国图学学会动漫图学工程专业委员会主任。主持国家重点研发计划、国家863项目、国家自然科学基金、湖北省杰出青年基金等多项科研课题,在CVPR、NeurIPS、ICCV、AAAI、ISCA、CGO、ECCV、ICMR、TPAMI、TPDS、TMM、TCSVT、JPDC、Computer Network等重要会议和期刊上发表论文50余篇,出版教材1本、专著3本、译著1本,授权发明专利和软件著作权60余项,2021年入选高校计算机专业优秀教师奖励计划,获得省部级教学和科技奖励4项。

报告摘要:视觉跟踪是计算机视觉中基础且关键的研究方向之一,旨在持续跟踪目标物体的运动轨迹。在智能监控安防、无人自动驾驶、现代化军事以及体育运动分析等诸多领域中,视觉跟踪具有广泛的应用。近年来,随着注意力模型在计算机视觉各个任务上的不断发展,基于注意力模型的视觉跟踪研究也取得长足进步。注意力模型可以有选择地处理输入信息,引导视觉模型关注与特定任务相关的部分。视觉跟踪的核心在于衡量图像帧与目标物体的相似程度,因此注意力模型中图像与目标之间的信息交互和计算机制对增强跟踪算法的性能至关重要。报告从视觉跟踪模型中的注意力机理出发,探讨注意力的底层计算方式以及图像之间的交互模型,分析其在单目标和多目标跟踪中的应用效果。


四、          圆桌讨论

主持人:吴飞

庄越挺,黄庆明,赵耀,余正涛,薛向阳,于俊清


五、          会议议程 

议题

姓名

Title

论坛背景与嘉宾介绍

主持人:吴飞

浙江大学 教授

论坛报告

薛向阳

复旦大学 教授

庄越挺

浙江大学 教授

黄庆明

中国科学院大学教授

赵耀

北京交通大学   教授

余正涛

昆明理工大学   教授

于俊清

华中科技大学   教授

圆桌讨论

论坛嘉宾



版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn

京ICP备13000930号-4 京公网安备11010802032778号