第四届CSIG视觉大数据高峰论坛
时间:2020年9月19日下午13:30至16:00
地点:会场2(二楼多功能25号厅)
主持人:赫然
主讲嘉宾:彭宇新 北京大学
报告题目:细粒度视觉分类与检索
摘要:与一般的视觉分类不同,细粒度视觉分类旨在对粗粒度的大类(如鸟、车等)进行细粒度的子类划分(如大冠蝇霸鹟、阿卡迪亚霸鹟、蓝鹀等鸟类子类别;奥迪 A6、A8等车类子类别),其挑战在于外形、颜色等相似导致的不同类别差异小,姿态、视角等不同导致的相同类别差异大。如何借鉴人脑的认知机理,模拟视觉注意力机制学习多粒度的辨识性特征,突破细粒度视觉分类难题,对于提高计算机的感知和认知能力至关重要。本报告将介绍我们在细粒度视觉分类上的相关研究进展,包括空间拓扑注意力学习、堆叠式深度强化学习、层次化深度增量迁移学习等方法,以及我们在细粒度跨媒体检索上的探索,实现了由图像、视频到跨媒体的扩展,由分类到检索的扩展。
个人简介:
彭宇新,北京大学博雅特聘教授、博士生导师、2019年国家杰出青年科学基金获得者、国家万人计划科技创新领军人才、科技部中青年科技创新领军人才、中国人工智能产业创新联盟专家委员会主任委员、中国工程院“人工智能2.0”规划专家委员会专家、中国图象图形学学会理事兼副秘书长。主要研究方向为跨媒体分析与推理、图像视频识别与理解、计算机视觉。2016年获北京市科学技术奖一等奖(第一完成人)。主持了863、国家自然科学基金等20多个项目,发表论文160篇,包括ACM/IEEE
Trans和CCF
A类论文70多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任《IEEE
Transactions on Circuits and Systems for Video Technology》等期刊编委。
主讲嘉宾:查红彬 北京大学
报告题目:在线学习的途径
摘要:3D视觉的一个主要任务是利用传感器视点的变化与成像几何的约束来实现三维场景的几何与结构重建。因此,伴随传感器移动的动态视觉与3D视觉的关系愈加密切,SLAM(Simultaneous Localization and Mapping:即时定位与地图构建)技术再度成为3D视觉领域的研究热点。为了提高动态视觉系统在真实复杂场景中的应用能力,我们应充分强化视觉系统的环境自适应性,而在线学习方法是实现这一目标的有效途径。该报告将围绕基于在线学习的SLAM问题,介绍我们近来的一些想法和尝试,主要内容包括:面向自监督视觉里程计的序列对抗学习方法;具有在线自适应能力的自监督SLAM学习。
个人简介:
查红彬,北京大学信息科学技术学院智能科学系教授,机器感知与智能教育部重点实验室主任。主要从事计算机视觉与智能人机交互的研究,在三维视觉几何计算、三维重建与环境几何建模、三维物体识别等方面取得了一系列成果。出版学术期刊及国际会议论文300多篇,其中包括IEEE T- PAMI,IJCV, IEEE T-VCG, IEEE T-RA, IEEE T-SMC,ACM T-IST, JMLR, PR 等国际期刊以及ICCV, ECCV, CVPR, CHI, ICML, AAAI,ICRA等国际学术会议论文100余篇。
主讲嘉宾:刘青山 南京信息工程大学
报告题目:基于深度学习的遥感影像大数据分析
摘要:随着遥感技术的快速发展,遥感影像数据呈爆炸式增长,给进一步的分析和理解带来了巨多的挑战。同时,遥感影像和常见的图像相比,还存在多谱成像、非线性噪声、空谱混叠等问题,使得智能遥感影像分析一直是图像理解领域的研究热点。近年来,由于深度学习能自动从大数据中学习和抽象数据的特征,因此深度学习在遥感影像分析中也受到了越来越多的关注。在本报告中,我们将重点给大家汇报一下课题组在基于深度学习的遥感影像分析方面的进展,主要包括基于多尺度深度特征的遥感图像分类、类别驱动的空谱场景分析、以及气象遥感应用等。
个人简介:
刘青山博士现任南京信息工程大学教授、博导。2003年4月毕业于中科院自动化所模式识别国家重点实验室获博士学位,随后留实验室工作,2006年4月赴美国Rutgers大学访问、工作。2011年9月加盟南京信息工程大学。先后入选江苏省特聘教授、江苏省双创团队领军人才、江苏省优秀教育工作者、全国高校黄大年式教师团队、科技部中青年创新领军人才等。是江苏省人工智能学会副理事长、中国自动化学会模式识别与机器智能专委会副主任、中国计算机学会计算机视觉专委会副主任等。主要研究方向为图像与视频分析、模式识别、和AI+气象等。先后主持承担了国家杰出青年基金项目、国家自然基金重点项目、江苏省杰出青年基金等。以第一完成人获2016年度教育部自然科学二等奖、2018年江苏省高等学校自然科学一等奖,以及第三完成人获2018年中国电子学会自然科学一等奖等。
主讲嘉宾:卢湖川 大连理工大学
报告题目:单目深度估计及其在视觉问题中的应用
摘要:人类视觉系统具有从三维视角理解二维图像,从二维图像想象三维场景的能力,二维和三维之间就差了深度这一维,因此深度估计逐步成为计算机视觉领域中基础而又关键的课题。本次讲座将围绕单目深度估计领域的前沿研究展开,首先,概述单目深度估计领域当前的研究进展,进一步介绍基于语义信息辅助的单目深度估计算法,跨层级深度特征融合,以及分层级嵌入空间损失函数在深度估计中的作用。最后阐述深度数据在计算机视觉中的应用,将以基于RGB-D的显著性目标检测和图像浅景深效果渲染等课题为例,介绍我们在相关领域中的最新研究工作。
个人简介:
卢湖川教授,国家杰出青年基金获得者、科技部中青年创新领军人才,大连理工大学创新学院院长。研究方向为计算机视觉、机器学习、模式识别。发表顶级会议论文(CVPR/ICCV/ECCV)60余篇,Google Scholar引用19000余次,以第一完成人获得教育部自然科学二等奖2项。获得多项国际学术奖,包括CVPR2020 Best Paper Award Nominee, ICCV2011 Most Remembered Poster等。2017-2020年,在国际目标跟踪权威评测VOT竞赛中,其团队连续在多个赛道获得多个冠军。多次担任CVPR/ICCV/ECCV领域主席,目前担任IEEE Transaction on Cybernetics 和CSVT编委。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn