竞赛论坛
主讲嘉宾:李娇娇,希腾,惠政,贾灏哲,毛宇昕
时间:2021年9月25日13:30-15:30
地点:3楼杰汇厅
报告嘉宾1:
李娇娇
报告题目:Adaptive Weighted Attention Network with Camera Spectral Sensitivity Prior for Spectral Reconstruction from RGB Images
报告摘要:近年来,深度卷积神经网络在光谱重建任务中进行了广泛的研究,并取得了显著的性能。然而,大多数基于卷积神经网络的光谱重建算法忽略了相机光谱灵敏度先验和中间特征的相互依赖关系,从而限制了网络的表达能力和光谱重建的性能。为了解决这些问题,我们提出了一种新的自适应加权注意网络,其骨干网络是由多个具有长短跳跃连接的双残差注意力模块构成。具体而言,我们研究了一个自适应加权通道注意力模块,通过提取通道之间的相关性来重新分配通道特征响应。通过二阶非局部操作获取远距离空间上下文信息,开发了一个基于分块的二阶非局部模块,以实现更强大的特征表示。基于RGB图像可被重建的高光谱图像和给定的CSS函数积分得到的事实,我们将输入端RGB图像和输出端高光谱图像的差异都作为损失函数约束,以实现更精确的重建。实验结果表明,所提出的自适应加权注意网络在定量比较和感知质量方面优于其它光谱重建的方法。并在NTIRE 2020光谱重建挑战赛“Clean”赛道上获得了第一名。
个人简介:李娇娇,西安电子科技大学通信工程学院副教授、硕士生导师。2016年12月于西安电子科技大学信息与通信工程学科获得工学博士学位,研究方向为遥感图像智能处理、深度学习、三维点云语义分割等。迄今为止,以第一作者和通信作者身份,发表国际期刊和会议论文40多篇,中科院二区以上SCI检索论文26篇,包括不限于IEEE TNNLS、TGRS、RS等期刊。2021年入选陕西省高校科协青年人才托举计划项目。2020年在计算机视觉顶级会议CVPR主办的国际图像视频复原和增强大赛(NTIRE2020)光谱重建“Clean”赛道中获得冠军,光谱重建精度和处理速等关键指标均排名第一。2020年在第二届全国人工智能大赛“华为 昇腾杯” AI+遥感影像赛道获得全国三等奖 (6/1732)。2019年在中央军委指导、航天系统部主办的首届 “天智杯”人工智能挑战赛中,荣获赛道冠军。在遥感图像智能处理领域先后主持和参与了国家自然科学青年基金、中国博士后特别资助、军委科技委预研类项目、科技创新2030“新一代人工智能”重大项目(地外探测无人系统自主智能精准感知与操控)等多项在研课题。
报告嘉宾2:
希滕
报告题目:基于高斯过程神经架构搜索的图像超分技术
报告摘要:随着深度神经网络的发展,最近state-of-the-art (SOTA) 的图像超分辨率 (SR) 方法使用密集跳连的深度残差网络取得了显著的性能提升。虽然这些方法在人工构建的低分辨率(LR)的基准数据集上表现良好,但是在真实的低分辨率场景往往效果不佳。这是因为人工构建的低分辨率图像是通过高分辨率图像生成的,具有已知的模糊核。而真实场景中的低清图像是从真实相机中采集的,图像超分更具挑战性。因此,我们基于现有的密集残差网络构建了模型层数可变、密集残差块的数量可变、特征维度可变的图像超分的搜索空间,然后基于高斯过程神经架构搜索(GP-NAS)技术,搜索最优的超分单模型。进一步基于GP-NAS产出的一系列优质单模型,我们从中选择差异化的AutoDL模型进行多模型融合。所提出的方法在ECCV AIM 2020真实图像超分辨率挑战赛的全部3个赛道中都获得了冠军。本次报告除了分享AIM 2020的获奖内容之外,还会延伸介绍一些其他国际竞赛中使用AutoDL技术夺冠的经历。
个人简介:希滕,现任百度视觉技术部资深研发工程师,是百度AutoDL技术负责人以及人脸基础技术负责人,主要为PaddleSlim模型压缩平台以及人脸系列产品提供算法支持。 2018年博士毕业于北京邮电大学,曾获国家奖学金国家公派出国,入选百度『AIDU』全球顶尖人工智能人才计划;2019年1月-2021年3月,在清华大学计算机科学与技术系博士后流动站、百度博士后工作站从事博士后研究工作。在模型压缩领域,原创性的提出了SA-NAS(IJCV)和GP-NAS(CVPR)等AutoDL技术,并在CVPR2019,CVPR2020,ECCV2020 等多个顶级会议、国际比赛上,夺得7项世界第一,提交专利申请超过200项。在CVPR 2021举办了NAS workshop和首届轻量级NAS国际比赛,协助举办了2019百度之星AI开发者大赛、ICML 2021 Expo workshop:PaddlePaddle-based Deep Learning at Baidu。
报告嘉宾3:
惠政
报告题目:极限图像补全
报告摘要:图像补全任务是恢复具有一定程度损坏或缺失的区域。通常,这些区域是退化的结果、伪影、或者是人为修改的(例如目标移除、图像编辑的区域进行涂白处理)。此任务的目标是填充图像中缺失的像素,以便生成的像素与图像的其他部分协调一致,在视觉上看似合理。最近,在生成式对抗网络的帮助下,图像补全技术显示出了良好的发展前景。然而,通常假设补全区域很小(相对于整幅图像而言)。极限图像补全则针对从低分辨率到高分辨率的各种尺寸的图像、更多缺失的像素、各种形状和大小的掩膜,旨在生成具有真实感的修复区域。针对该任务,本报告将介绍ECCV 2020 Workshop AIM极限补全赛道的冠军方案,其主要包含两个方面:生成器和损失函数的设计。生成器方面主要介绍提出的多尺度密集连接模块,其拥有合适的计算量和更大的感受野。损失函数方面主要介绍提出用于特征匹配的自导回归损失以及引入坐标信息的几何对齐损失,专注于图像补全结果的细节。
个人简介:惠政,男,在读博士研究生。主要研究方向为图像/视频超分辨率及补全。以第一作者的身份在国际会议CVPR发表论文2篇、ACMMM发表论文1篇。以第一作者的身份获得NTIRE 2018 (CVPR Workshop)单帧图像8倍超分辨率赛道冠军、AIM 2019 (ICCV Workshop)高效图像超分辨率挑战赛Track1&Track2冠军、AIM 2020 (ECCV Workshop)极限图像补全总冠军。获得由声网举办的AI in RTC 2019 图像超分辨率性能挑战赛冠军,AI in RTE 2020图像超分辨率挑战赛亚军。获得首届“马栏山杯”国际音视频算法大赛(2020)画质损伤修复赛道亚军,第二届“马栏山杯”国际音视频算法大赛(2021)视频补全赛道冠军。
报告嘉宾4:
贾灏哲
报告题目:BraTS 2020大脑胶质瘤分割竞赛,MyoPS 2020心肌病灶分割竞赛获奖方法介绍
报告摘要:由于大脑胶质瘤中往往包含很多细小和不规则的区域,同时肿瘤在大脑中的位置和形态变化较大,现有的分割模型的分割准确率仍有待提升。针对这一问题,我们提出高分辨率和非局部特征学习网络,利用平行多尺度融合模块来增强网络的高分辨率特征学习能力。同时引入期望最大注意力模块,高效低成本地增强模型提取全局依赖性信息的能力,进而提高模型的分割准确率。我们使用包含单模型和级联模型的混合分割模型,在BraTS 2020分割竞赛的中取得了第二名的成绩。心肌存活能力评估在心肌梗死(myocardial infarction ,MI)患者的诊断和治疗管理中是至关重要的。心脏磁共振(Cardiac magnetic resonance,CMR)能够提供成像心脏的解剖和功能信息,结合多序列CMR数据对心肌病理进行分类,将心肌分为正常、梗死和水肿区,这对患者的诊断和治疗管理十分重要。我们提出了一种简单有效的深度卷积神经网络模型来分割多序列磁共振数据中的水肿和疤痕区域。该模型以EfficientNet为编码器来进行特征提取,以双向特征金字塔网络作为译码器来对分割掩模进行预测。这种网络结构的参数量相比传统卷积网络来说要少得多,而且双向特征金字塔网络能够融合更加丰富的多尺度特征。模型同时使用了一种在心肌病灶分割任务中十分有效的边界损失函数,从而进一步提高了分割准确率。该模型在MyoPS心肌病灶分割竞赛中取得第三名的成绩,并获得了竞赛的荣誉提名奖。
个人简介:贾灏哲,西北工业大学计算机学院在读博士生,导师为夏勇教授。曾入选CSC硕士公派项目赴悉尼大学蔡卫东副教授团队学习交流,目前在匹兹堡大学黄恒教授团队参与进行博士联合培养。研究方向为医学影像处理、深度学习、语义分割等。迄今为止,发表国际期刊和会议论文十余篇,包括不限于IEEE TMI、JBHI、MICCAI、ISBI。多次担任MICCAI、JBHI等国际会议和期刊的审稿人。2020年参加BraTS 2020国际大脑胶质瘤分割竞赛,在分割子任务中获得亚军。
报告嘉宾5:
毛宇昕
报告题目:鲁棒光流估计
报告摘要:光流估计是计算机视觉研究中的一个经典任务,在视频理解、运动分析和自动驾驶等下游任务起到了至关重要的作用。近年来随着深度学习方法的发展相关算法的精度取得了显著的提升,但如何提高其在复杂场景以及实际落地中的应用依旧值得研究。RVC挑战赛的目标是提高视觉算法在现实世界的可用性和鲁棒性,光流估计子赛道着重考验模型在跨数据集跨域的严重分布失衡条件下的泛化性能,使用的数据集涵盖仿真/真实、稠密/稀疏、高/低分辨率、室外/室内、复杂非刚性运动和光照变化等多种场景。针对这一目标,提出的方法针对数据处理和训练流程进行了研究。此外,为提高网络对高分辨率的小物体和精细运动边缘的光流估计的精度,在网络中引入更高分辨率的金字塔结构,以充分利用高分辨率图像特征中的细节信息。从实验结果上看,在精细运动的精度和单个模型在跨数据集上的泛化性能相比已有方法取得了显著提升。
个人简介:毛宇昕,男,西北工业大学电子信息学院在读博士生,师从戴玉超教授。主要研究方向为光流估计和图像去模糊等。已发表SCI论文一篇,获得ECCV2020 Robust Vision Challenge光流估计赛道亚军。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn