图像复原与增强论坛

会程安排

9 月 21 日 上午

分论坛主席

田春伟
教授 ⋅ 哈尔滨工业大学
田春伟,哈尔滨工业大学计算学部教授、博士生导师。2022-2024斯坦福大学全球前2%顶尖科学家年度榜单入选者。黑龙江省人工智能学会青工委主任。研究方向为视频/图像复原和识别、图像生成、语音处理与智能交通、视觉安全、大模型与多模态等。在IEEE Trans汇刊、Pattern Recognition、Neural Networks、Information Fusion 等国际期刊上发表论文90余篇。其中,7篇ESI高被引论文(3篇热点论文)、4篇Top期刊封面论文、4篇国际图像超分辨领域Benchmark论文、3篇GitHub 2020具有贡献代码、1篇论文技术美国医学影像公司CT机购买应用、1篇论文技术应用在苹果手机日系系统上。获得国际模式识别领域Top期刊Pattern Recognition Best Paper奖(排名第1)、1篇国际信号处理协会Blog论文(排名第1)、1篇中国人工智能学会Top期刊CAAI Transaction on Intelligence Technology的Excellent Paper,中国图象图形学学会自然科学奖二等奖(排名第1), 广东省自然科学奖一等奖。担任 CAAI Transaction on Intelligence Technology, IEEE TFS、IEEE TCE等多个 SCI 期刊编委/客座编辑。
李峰
副教授 ⋅ 合肥工业大学
李锋,合肥工业大学副教授。主要研究方向为计算机视觉、图像视频增强及多媒体信息处理。主持国家自然科学基金青年基金,国家自然科学基金重点项目课题负责人,参与包括科技部重点研发计划等多项项目。获IEEE CVPR NTIRE双目图像超分挑战赛亚军。在包括IEEE TPAMI、IJCV、CVPR、ICCV、ICLR等CCF-A类会议、IEEE汇刊上发表论文40余篇。
江俊君
教授 ⋅ 哈尔滨工业大学
江俊君,哈尔滨工业大学计算学部长聘教授、博导,人工智能学院副院长,智能接口与人机交互研究中心副主任,入选国家级青年人才计划,哈尔滨工业大学“青年科学家工作室”学术带头人。2014年12月于武汉大学计算机学院获得博士学位,2016年至2018年在日本国立情報学研究所担任特任研究员。研究方向主要包括图像处理、计算机视觉、深度学习(研究侧重大模型与图像处理、多模态自主无人系统、生成式人工智能等)。相关研究成果发表IEEE Transactions期刊论文和CCF A类会议论文百余篇,发表论文被谷歌学术引用2万余次,H因子为67,入选全球高被引科学家、中国高被引学者、全球前0.05%顶尖科学家等榜单。出版人脸超分辨率和高光谱图象处理专著各1部,获得国家发明专利授权27项。担任Information Fusion期刊编委(2024年获最佳编委奖)、Fundamental Research和IEEE/CAA JAS期刊青年编委。曾获吴文俊人工智能优秀青年奖、中国计算机学会优秀博士论文奖、ACM-武汉优秀博士论文奖、湖北省优秀博士论文奖、ICME 2017最佳论文提名、MMM 2015最佳学生论文奖亚军、IFTC 2018 最佳论文奖,2016年获湖北省科技进步一等奖。指导博士生获得首批国家自然科学基金青年学生基础研究项目资助,指导学生在国际顶级会议挑战赛11次获得冠亚军。主持国家重点研发计划课题、国家自然科学基金联合重点/面上/青年项目。
杨文瀚
副研究员 ⋅ 鹏城实验室
杨文瀚,鹏城实验室副研究员、国家级青年人才、鹏城国家实验室/南方科技大学博士生导师。研究方向主要为端云媒体协同计算、面向算力网环境的高效视觉特征编码与适配。累计发表CCF A类会议/IEEE会刊论文80余篇,其中第一作者20余篇,Google学术引用1.7万余次。曾获得北京大学优秀博士学位论文、IEEE ICME-2023 Multimedia Rising Star Runner-Up Award、IEEE ICME-2020最佳论文奖。担任新一代人工智能产业技术创新战略联盟AI标准工作组视觉特征编码专题组联合组长、IEEE 3483多模态特征编码工作组副组长和广东省图象图形学会理事。
张宇伦
副教授 ⋅ 上海交通大学
张宇伦,上海交通大学,任长聘教轨副教授,入选国家海外高层次青年人才。主要研究方向是计算机视觉和机器学习,具体包括图像/视频复原与合成,模型压缩,计算成像,多模态计算,大语言模型等。在计算机视觉,机器学习,多媒体,人工智能等领域的顶级国际期刊和会议上发表学术论文100余篇。论文Google学术引用28000余次,一作论文单篇最高引用6300余次。获得2015年IEEE VCIP最佳学生论文奖,2019年IEEE ICCV RLQ Workshop最佳论文奖,全球AI华人新星百强(2021年),连续多年入选斯坦福“全球前2%顶尖科学家”榜单(2021-2024年),入选2024年爱思唯尔“中国高被引学者”。近年来担任顶级会议CVPR, ICCV, ECCV, ICLR, NeurIPS, ICML, ACM MM, IJCAI, AAAI领域主席。

分论坛报告

低质量图像恢复与识别
董伟生 教授 ⋅ 西安电子科技大学
报告摘要:针对图像恢复这一病态逆问题,提出基于参数化图像模糊核估计方法,提升图像恢复性能;针对快速图像超分辨任务,提出二值化图像超分辨模型;针对严重退化的图像恢复任务,提出基于生成式先验的图像恢复方法。对于低质量图像恢复问题,提出基于信息熵的图像特征增强和对抗训练的低质量图像识别方法。
讲者简介:董伟生,西安电子科技大学人工智能学院教授、副院长,教育部“长江学者”特聘教授。主要从事图像视频处理、深度学习、计算机视觉等方面的研究工作。主持包括部委重大项目、国家自然科学基金重大项目课题等项目,曾入选国家“优青”、万人计划“青年拔尖人才”等人才计划。在国际权威期刊和会议上发表论文170余篇,论文已被Google引用12000余次。曾任中国计算机学会推荐A类期刊IEEE Trans. on IP编委,现任SIAM Journal on Imaging Sciences编委。曾获国家自然科学奖二等奖1项(排名第二),陕西省自然科学一等奖2项、中国电子学会技术发明一等奖1项。
高效可控生成式复原方法
潘金山 教授 ⋅ 南京理工大学
报告摘要:现有的基于判别式建模的复原方法面临细节丢失的问题,而基于生成式建模的复原方法面临可控性不足、计算效率低的问题。为此,本报告将介绍内容保真的扩散模型、内容自适应扩散模型等高效可控生成式复原模型构建方法解决上述问题。
讲者简介:潘金山,南京理工大学计算机科学与工程学院教授、博士生导师;主要从事图像视频复原与增强等相关底层视觉问题的研究;目前在国际权威期刊和会议上发表论文100余篇,谷歌学术引用1.6万余次;研究工作曾获国家优秀青年科学基金、联合基金重点项目等的资助;在历史影像及经典影视修复方面的成果受到新华社、央视综合频道CCTV-1、央视网、央视频等多家媒体报道;目前担任IEEE TPAMI、TMM、CVIU等期刊的编委以及CVPR、ECCV、NeurIPS、ICML、ICLR等国际会议的领域主席。
迈向通用影像增强计算:从数据拟合到关系建模
刘家瑛 教授 ⋅ 北京大学王选计算机研究所
报告摘要:传统图像增强与降质建模多依赖于针对单一降质的特定数据拟合,较难以泛化。随着大模型发展,具备面向多降质与多场景的统一建模能力,为增强模型的泛化与自适应带来新机遇。本文从范畴论视角梳理各类降质建模方法,提出基于大模型和提示词驱动的统一增强框架,实现了任务与场景的自适应增强。具体而言,一方面针对低光增强任务,提出了物理光传输理论启发的光照不变先验,实现了无需低光数据、仅凭正常光图像训练的零参考增强,结合预训练扩散模型实现了高效无监督泛化。另一方面,针对多任务多场景增强,采用双重提示词机制与物理先验融合,建立了特定关系的高效模型建模方式,显著提升了增强模型的通用性与持续进化能力。
讲者简介:刘家瑛,博士,北京大学王选计算机研究所教授,IEEE Fellow,国家级人才计划获得者,电子出版新技术国家工程研究中心副主任。研究领域为智能媒体计算。发表IEEE/ACM汇刊与CCF A类论文100余篇,谷歌学术引用2.4万余次,其中ESI高被引论文6篇。担任IEEE Trans. on Image Processing,IEEE Trans. on Circuit System for Video Technology,IEEE Multimedia Magazine等期刊编委,IEEE ICME/ACM ICMR指导委员会委员,ACM MM Asia 2024大会主席,ACM MM Asia 2025/2023,ACM ICMR 2021/IEEE ICME 2021大会程序主席,CVPR/ICCV/ECCV/ACM MM会议领域主席等。获省部级奖励3项、CSIG石青云女科学家奖、北京大学教学卓越奖等。
新视角合成:NeRF、Mesh 与 Point
许翔宇 教授 ⋅ 西安交通大学
报告摘要:新视角合成(Novel View Synthesis)是三维视觉领域的重要研究方向,近年来取得了显著进展。以神经辐射场(NeRF)为代表的隐式体渲染方法在真实感与细节还原方面表现优异,推动了三维重建与生成方法的快速发展。与此同时,基于 Mesh 与 Point 的表示方法凭借其在几何结构表达与渲染效率等方面的优势,也在多个应用场景中展现出强大潜力。在本报告中,我们将围绕 NeRF、Mesh 与 Point 三类主流表示方式,系统梳理其在新视角合成中的重要工作与关键技术,并探讨三维视觉未来的研究趋势。
讲者简介:许翔宇,于清华大学电子系获得工学学士和博士学位,曾担任美国卡内基梅隆大学机器人所博士后和新加坡Sea AI Lab研究员,目前为西安交通大学教授、博士生导师,入选国家高层次青年人才。长期从事图像处理和空间智能方向的研究,工作发表在 TPAMI、IJCV、NeurIPS、ICLR、CVPR 等重要国际期刊和会议。目前担任 TPAMI 客座编辑,并长期担任 NeurIPS、ICLR、CVPR、ICCV、ECCV、AAAI、BMVC、WACV等学术会议领域主席。
人脸和文本图像复原方法研究
左旺孟 教授 ⋅ 哈尔滨工业大学
报告摘要:人脸和文本是图像内容的重要组成部分,往往更容易成为人们关注的重点,其增强和复原因而有其独特的必要性和研究应用价值。相对于自然图像,人脸和文本呈现出更为显著和稳定的结构化特点(如:脸部组件、笔画)和更易于获得参考图像,因而更容易取得较自然图像更好的复原效果。报告拟回顾和总结团队近年来在人脸和文本图像复原方面的研究进展,主要包括:(1) 基于参考图像的人像复原方法,(2) 人脸/文字的先验建模与复原方法,(3) 人脸和文本图像复原的拓展,包括人脸图像复原驱动的自然图像复原与图像畸变矫正、艺术字生成等。
讲者简介:左旺孟,哈尔滨工业大学计算学部教授。主要从事底层视觉、视觉生成、视觉理解和多模态学习等方面的研究。在CVPR/ICCV/ECCV/NeurIPS/ICLR等顶级会议和IEEE T-PAMI、IJCV及IEEE Trans.等期刊上发表论文200余篇。曾任CVPR、ICCV、ECCV等会议领域主席,现任IEEE T-PAMI、T-IP、中国科学-信息科学和自动化学报等期刊编委。