国自然青年学生论坛

会程安排

9 月 21 日 上午

分论坛主席

杨欣
教授 ⋅ 华中科技大学
杨欣,华中科技大学教授、博导、华中卓越学者、国家优青,研究方向为计算机视觉与医学影像智能分析;主持国家重点研发计划、国基金国际合作、面上项目等国家级项目7项,以一作或通讯作者发表TPAMI、IJCV、CVPR类期刊会议论文90余篇,多次入选斯坦福全球前2%顶尖科学家榜单;获湖北省技术发明一等奖(序1)、中国图象图形学会石青云女科学家奖、中国医学科技奖青年科学技术奖(序2),CCF B 类会议ISMAR 最佳论文提名奖(序1)、中国图象图形学会杰出会员;成果入选世界互联网大会领先科技成果集;指导学生获得中国国际互联网+金奖、银奖国内外权威竞赛奖项10余次;担任IEEE-TMI和IEEE-TVCG期刊编委,CCF A 类会议CVPR、MICCAI 领域主席, IEEE BISP 技术委员会委员、CSIG 青工委副秘书长、CCF 多媒体技术专委会副秘书长等职务,获评IEEE-TMI 2020-2021、2022-2023和2023-2024杰出审稿人。
金枝
教授 ⋅ 中山大学
金枝,中山大学教授,博士生导师,广东省珠江青年学者,中山大学“逸仙学者”,IEEE Senior Member,中国图象图形学学会CSIG 交通视频专委会副秘书长、多媒体专委会委员、青工委委员,CCF 多媒体委员会委员,主要从事恶劣环境视觉感知增强、视频编解码、三维重建等方面的研究和应用。2016年博士毕业于英国利物浦大学,博士后分别在深圳大学和德国慕尼黑工业大学进行。在图像处理及计算机视觉领域顶级期刊及会议发表论文70余篇。作为第一发明人已授权国家发明专利11项,已授权软件著作权9项。主持国家自然科学基金面上、青年、中德国际合作等各类项目14项,其中国家级科研项目4项、省部级项目1项、国防军工类项目1项。担任Frontiers in Signal Processing期刊编委、IEEE Sensors Journal期刊客座编辑、ICIG2021和CSIG青年科学家论坛的宣传主席、ChinaMM2024 论坛主席、VALSE2025本地主席等。担任IEEE TIP、TCSVT、TMM、电子学报(中英文版)和CVPR多个计算机视觉领域顶级期刊会议的审稿人。多次带领学生获得CVPR NTIRE竞赛冠亚军。

分论坛报告

多粒度不确定性视角下的可解释性建模与稳健知识获取
苑克花 博士生 ⋅ 同济大学
报告摘要:可解释性是人工智能在基础研究与产业应用中必须应对的关键挑战之一。然而在现实中,不确定性贯穿于数据分析与处理、模型构建与优化、以及决策制定与实施等多个环节,极大增加了可解释性建模的难度。为此,本报告聚焦于模型可解释性与不确定性中的关键问题,以建模过程中多粒度不确定性的度量与分析为切入点,介绍一类多粒度不确定性视角下的可解释性建模与稳健知识获取方法。
讲者简介:苑克花,女,同济大学博士生,师从苗夺谦教授。入选首届中国科协青年托举人才工程博士生专项计划,获批国家自然科学基金(博士生项目)。主要从事不确定性人工智能与大数据分析相关研究,在IEEE TKDE、TCYB、TFS、TNNLS等知名期刊发表学术论文10余篇,其中4篇入选ESI高被引/热点文章。曾获博士研究生国家奖学金、硕士研究生国家奖学金、重庆市优秀毕业生、同济大学励志之星、同济大学计科先锋、同济大学优秀博士新生奖学金等荣誉。担任IEEE汇刊TKDE、TSMC、TNNLS、TCYB、TFS、TIV以及Information Fusion、Pattern Recognition、Applied Soft Computing等多家SCI TOP期刊的审稿人。
面向高容量图像隐写的图像处理
高方远 博士生 ⋅ 北京航空航天大学
报告摘要:图像隐写旨在将秘密图像隐蔽地嵌入到非密图像载体中,从而大幅提高图像传输的安全性。然而,高容量图像隐写因其信息密度大、易被攻击,对信息的存储和传输带来严峻挑战。本次报告将简单分享我们在图像高容量隐写方向的探索与工作,并对高容量图像隐写处理方法进行一些讨论。
讲者简介:高方远,北京航空航天大学多媒体通信与计算实验室博士研究生,师从邓欣副教授,本科毕业于北京航空航天大学数学科学学院。主要研究方向为图像隐写与可学习图像压缩,在IEEE TPAMI、IEEE TIP等期刊、会议上发表论文6篇;获得博士生国家奖学金;担任多个期刊和会议审稿人;参与多项科研项目。
高保真、低成本、可扩展的动态世界建模
林浩通 博士生 ⋅ 浙江大学
报告摘要:本报告围绕动态世界三维重建中的核心科学问题,系统介绍了我们在高保真、低成本与可扩展性建模方面的一系列探索与实践。针对渲染质量不足的问题,我们构建了时空一致的神经表示方法,有效提升了动态场景的外观保真度。在训练成本方面,我们提出PromptDepthAnything等跨模态提示机制,利用单帧图像与深度先验引导训练过程,显著减少了对多视图采集的依赖。在渲染成本方面,我们引入层级高斯建模,在保持视觉质量的同时,实现了对超千万高斯复杂场景的实时渲染。为提升系统的可扩展性,我们构建了模块化可解耦的建模方法,使得模型能够精准调控场景元素与动态范围。上述方法共同构建了一个面向复杂环境感知与交互的高效动态世界建模框架。
讲者简介:林浩通,浙大计算机科学与技术学院博士生,导师为周晓巍教授,研究方向为三维视觉。在T-PAMI, SIGGRAPH, CVPR等顶级期刊会议发表十余篇论文,其中5篇为第一作者,目前谷歌学术引用超2100次,在Github开源累计加星超4000次。获评首届国自然青年学生基础研究项目资助,获2024年CCF优秀图形开源软件奖,China3DV 2025 Top3论文等奖项,多次获得本科生、研究生国家奖学金。
单双目基础模型
许刚伟 博士生 ⋅ 华中科技大学
报告摘要:本报告围绕单双目基础模型的关键问题,系统介绍了我们在几何建模精度与效率、模型泛化能力以及边缘感知鲁棒性方面的最新进展。针对传统迭代立体匹配方法中几何感知不足的问题,我们提出了迭代几何编码体架构 IGEV,首次将粗糙匹配代价体编码为几何感知表示,并基于该表示实现迭代优化,显著提升了匹配精度与计算效率。在此基础上,我们进一步提出双目基础模型 MonSter,创新性地融合了单目模型 Depth Anything V2 的先验信息,引入单双目协同机制,实现了良好的泛化能力,在 KITTI 等五个主流评测基准上均取得领先性能。针对单目模型中常见的边缘飞点与结构失真问题,我们提出了 Pixel-Perfect-Depth 方法,引入像素空间的 Diffusion Transformers,有效增强了模型对边缘结构的感知与恢复能力。上述方法共同构建了一个面向真实世界三维感知任务的高精度、强泛化的单双目建模基础框架。
讲者简介:许刚伟,华中科技大学电子信息与通信学院博士生,导师为杨欣教授,研究方向为三维视觉。以第一作者(含共一)在T-PAMI、CVPR、ICCV等顶刊和顶会上发表论文9篇,其中两篇一作论文谷歌学术引用次数分别超300次,在Github开源累计加星超2000次。获评首届国自然青年学生基础研究项目资助,获华中科技大学“学术新星”称号,多次获得研究生国家奖学金。
连续数据表示下的正则化方法论
罗倚斯 博士生 ⋅ 西安交通大学
报告摘要:近年来,对离散数据点进行连续化的坐标到值的数据表示框架在许多问题中取得了成功,如PINN, NeRF, 算子学习等。在本报告中,我们将探讨如何将传统机器学习和图像处理中的离散矩阵正则化方法(如低秩张量分解、非局部自相似性、Total Variation等)嵌入到连续表示框架中,并发展相关的连续化数学理论和算法。我们将展示这些连续正则化方法在图像复原、点云重建、三维重建、转录组分析,全波形反演等重要科学问题中的应用价值。
讲者简介:罗倚斯是西安交通大学数学与统计学院博士二年级学生,师从孟德宇教授;主要研究方向为机器学习的基础理论和方法包括连续表示、隐式神经表示、张量分解、正则化方法等;在SIAM IS, TPAMI, TIP, TNNLS, CVPR, AAAI, MM 等期刊和会议上发表论文20余篇;主持国家自然科学基金青年学生项目;曾获华为奖学金,华为火花奖,国家奖学金等荣誉;担任多个期刊和会议审稿人。
深度神经网络的置信度可校准性
王登豹 青年教师 ⋅ 浙江大学
报告摘要:近年来,深度神经网络在输出不确定性方面存在的问题受到研究人员广泛关注,不同的置信度校准方法被相继提出。本报告将回顾现有置信度校准方法,通过引入模型输出置信度的“可校准性”概念,指出现有校准方法在所存在的一些不足。针对这些不足,本报告将介绍我们在可校准性方面所作的一些实验探究,分析现有方法损害模型可校准性的成因,并介绍我们为提升可校准性设计的新型方法。
讲者简介:王登豹,东南大学计算机科学与工程学院青年教师,硕士生导师。研究领域为人工智能、机器学习,目前主要关注大模型的不确定性估计问题。 在机器学习、数据挖掘、人工智能相关领域的顶级会议与权威期刊上(ICML、NeurIPS、KDD、AAAI、IEEE TPAMI 、IEEE TKDE 等)发表论文十余篇,获批首届 “NSFC 博士生基金” 项目,获德国学术交流中心 DAAD AInet Fellow 计划等奖励,并担任多个著名国际会议的程序委员以及期刊审稿人。