托举工程博生论坛

会程安排

9 月 21 日 上午

分论坛主席

朱翔昱
研究员 ⋅ 中国科学院自动化研究所
朱翔昱,中国科学院自动化研究所项目研究员,从事生物特征识别、数字人、人工智能基础理论研究与应用。国际模式识别协会(IAPR)生物特征识别青年学者奖(YBIA)获得者(两年一次,每次从全球范围内评选40岁以下学者一名)。共发表论文100余篇,发表文章的Google Scholar总引用次数为10000余次。获得三次国际竞赛冠军以及四项最佳论文及提名奖。授权国家发明专利16项。获2024中国图象图形学学会自然科学二等奖(第一完成人),2021中国电子学会科技进步二等奖、中国图象图形学学会优秀博士论文提名奖,任中科院一区期刊T-IFS(CCF:A类)、Pattern Recognition (PR) 编委,中国图象图形学学会青托俱乐部副主席。
徐婧林
副教授 ⋅ 北京科技大学
徐婧林,北京科技大学副教授,北京图象图形学学会理事、副秘书长,中国图象图形学学会青托俱乐部副主席。研究方向为视频理解、细粒度运动分析。已发表TPAMI、IJCV、CVPR等ACM/IEEE Trans.和CCF A类论文30余篇。主持国家自然科学基金面上、青年基金、北京市自然科学基金面上等项目;作为合作单位负责人参与国家自然科学基金重点(序2)、北京市自然科学基金联合基金重点(序2)等项目。担任《Chinese Journal of Electronics》青年编委、《电子与信息学报》编委等。入选第九届中国科协青年人才托举工程,获2024年中国图象图形学学会石青云女科学家奖、2022年中国图象图形学学会优秀博士学位论文奖、2023年中国自动化学会自然科学奖一等奖(4/5)、2024年中国图象图形学学会自然科学奖二等奖(3/5)。

分论坛报告

基于学习的图像变换方法
聂浪 副教授 ⋅ 重庆邮电大学
报告摘要:图像变换在生活中有着广泛的应用,可以在忠实于原始图像内容的基础上,按照既定目的对其进行空间上的编辑。然而,以前的方法总是依赖于手工设计的特征描述,并进一步对其进行复杂的能量优化,在低纹理、低光照等场景下不够鲁棒。本报告将从深度学习的角度出发,从“单视角图像-多视角图像-时序图像”这三个维度来对传统的图像变换任务进行探索,为实现兼顾性能、效率和鲁棒性的图像变换方法提供新的视角。
讲者简介:聂浪,重庆邮电大学文峰副教授,隶属 “图像认知”重庆市重点实验室。于2025年在北京交通大学信息科学研究所获得工学博士学位。近年来,其主要研究方向为计算机视觉中的多视几何、360全景理解等,以第一作者在TPAMI(×2)、TIP(×2)、CVPR(oral)、ICCV、ECCV等国际顶级期刊/会议发表论文近十篇。入选首届中国科协青年人才托举工程博士生专项计划(托举于图像图形学会);获得CVPR2023多视图布局估计挑战赛冠军;作为队长获得2024年中国研究生人工智能创新大赛一等奖。同时担任TPAMI、IJCV、TIP、CVPR、ICCV、ECCV等计算机视觉顶级会议或期刊审稿人。
面向电商场景下的可控图像生成
沈飞 博士后 ⋅ 新加坡国立大学
报告摘要:在电商场景中,图像生成不仅要保证视觉真实性,还需满足对服装、姿态与属性的多维控制。近年来,基于扩散模型的可控生成方法发展迅速,为虚拟试衣、个性化展示和大规模商品内容生产提供了新的解决思路。本报告将围绕“电商可控生成”展开,介绍我们提出的统一条件框架:其核心在于融合服饰外观、人体姿态与属性特征,并通过特征级与图像级建模、跨模态注意力与属性自适应注入机制,实现服装结构、颜色、Logo 等细粒度因素的解耦控制。实验结果表明,该方法在多项公开数据集和主观评测中均取得优异表现,为电商平台在多 SKU、跨场景和多风格条件下的规模化内容生成提供了有效技术支撑。
讲者简介:沈飞,南京理工大学博士(导师:唐金辉教授),现为新加坡国立大学 NExT++ 研究中心博士后,合作导师为蔡达成(Tat-Seng Chua)院士。研究聚焦 AIGC 与Multimodal Safety,主持/参与多项国家级与产学合作项目;在 NeurIPS、ICML、ICLR、TIP、AAAI、ACM MM 等顶级会议与期刊以第一作者发表十余篇论文。主导 IMAGDressing、IMAGGarment、IMAGHarmony、IMAGPose 等开源项目,累计收获 1K+ Star。曾获腾讯犀牛鸟精英人才计划杰出奖、华为开发者生态特别贡献奖等荣誉;在国内外算法竞赛中获奖 50 余次(含 5 次国际顶会 Workshop 冠军),并担任多个顶级会议与期刊审稿人如NeurIPS、CVPR、ICCV、ICML、TPAMI、TIP 等。
面向可信AIGC的伪造检测防御
夏瑞阳 博士生 ⋅ 西安电子科技大学
报告摘要:随着生成式人工智能(AIGC)技术的快速发展,其生成的图像和视频内容日益逼真,但也带来了虚假信息传播、身份伪造、隐私侵犯等安全风险。构建可信AIGC生态亟需高效的伪造检测与防御技术。本报告围绕AIGC的伪造技术,特别针对面向人脸伪造的检测及防御技术展开分析。在伪造检测层面,随着生成模型的迭代发展,传统检测方法的泛化性面临严峻挑战,提取不同伪造技术下的泛化性特征成为了当前的研究重点。在伪造防御层面,主要从取证及生成两个角度出发:从取证角度,通过构建鲁棒水印嵌入、生成过程可追溯框架及AI生成内容标识标准;从生成角度,通过对抗学习技术获取面向生成模型的对抗扰动,以破坏生成模型对人脸身份及属性的恶意篡改。未来,可信AIGC需考虑检测及防御技术下的多种方案,并结合轻量化检测工具与自适应防御模型,为人工智能的发展提供安全保障。
讲者简介:夏瑞阳,西安电子科技大学博士三年级研究生,从事人脸伪造检测及目标检测的研究与应用。CSIG学生会员,累计共发表论文10余篇。授权国家发明专利5项。多次获得国家奖学金及优秀研究生称号,并获得省级优秀硕士毕业论文。担任ACM MM、IJCAI、AAAI、EAAI等多项国际会议及期刊审稿人。
认知启发的交互理解方法研究
周昱臣 博士生 ⋅ 中山大学
报告摘要:以人为中心的人工智能研究旨在观察、理解并协助人类活动,要求智能体能够解析人与环境及实体间的交互关系,从而推动交互关系理解这一关键课题。交互关系反映场景语义、逻辑和因果信息,对视觉内容的高层次理解及生成至关重要,可应用于智能驾驶、机器人及人机交互等领域。本次报告聚焦智能驾驶和自然视觉两大场景,以人类认知机理作为切入点,基于眼动注意机制、层次化理解过程、结构化知识表征等探索解决复杂交互理解的有效途径。
讲者简介:周昱臣,中山大学博士研究生(硕博连读),新加坡国立大学联合培养博士生,师从苟超副教授、谭光教授和Tat-Seng Chua(蔡达成) 院士;曾任上海人工智能实验室和字节跳动PICO Lab见习研究员;主要研究方向为多模态大模型、智能驾驶、人机交互等,目前以第一作者在IEEE T-ITS、IEEE T-IV、IEEE T-CSVT、CVPR、ACM MM等顶级期刊会议发表学术论文近10篇;申请发明专利4项,1项第一发明人授权专利已与企业达成技术转化;参与国自然面上、广东省青年提升、广州市重点研发等横纵向课题5项;获得CVPR、NeurIPS等CCF-A类会议竞赛国际冠军;入选首届中国科协青年人才托举工程博士生专项计划;获本科生、硕士研究生、博士研究生国家奖学金等;担任十余个国际期刊会议审稿人及程序委员会成员等。
频域特征在图像复原的应用
毛欣天 博士生 ⋅ 华东师范大学
报告摘要:近年来,频域与深度学习网络结合的模式显著提升了模型对运动模糊、去雾、去雨、暗光增强、超分辨率等特定退化场景下的复原能力。本报告将介绍图像的频域特征在去运动模糊领域的应用:我们通过在神经网路中引入频域激活的特性,提出了残差傅里叶激活模块,实验表明该方法能够显著提升原有基于残差模块的神经网路去模糊性能。此外,我们注意到深度学习中通道维度上的全局自注意力机制是低频信号主导下的粗粒度全局学习,并提出了通过特征频域空间的局部自注意力机制实现粗粒度与细粒度兼顾的全局学习模式,为图像频域特征的使用提供了新的视角。最后,本报告将介绍我们在频域与深度学习领域结合的最新研究内容。
讲者简介:毛欣天,华东师范大学通信与电子工程学院上海市多维度信息处理重点实验室三年级博士生,中国科协青年人才托举工程博士生专项计划入选者(托举学会:中国图象图形学学会),主要从事图像去模糊研究。主要成果发表于发表CCF-A顶级会议如CVPR、AAAI、ACM MM,发表文章的Google Scholar总引用次数460余次并担任过多个顶级会议与期刊审稿人如NIPS、ACM MM、TIP、PR等。
面向移动操作的高效策略迁移
吴振宇 博士生 ⋅ 北京邮电大学
报告摘要:移动操作(Mobile Manipulation)是具身智能机器人的基本任务之一,为机器人赋予在广阔室内外空间中自主交互的能力。然而,现有的移动操作模型缺少大规模预训练数据而无法适应真实世界复杂多变的部署场景。近年来,视觉-语言-动作模型(VLA)在各个领域表现出惊人的泛化性,但涌现出的VLA模型局限于固定底座操作,无法直接迁移到移动操作场景。为此,我们希望提出高效策略迁移框架,以零样本方式将固定底座操作的VLA模型迁移到移动操作任务,从而充分利用VLA具备的泛化性引导移动操作动作规划。本报告将介绍围绕高效策略迁移开展的系列研究:我们以移动操作巡航与操作阶段过渡阶段为切入点,通过全身轨迹优化、细粒度交互区域定位和几何场景图构建三个方法,有效地将现有局限于固定底座操作的VLA迁移到移动操作任务中,推动移动操作朝人类世界部署的进程。
讲者简介:吴振宇,北京邮电大学智能工程与自动化博士二年级学生,从事机器人视觉感知、移动操作等具身机器人研究方向。在CVPR、ICRA、IROS、PR等国际知名会议与期刊上共发表论文8篇,担任T-IP、T-CSVT、RAL、PR等国际知名期刊与CVPR、IROS、ICRA、CoRL等国际知名会议审稿人