CSIG青年工作委员会“学术新星”
发布时间:2025-04-16 11:54:48 人气: 作者:小编
主办单位:中国图象图形学学会
承办单位:CSIG-青年工作委员会、CSIG-交通视频专委会
会议时间:2025年4月16日 19:30-21:00
会议形式:线上
直播地址:腾讯会议(会议号:121-121-217,会议密码:250416)
林浩通
浙大计算机科学与技术学院博士生
研究方向:三维视觉
报告主题:深度估计基础模型的提示机制
报告题目:深度估计基础模型的提示机制
报告摘要:提示机制在释放语言和视觉基础模型的特定任务潜力方面发挥了关键作用。我们将提示机制引入深度基础模型,创造了一种称为提示任意深度(Prompt Depth Anything)的4K分辨率度量深度估计新范式。具体来说,我们使用低成本的激光雷达(LiDAR)作为提示,引导深度任意模型输出准确的度量深度。我们的方法以简洁的提示融合设计为中心,在深度解码器中结合多个尺度的激光雷达信息。为了应对有限的激光雷达深度和精确的真实深度数据集带来的训练挑战,我们提出了一种可扩展的数据管道,包括合成数据激光雷达模拟和真实数据伪真实深度生成。我们的方法在ARKitScenes和ScanNet++数据集上展现了最先进的水平,并惠及下游应用,包括3D重建和广义机器人抓取。
报告人简介:林浩通,浙大计算机科学与技术学院博士生,导师为周晓巍教授,研究方向为三维视觉。在T-PAMI, SIGGRAPH, CVPR等顶级期刊会议发表十余篇论文,其中5篇为第一作者。获得首届国自然青年学生基础研究项目资助。
李德鹏
华中科技大学 博士研究生
研究方向:增量学习与类脑智能
报告主题:开放场景下的增量学习方法研究
报告题目:开放场景下的增量学习方法研究
报告摘要:人工神经网络容易发生灾难性遗忘。为了缓解遗忘,神经网络的增量学习成为近年来的研究热点,它要求单一模型在不覆盖旧类知识的情况下能够不断学习新任务、扩展已知的类别集合。然而,现有方法多基于实验室封闭环境下的诸多假设。本报告面向具有响应实时、资源受限、隐私敏感、视图多源等典型特点的开放场景,从理论分析和算法实现等角度分享我们在轻量化神经网络增量学习方面的探索。
主持人1简介:杨欣,华中科技大学教授、博导、华中卓越学者,研究方向为计算机视觉与机器学习,主持国家自然科学基金青年项目(B类)、国际合作、面上项目等5项,以一作或通讯作者发表中科院一区/CCF A 类期刊会议论文65篇,多次入选斯坦福全球前2%顶尖科学家榜单;获湖北省技术发明一等奖(序1)、中国图象图形学会石青云女科学家奖、中国医学科技奖青年科学技术奖(序2),CCF B 类会议ISMAR 最佳论文提名奖(序1);指导学生获得中国国际互联网+金奖、银奖国内外权威竞赛奖项10余次;担任中国图象图形学会杰出会员,IEEE-TMI和IEEE-TVCG期刊编委,CCF A 类会议CVPR、MICCAI 领域主席, IEEE BISP 技术委员会委员、CSIG 青工委副秘书长、CCF 多媒体技术专委会副秘书长等职务,获评IEEE-TMI 2020-2021、2022-2023和2023-2024杰出审稿人。
主持人2简介:金枝,中山大学教授,博士生导师,IEEE Senior Member中国图象图形学学会CSIG多媒体专委会委员、交通视频专委会委员,主要从事图像视频质量增强、计算机视觉、三维重建等方面的研究和应用。2016年博士毕业于英国利物浦大学,博士后分别在深圳大学和德国慕尼黑工业大学进行。近5年,在图像处理及计算机视觉领域顶级期刊及会议共发表高水平学术论文72篇,其中本人作为一作/通信论文54篇。本人主持国家级科研项目5项,作为第一发明人已授权发明专利10项,已授权软件著作权7项。积极参与多个学会并担任专委会委员,包括CSIG交通视频专委会副秘书长、多媒体专委会委员、青工委委员、女工委委员、CCF多媒体专委会会员,担任IEEE TIP、TCSVT、TMM等多个计算机视觉领域顶级期刊的审稿人。