目标检测与跟踪论坛

会程安排

9 月 19 日 下午

分论坛主席

王栋
教授 ⋅ 大连理工大学
王栋,大连理工大学信息与通信工程学院教授、博士生导师,国家自然科学基金优秀青年科学基金获得者。研究方向为计算机视觉与机器学习领域,包括目标跟踪,目标检测,行人再识别,行为理解等。在CVPR/ICCV等顶级会议及TPAMI/IJCV等权威期刊发表论文50余篇,Google Scholar引用1.5万次,10次斩获国际视觉目标跟踪竞赛(VOT)冠军,获CVPR 2020最佳论文提名奖、CCF自然科学二等奖、教育部自然科学二等奖。多项研究工作获得国家自然科学基金优秀青年科学基金、区域联合重点项目等资助。
董性平
教授 ⋅ 武汉大学
董性平,武汉大学计算机学院教授、博士生导师、国家级青年人才。曾任阿联酋起源人工智能研究院研究员。2019 年在北京理工大学获得博士学位,2016-2018年曾在澳洲国立大学进行联合博士培养。已发表论文 30余 篇,其中包括国际权威期刊 IEEETrans. 汇刊 (IEEE TPAMI, IEEE TIP, IEEE TMM, IEEE TNNLS, IEEE TCYB, IEEE TCSVT) 和国际顶级视觉会议 (IEEE CVPR, ECCV)。谷歌学术H 指数达到 24,单篇引用最高 700 余次。在 SCI 论文中,四篇论文入选 ESI 高被引,其中一篇被评为热点论文。2021-2024连续入选斯坦福大学全球前2%顶尖科学家年度影响力榜单。曾获得中国人工智能学会优秀博士论文奖、北京市优秀毕业生等奖励与荣誉。目前从事小样本学习、目标跟踪、图像/视频目标分割、三维重建、自动驾驶感知、多模态学习、医学人工智能等研究工作。
王伟
教授 ⋅ 北京交通大学
王伟,北京交通大学计算机科学与技术学院教授、博士生导师、信息科学研究所副所长,国家级青年人才,优秀青年科学基金项目(海外)获得者,ELLIS欧洲学习和智能系统实验室成员。长期从事计算机视觉、机器学习等领域研究,在CVPR/ICCV/ECCV/NeurIPS TPAMI/TIP/TMM等顶会顶刊发表论文近50篇,Google Scholar引用超3000次。主持参与国家自然科学基金“面上”项目、中央高校基本科研基金等多项课题,获中国图象图形学学会高等教育教学成果激励计划二等奖、北京交通大学智瑾奖教金、ACM MultiMeida最佳论文提名奖、ICCV优博奖、意大利计算机视觉模式识别和机器学习协会优博奖等荣誉。担任 ICMR等国际会议的Area Chiar、VALSE执行领域主席并常任CVPR/ICCV及TPAMI/TIP/IJCV等顶会顶刊审稿人。
卢湖川
教授 ⋅ 大连理工大学
卢湖川,大连理工大学未来技术学院/人工智能学院执行院长, 信息与通信工程学院教授、博士生导师,国家杰出青年基金获得者,科技部中青年创新领军人才,辽宁省特聘教授,IEEE Fellow,IEEE T-Cybernetics和IEEE T-CSVT副主编,IEEE/ACM高级会员。长期致力于计算机视觉与多模态大模型研究,在图像/视频理解、目标检测与跟踪、视觉显著性分析等领域取得突破。在CVPR/ICCV/ECCV等顶会发表论文100余篇,期刊会议论文总计200余篇,Google Scholar引用超5万次。获CVPR 2020最佳论文提名、ICCV 2011最具影响力海报奖、ICIP 2012最佳学生论文决赛奖、IET图像处理最佳论文奖;以第一完成人获辽宁省科技进步一等奖、教育部/CCF/中国图象图形学学会自然科学二等奖4项,主持多项国家自然科学基金项目和国际合作项目。
张史梁
副教授 ⋅ 北京大学
张史梁,北京大学计算机学院长聘副教授,博士生导师,国家青年特聘专家,首批北京市杰出青年科学基金获得者,博雅青年学者,曾任美国NEC硅谷实验室研究员。专注人工智能与媒体计算研究,核心方向包括行人重识别、物体细粒度识别、海量视觉检索与跨平台视频智能理解。以第一/通讯作者在IEEE TPAMI/IJCV/CVPR/ICCV/NeurIPS等顶刊顶会发表论文70余篇,Google Scholar引用5700余次。获IEEE T-CSVT最佳论文提名、中国电子学会科技进步一等奖、教育部技术发明一等奖及CCF/中科院双优博论文奖。主持科技部重点研发计划政府间合作专项、国家自然科学基金重点项目、北京市杰青项目等重大课题,以第一发明人获中美发明专利14项。长期担任Elsevier CVIU/IET Computer Vision编委,并任CVPR/AAAI/ICPR领域主席,组织CVPR/FG等国际细粒度识别研讨会。

分论坛报告

视觉目标跟踪评测的演化发展
赵鑫 教授 ⋅ 北京科技大学
报告摘要:视觉目标跟踪作为动态视觉能力的核心体现,是计算机视觉研究中最具挑战性的任务之一。随着深度学习等技术的不断演进,视觉跟踪模型在精度和速度上取得显著突破,然而当前评测体系的滞后性逐渐成为制约算法发展的瓶颈。本报告将从“评测视角”出发,系统回顾视觉跟踪任务从短期跟踪到长期跟踪再到全局实例跟踪的任务范式演化,解析不同评测环境的设计逻辑与挑战维度,并结合人类视觉理论探讨从机器–机器比较向人机对比评估的范式跃迁。在此基础上,报告将简要介绍跟踪算法的发展脉络,并结合代表性评测基准展示多样性与泛化能力的重要性。通过对“任务–环境–执行者–评估机制”四大模块的系统梳理,本报告旨在阐明“能力导向、评测驱动”的研究范式,并展望未来视觉智能系统构建中,评测所应承担的牵引角色。
讲者简介:赵鑫,北京科技大学计算机科学与技术系教授,博士生导师,北京市杰出青年科学基金获得者,中科院青促会会员,IEEE高级会员,CCF/CSIG多个专委会委员。研究方向为计算机视觉,视觉大模型,生成式AI。以第一/通讯作者在IEEE TPAMI/IJCV/CVPR/ICCV等顶刊顶会发表CCF-A类论文70余篇。主持国家专项领域项目、国家自然科学基金项目等国家级课题10项,研发技术成功应用于智能视频监控、无人系统及电商平台,获中国图象图形学学会自然科学二等奖,拥有中美授权发明专利16项。现任视觉顶刊International Journal of Computer Vision首席客座编辑及Pattern Recognition编委,组织CVPR 2024视觉数据集国际研讨会并主讲IEEE ICIP等国际会议Tutorial,持续推动领域发展。
基于多模态结构化学习的图像感知模型研究
李玺 教授 ⋅ 浙江大学
报告摘要:互联网和物联网时代催生了海量多模态大数据,从这些海量数据中有效提取知识迫切需要各种人工智能的技术和手段。因此,如何进行人工智能驱动的多模态计算已经成为当今知识经济时代亟待解决的核心技术问题。本报告主要围绕数据驱动的人工智能学习方法,进行大规模图像/视频数据的视觉特征学习,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模多模态特征学习所涉及的主要研究问题和技术方法。然后系统地回顾了多模态特征表达和学习领域的不同发展阶段,介绍了近年来我们利用特征学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。报告的最后将和大家一起探讨一下涉及多模态特征学习所面临的一些开放性问题和难题。
讲者简介:李玺,浙江大学计算机科学与技术学院教授、博士生导师,浙江大学上海高等研究院副院长,IAPR/IET/AAIA Fellow,IEEE Senior Member,CCF杰出会员,国家杰出青年科学基金获得者,国家青年特聘专家,入选全球前2%顶尖科学家榜单,Elsevier 2023“中国高被引学者”,科技部科技创新2030新一代人工智能重大项目首席科学家,浙江省杰出青年科学基金获得者,浙江省特聘专家等。主要从事计算机视觉、模式识别和机器学习等领域的研究和开发。在国际权威期刊和国际顶级学术会议发表或录用文章200余篇(含多篇 ESI 高被引论文),主持国家自然科学基金重点项目等多项课题,获世界人工智能大会SAIL奖、中国电子学会科技进步一等奖、中国北京市自然科学技术奖等荣誉。担任CVPR/ICCV/ECCV领域主席及《IEEE TNNLS》《IEEE TMM》编委。
语言引导的视觉跟踪技术研究
董性平 教授 ⋅ 武汉大学
报告摘要:语言引导的指向性理解(Referring Understanding)作为连接自然语言与视觉内容的核心任务,旨在通过定位语言描述中的目标,实现跨模态语义对齐。然而,现有方法在语言表达能力和动态建模方面仍存在不足,难以有效刻画目标在空间数量与时间状态上的变化。针对这一问题,我们提出了新的通用任务——指代多目标跟踪(Referring Multi-Object Tracking, RMOT)。该任务以语言表达为高层语义线索,引导多目标跟踪预测,从而统一建模目标的数量变化与时序语义。本报告将回顾传统视觉跟踪中的特征融合技术,进一步介绍语言与视觉融合的指代视觉跟踪任务,并系统展示课题组在该领域的最新研究成果,以探讨指向性理解的发展方向。
讲者简介:董性平,武汉大学计算机学院教授、博士生导师、国家级青年人才。曾任阿联酋起源人工智能研究院研究员。2019 年在北京理工大学获得博士学位,2016-2018年曾在澳洲国立大学进行联合博士培养。已发表论文 30余 篇,其中包括国际权威期刊 IEEETrans. 汇刊 (IEEE TPAMI, IEEE TIP, IEEE TMM, IEEE TNNLS, IEEE TCYB, IEEE TCSVT) 和国际顶级视觉会议 (IEEE CVPR, ECCV)。谷歌学术H 指数达到 24,单篇引用最高 700 余次。在 SCI 论文中,四篇论文入选 ESI 高被引,其中一篇被评为热点论文。2021-2024连续入选斯坦福大学全球前2%顶尖科学家年度影响力榜单。曾获得中国人工智能学会优秀博士论文奖、北京市优秀毕业生等奖励与荣誉。目前从事小样本学习、目标跟踪、图像/视频目标分割、三维重建、自动驾驶感知、多模态学习、医学人工智能等研究工作。
视觉物体检测的新趋势和新范式
张兆翔 研究员 ⋅ 中科院自动化所
报告摘要:视觉物体检测是计算机视觉与模式识别领域的重要问题,在过去十余年间伴随着深度学习的兴起取得重要进展。伴随着多模态大模型、生成式模型、世界模型等新兴技术的兴起和自动驾驶、机器人等关键应用的驱动,视觉物体检测的方向发展呈现出新趋势,视觉物体检测的方法创新呈现出新范式。本报告在回顾视觉物体检测的发展基础上,着重介绍本团队在视觉物体检测领域做的一系列代表性工作,并以自动驾驶等应用场景,生成式世界模型等方法驱动为例,探讨视觉物体检测的创新发展。
讲者简介:张兆翔,中科院自动化所研究员、博士生导师,智能感知与计算研究中心常务副主任,中国科学院大学岗位教授,中国科学院脑智能卓越中心骨干,VALSE常务学术委员、CCF杰出会员、中国人工智能学会副秘书长,入选“教育部长江学者奖励计划”、“国家万人计划青年拔尖人才”和“教育部新世纪优秀人才支持计划”。长期从事模式识别、计算机视觉与深度学习领域研究,聚焦视觉认知计算、类脑学习及面向开放环境的视觉感知与理解。近五年在IEEE T-PAMI/IJCV/JMLR等顶级期刊与CVPR/ICCV/ECCV等顶级会议发表论文100余篇,申请专利55项,主持国家自然科学基金重点项目等多项课题,获北京市科学技术进步奖一等奖、中国人工智能学会吴文俊技术发明奖二等奖等荣誉。担任《IEEE T-CSVT》《Pattern Recognition》等期刊编委及CVPR/ICCV等顶会领域主席。
三维场景中的目标检测与导航
李厚强 教授 ⋅ 中国科学技术大学
报告摘要:三维场景的目标检测与导航是实现空间智能的关键技术,直接关系到智能体对物理世界中物体、场景与路径的感知、理解与行动能力。本报告分为两个部分:第一部分是被动感知,即三维目标检测,主要探讨如何利用相机、激光雷达、毫米波雷达等多传感器数据,实现在复杂环境中对物体进行精准的识别与定位。第二部分是主动导航,着重讨论如何基于环境感知的结果,结合多样的探索策略与世界模型驱动的路径规划,实现智能体在未知或动态环境中的自主探索与鲁棒导航。报告将结合本课题组的最新研究成果,系统阐述多传感器融合、三维表示学习与导航策略等关键技术,并展望其应用前景与挑战。
讲者简介:李厚强,中国科学技术大学电子工程与信息科学系教授、博士生导师,IEEE Fellow,多媒体计算与通信教育部-微软重点实验室副主任、中国科学技术大学信息科学技术学院副院长,国家“杰出青年基金”获得者,万人计划领军人才,长江学者特聘教授。主要研究方向包括计算机视觉与模式识别、人工智能与机器博弈、视频编码与通信、多媒体信息检索等。发表学术论文100余篇;申请发明专利40余项,已授权20余项;45项技术提案被视频编码国际标准采纳。主持国家自然科学基金重点项目、973计划课题等多项国家级项目,获国家自然科学二等奖、安徽省科学技术一等奖及4次国际会议最佳论文奖。任《IEEE TCSVT》副编辑及多个国际会议程序委员会主席。
深空无人探测系统智能感知技术
张天柱 教授 ⋅ 中国科学技术大学
报告摘要:深空探测任务面临探测环境复杂且不确定、距离远且飞行时间长、通信延迟大且数传速率低、信息不完备天地互动决策难等一系列关键难题,导致探测数据无法实时传输、地面无法及时响应,从而错过敏感事件紧急决策。深空无人探测系统智能感知技术对于提高深空探测任务效能具有重要意义。本报告将系统性阐述课题组在深空无人系统自主任务规划、自主导航定位、自主目标操作等方面的研究和应用工作,并基于当前研究进展与深空探测任务的发展趋势,深入探讨深空无人系统智能感知技术的发展方向与潜在突破点。
讲者简介:张天柱,中国科学技术大学教授,自动化系书记,深空探测实验室未来技术研究院副院长。专注于人工智能与深空探测相关理论与关键技术研究,并将其应用于探月工程四期、行星探测工程、国际月球科研站等国家重大工程任务,开发了一系列面向空间态势感知、高精度着陆定位和星表智能巡视的深空智能探测系统。成果应用于嫦娥五号、嫦娥六号、天问一号等任务,是嫦娥七号任务科普试验载荷总指挥。牵头组织国际月球科研站月面运输、科研作业、能源动力、资源利用等专业分系统论证。在IEEE TPAMI等 ACM/IEEE 汇刊及CCF-A类会议发表论文100余篇,谷歌学术引用18000余次,入选2021-2024年爱思唯尔中国高被引学者榜单,入选2021-2024年全球前2%顶尖科学家榜单。获2023年度中国航天基金会航天贡献奖、CCF-A 类国际会议ACM MM 2016最佳论文奖等。承担了天问三号关深、国家自然科学基金委优秀青年科学基金、中科院先导C项目课题、国家重点研发计划课题、“十四五”技术基础等项目。