通知公告
第十九届中国图象图形学学会青年科学家会议
图像分割论坛成功举办
由中国图象图形学学会青年工作委员会发起的“第十九届中国图象图形学学会青年科学家会议”于2023年12月28-31日在中国广州召开。本次会议由中国图象图形学学会主办,琶洲实验室、华南理工大学、中山大学、中国图象图形学学会青年工作委员会承办。王耀南院士、谭铁牛院士、中山大学赖剑煌教授、华南理工大学徐向民副校长、许勇副校长、琶洲实验室常务副主任李远清教授、华南理工大学陈俊龙教授、北京大学林宙辰教授共同担任大会主席。
会议面向国际学术前沿与国家战略需求,聚焦最新前沿技术和热点领域,会议设4个大会报告,27个主题分论坛,4个Tutorial,总计近150场高水平学术报告 。2023年12月30日下午,图像分割论坛成功举办。论坛由浙江大学王文冠教授和北京理工大学周飞天教授组织,王文冠教授担任本次论坛主持人。“图像分割”是重要的前沿科技领域,其专注于通过算法将数字图像划分为多个部分或对象,同时为图像理解、机器视觉及相关应用提供了关键的技术基础。论坛聚焦该领域的最新研究进展与前沿技术,详细探讨了“Visual Segmentation for Open World”、“ 分割大模型技术扩展初探”、“原型知识驱动的语义分割技术”、“ 超限医学图像分析:技术与应用”和“面向真实场景分割的智能视觉理解”等主题内容。
北京交通大学教授魏云超、上海交通大学副教授沈为、北京理工大学教授周天飞、华东师范大学教授王妍、四川大学教授雷印杰等专家,作为本场论坛讲者进行主题报告。
魏云超教授带来主题为“Visual Segmentation for Open World”的报告。
开放世界识别承认现实世界的场景是动态的,并且经常遇到新奇的,以前从未见过的物体或类别。这项研究面临着诸如处理新对象/类别、适应不断发展的数据分布等挑战。在本次演讲中,魏教授将介绍他在多个维度上的开放世界视觉分割的研究工作,包括零样本、增量、少样本、开放词汇和模型不可知设置。这些研究成果大部分最近在ICCV 2023和NeurIPS 2023等知名场所发表。此外,魏教授将展示视觉基础模型的变革性影响,如“分割任何东西”,在提高这些开放世界识别任务的性能方面。
沈为副教授的报告主题为“分割大模型技术扩展初探”。
人类视觉具有非凡的聚合能力:给一张图像,人类看到的并不是单个像素的集合,而是由像素聚合成的一些视觉概念,它们往往对应于图像中的物体或者物体的部件。我们当然也希望计算机视觉也具有这样的聚合能力。聚合能力可以从分割标注中学习得到,但是众所周知分割标注耗时难获得,所以如何从图像数据本身学习得到聚合能力已成为近来的研究热点。本次报告将介绍报告人团队如何基于启发式先验,设计弱监督、无监督下聚合机制,用以求解面向少标注的图像分割以及其它视觉识别任务,如人-物交互检测。此外,还将介绍报告人团队在分割大模型(SAM)基础上的最新研究探索——基于SAM的任意目标三维分割。
周天飞教授的报告主题为“原型知识驱动的语义分割技术”。
近年来,语义分割技术取得了显著进展。主流方法经历了从FCN到Transformer的网络架构迁移,在此过程中,解码策略也不再局限于softmax-based的方法,而是衍生出了query-based的方法。此外,多模态大数据和基础模型的发展也促进了“封闭世界”分割到“开放世界”分割的范式转换。本次报告将首先从一个统一的原型视角重新审视现有的分割技术,并由此揭示现有方法的共同缺陷,进而介绍基于非学习原型的全监督语义分割新方法;其次,将讨论“开放世界”下的弱监督分割问题,重点介绍如何从数据中挖掘丰富的多模态(图像和语言)非学习原型知识,并用其驱动“开放世界”分割技术的发展。
王妍研究员的报告主题为“超限医学图像分析:技术与应用”。
医学影像数据的标注工作耗时且难度较高,多数小数据疾病更加需要医生的临床知识,这导致高质量、细粒度的标注样本数量受到限制,进而影响了深度学习模型的泛化能力,使得模型难以达到理想的精度水平。因此,在少量数据有标注的情况下,如何超越标注的限制,有效利用无标注数据是实现精准诊疗的关键。本报告将围绕半监督训练中的以下三个问题展开讨论:1)标记数据和未标记数据的经验分布存在差异,如何采用统一范式处理标记和未标记数据,以及如何提取医学图像数据中共有的先验知识?2)一致性约束模型在半监督图像分割中取得显著效果,但是医学图像不确定区域较多,如何针对这些不确定区域学习到可靠的交叉引导?3)医学图像的数据往往分散在不同医院、不同中心、不同科室的影像储存系统中,形成了一个个缺乏有效互通的“数据孤岛”,如何打破数据共享壁垒,使无标记数据有效学习标记数据的信息?
雷印杰教授的报告主题为“面向真实场景分割的智能视觉理解”。
近年来,自动驾驶、机器导航、虚拟及增强现实等应用需求催生了对真实场景理解的广泛研究,充分挖掘并利用复杂场景中所蕴含的丰富上下文信息以完成智能视觉理解具有广阔的应用前景。如何突破真实场景理解中所面临的有限数据量及标注、未知目标识别和模型持续演进学习等瓶颈,以完成跨域、零样本、类增量场景分割成为视觉理解研究发展的新趋势。本报告将结合实际具体案例,从经典语义分割、弱监督显著目标分割、域适应语义分割、零样本语义分割及类增量语义分割方法等方面来阐述当前最新进展及课题组的相关研究成果,并对当前大模型技术在开放世界语义分割领域的未来发展演进趋势及应用进行展望。
本次论坛为青年科学家们提供了宝贵的学术交流平台,为通用图像分割领域的研究进展提供了新的启示和思想碰撞。
第十九届中国图象图形学学会青年科学家会议
THE 19TH YOUNG SCIENTISTS CONFERENCE OF THE CHINESE OF IMAGE AND GRAPHICS
© Copyright 2023 CSIG - All rights reserved.