中国图象图形学学会第十期珠峰论坛线上成功举办

为贯彻落实党的二十大精神,有力地推动科学技术的创新、进步和发展,积极发挥青年科技人才的学术引领作用,中国图象图形学学会于2022年12月3日通过线上会议方式举办了第十期珠峰论坛。本次论坛由中国图象图形学学会主办,中国图象图形学学会青年工作委员会承办,天津大学协办,主题为“多媒体编码、处理与通信交叉前沿技术”,邀请了在多媒体编码、处理及通信领域的十名优秀学者做特邀报告,积极探索多媒体编码、处理与通信领域的交叉前沿技术。本次论坛共有来自全国各地的师生及企业界人士近200人线上参会。

2022年12月3日上午,天津大学潘兆庆教授主持了开幕式。天津大学科学技术发展研究院副院长雷建军教授首先致辞,对各位专家和参会人员表示欢迎,简要介绍了天津大学在多媒体编码与处理领域的发展历程和研究基础,并表示本次论坛有助于推动天津大学相关学科的进一步发展。随后,中国图象图形学学会青工委副主任徐迈教授致辞,介绍了珠峰论坛的宗旨,并对天津大学以及与会专家表示诚挚的感谢,希望参会人员在这次论坛中有所收获。

本次论坛由多媒体编码、多媒体通信、多媒体处理三部分组成。多媒体编码组的报告由天津大学潘兆庆教授主持,华中科技大学喻莉教授、上海大学安平教授、中国科学技术大学陈志波教授、哈尔滨工业大学范晓鹏教授、中国科学院大学齐洪钢教授围绕多媒体编码主题作了精彩报告。

华中科技大学喻莉教授作了题为“机器视觉编码技术的现状和发展”的报告。喻教授首先指出目前面向机器视觉的编码需求急剧上升;然后,介绍了VCM标准的发展现状,详细介绍了VCM Track-1特征压缩的五种提案,VCM Track-2先压缩后分析的五种提案,并对相应提案的性能进行了分析总结;最后,分享了团队在机器视觉编码方面的工作成果,并对机器视觉编码的准确性、泛化性及应用场景等方面提出了思考。

上海大学安平教授作了题为“光场图像压缩编码”的报告。安教授首先介绍了光场成像的基本理论,并指明现阶段的光场图像压缩编码大都以子孔径图像伪序列为对象,没考虑光场角度域的特性。为解决上述问题,安教授基于光场图像的稀疏特性,提出了多种光场稀疏视点编码方法,分别探索了利用光场低秩特性的压缩方法、基于一致性约束的压缩方法、视差修正模型、光场图像分层压缩算法等。

中国科学技术大学陈志波教授作了题为“场景的虚实不确定性理解”的报告。陈教授从生成对抗网络框架和基于似然估计的方法两个角度简要介绍了现有的生成模型,并分析总结了各方法的特性。随着生成模型在数据压缩领域的广泛研究,基于端到端神经网络的图像压缩效率得到大幅的提升。陈教授从模型框架、熵模型增强,感知质量编码和可逆变换容量四个方面阐述了现有生成模型在神经图像压缩中取得的成效,并提出了相关的优化方案。此外,由于机器视觉编码在灵活性、泛化性和可拓展性等方面可以为生成模型带来新的发展机遇,陈教授也从基于任务的语义编码和结构化码流的角度出发,提出了相应的解决方案。

哈尔滨工业大学范晓鹏教授作了题为“信源信道联合编码-从图像到任务”的报告。范教授指出,先前采用的信源信道独立编码方法在做信道保护之后,会出现“悬崖效应”,即信道的信噪比较小时,解码端视频质量会突然严重下降,当信道的信噪比大于某一阈值之后,信噪比的提升所带来的视频质量的提高依然有限。针对以上问题,范教授提出了信源信道联合编码的方法,该方法克服了悬崖效应,使得视频质量和信道信噪比在较大的范围内是呈线性关系的,并介绍了该方法在图像压缩和其他机器任务方面的应用。

中国科学院大学齐洪钢教授作了题为“视频编码技术发展及应用现状”的报告。齐教授详细介绍了视频编码领域技术的发展与应用现状,并深度分析了当前视频编码技术存在的诸多挑战。齐教授指出当前视频编码技术存在压缩后视频质量严重下降、传统视频编码标准中的环内滤波技术优化难度大等问题。另外,新一代视频编码标准中采用了大量的先进编码工具,这些编码工具在提升视频编码压缩效率的同时显著增加了视频编码器的计算复杂度。针对以上问题齐教授提出了相关的解决方案,利用深度学习强大的特征提取能力,分别构建了基于学习的视频质量增强方法和VVC帧内模式决策方法,有效提升了解码重建视频的质量并降低了视频编码器的计算复杂度。

多媒体通信组的报告由山东大学元辉教授主持,中国科学院计算技术研究所纪雯教授、北京邮电大学许长桥教授围绕多媒体通信主题作了精彩报告。

中国科学院计算技术研究所纪雯教授作了题为“视觉物联网:视觉编码、计算传输与端边云架构”的报告。纪教授从物联网设备的变迁引入,介绍了视觉物联网的端-边-云核心理论体系,深度分析视觉物联网所面临的技术挑战。纪教授指出现有的视觉物联网存在设备多样、数据量大、延迟要求低、多类视觉数据流适配难等问题,并从编码创新、传输创新、物联网架构创新等方面给出相应的解决方案。最后,对标新型端-边-云多媒体协同计算架构的需求,探讨了如何建立并形成标准化体系,进而推动智慧城市建设加速发展。

北京邮电大学许长桥教授作了题为“沉浸式媒体边缘缓存与组播交付技术”的报告。许教授指出以虚拟现实流媒体为代表的沉浸式媒体是未来多媒体发展最有前景的新形式,然而沉浸式媒体超高带宽与存储需求、超低运动时延和复杂视口变化的特性,对现有的通信系统带来了挑战。如何针对用户需求,面向高度波动网络,利用有限网络资源,设计高效的沉浸式媒体缓存与交付策略是亟需解决的难题。针对该问题,许教授提出了相关的解决方案,对沉浸式媒体传输框架做出了改进,有效降低了传输时延,实现了组播群组的高效匹配。

多媒体处理组的报告由天津大学彭勃助理教授主持,哈尔滨工业大学(深圳)张永兵教授、四川大学刘怡光教授、杭州华为云计算有限公司江奎博士围绕多媒体处理主题作了精彩报告。

哈尔滨工业大学(深圳)张永兵教授作了题为“全切片扫描病理成像与计算”的报告。张教授指出基于病理成像与计算的组织学分析是临床上进行癌症诊断的黄金标准。然而,在成像方面,现有方法存在成像速度慢、成像精度低等局限;在病理诊断方面现有方法存在人工标注工作量大、受主观因素限制大、容易造成误诊漏诊等缺点。如何快速并高效获取高质量病理切片图像,进而实时辅助医生进行精准的疾病诊断是病理成像与计算亟待解决的问题。张教授在本次报告中首先介绍了病理成像与计算的发展历程;随后分别介绍了课题组在快速全切片病理扫描成像与基于人工智能的病理计算方面的研究工作,最后对病理成像与计算的发展进行了展望。

四川大学刘怡光教授作了题为“面向特殊环境的信息探测与智能感知”的报告。刘教授指出探测感知任务面临许多挑战,复杂的自然环境与电磁环境对目前的探测方式造成极大干扰,影响目标探测感知的信噪比;强对抗行为对目标探测和感知的可信性提出极大挑战;探测信号的不确定性也对目标感知带来严峻挑战。针对以上问题,刘教授提出相应解决方案,包括利用光量子神经网络实现感知一体化、全光化;通过光学+AI快速低功耗的计算解决智能探测和感知的问题。

杭州华为云计算有限公司江奎博士作了题为“图像增强中的解耦表达”的报告。江博士主要介绍了去雨算法的现状和发展。过去的算法思想是将雨水与背景完全分离,没有考虑雨水和背景的关系。然而事实上雨水会对背景进行遮盖或模糊,因此提出将雨水与背景进行初步分离后再对背景进行修复。针对去雨图像质量不高的问题,采用解耦策略,与以往直接将模拟雨景图像转换为真实雨景图像的方法相比,提出的方法摆脱了一致背景,而集中于更简单的雨景层转换,显著提高了去雨图像的质量。

十位优秀学者的精彩报告向与会者介绍了多媒体编码、处理以及通信交叉前沿技术的最新进展,激发了大家的兴趣和热情。学会非常重视青年人才的培养和储备,为青年科技工作者搭建了多种形式的交流平台,促进青年人才的交流。2022年中国图象图形学学会第十期珠峰论坛在各位讲者嘉宾、参会人员、志愿者的大力支持下,获得了圆满成功。