第十八届中国图象图形学学会青年科学家会议–学术新星论坛

报告嘉宾

朱磊   山东师范大学

报告题目:多模态紧致表示学习

讲者简介:朱磊,山东师范大学教授,博士生导师。主要研究方向是跨模态分析与检索。共发表CCF A类会议长文、ACM/IEEE汇刊论文百余篇,ESI高被引论文8篇,Google引用5600多次。获得CCF A类会议等多个会议最佳论文奖/提名奖,1篇论文入选2019年中国百篇最具影响国际学术论文,拥有授权专利22件。担任ACM TOMM、IEEE TBD、Information Sciences等多个国际期刊的编委,任多媒体领域权威国际会议ACM MM/IEEE ICME的领域主席(Area Chair),SIGIR/CIKM/AAAI高级程序委员会委员(SPC)。主持/参与基金委青年/面上项目、山东省优秀青年基金项目等10余项横纵课题。获得ACM中国SIGMM新星奖,中国自动化学会优秀硕士生导师奖、山东省留学回国人员创业奖、山东省人工智能优秀青年奖等。

报告摘要:哈希是一种紧致表示学习技术。它可以将高维数据转换为紧致的二值哈希码。由于二值汉明空间的嵌入,哈希技术在相似度计算和存储方面具有明显的效率优势。因此,哈希已成为支撑大规模多媒体检索的一种有效技术。多媒体数据具有多模态、异构、存在噪声、模态易缺失、流式生成等特点。如何高效地学习包含多媒体语义的紧凑二值哈希码具有一定的挑战性。在本次报告中,我将介绍面向多模态数据的哈希表示方法,介绍如何深度建模多模态潜在语义和高效学习二值哈希码的方法。

胡鹏  四川大学

报告题目:跨模态噪声关联学习:一种新的噪声标签学习范式

讲者简介:胡鹏,四川大学副研究员。2019年毕业于四川大学并获得博士学位。2019至2020年在新加坡信息通信研究所(I2R, A*STAR)担任研究员。主要研究兴趣包括表示学习及其在多媒体分析、图像处理等领域中的应用,目前在IEEE TPAMI, IEEE TIP, CVPR, NeurIPS, AAAI, ACM MM等国际期刊和会议上发表论文30余篇。

报告摘要:深度神经网络的成功依赖于高质量标记的训练数据,而收集良好标注的大规模跨模态数据的成本高昂。为了降低数据收集的高成本,可从互联网上收集同时出现的跨模态对作为大规模的跨模态数据集。然而,这将不可避免地会在训练数据中引入噪声,称为噪声关联。毫无疑问,这种噪声会使监督信息不可靠/不确定,并显著降低性能。针对这一问题,本次报告将汇报一种新的噪声标签学习范式,称为噪声关联学习。不同于标准的噪声标签学习,噪声关联学习旨在削弱甚至消除成对训练数据中的错误关联关系造成的影响,例如多模态训练数据中的图文不匹配,对话系统中的答非所问等。具体地,本次报告将详细汇报一种广义的深度证据跨模态学习框架。该框架将基于跨模态相似性的双向证据建模并参数化为Dirichlet分布,以捕获噪声关联引起的不确定性,这不仅提供了准确的不确定性估计,而且还赋予了对噪声关联扰动的弹性。

陈静静  复旦大学

报告题目:面向视频模型的对抗攻击方法研究

讲者简介:陈静静,复旦大学计算机科学技术学院副教授,上海浦江人才计划入选者,主要研究领域为多媒体内容分析、计算机视觉、多媒体模型安全等。主持/参与了包括国家自然科学基金、科技部科技部2020年“科技创新2030-新一代人工智能”重大项目、上海市行动创新计划等多项科研项目。在 ACM Multimedia, CVPR等重要国际会议、期刊上发表论文 40 余篇,曾获得ACM Multimedia 2016最佳学生论文奖、Multimedia Modeling 2017 最佳学生论文奖。担任多个国际知名期刊审稿人、国际会议领域主席/程序委员会委员。

报告摘要:随着以深度学习为代表的新一代人工智能的发展,智能视频技术取得了突破性进展,并广泛应用于生活的方方面面。但是现有的智能视频系统并不安全:恶意生成的细微扰动便可以欺骗智能视频识别系统。因此研究智能视频系统在对抗样本攻击下的安全性已经吸引了大量关注,成为一个重要的研究方向。一方面,研究针对视频模型的对抗样本有助于帮助发现模型的安全漏洞,提高智能视频模型在实际应用中的安全性;另一方面,研究对抗样本的攻防理论有助于加深对深度学习技术机理的理解,以设计更加鲁棒的机器学习算法。本报告将对面向视频识别模型的对抗攻击算法最新进展进行介绍,包括基于启发式搜索的黑盒场景攻击算法,基于时序平移的视频迁移对抗攻击方法以及面向视频识别模型的弹幕攻击等。

朱翔昱 
中科院自动化研究所

报告题目:基于三维描述的生物特征识别

讲者简介:朱翔昱,中国科学院自动化研究所模式识别国家重点实验室副研究员。长期从事三维人脸重建、人脸识别、人脸防伪等方面的相关理论研究与应用,在国际顶级期刊和会议发表论文50余篇,Google总引用次数6000余次,单篇引用超过2000次。中科院青促会成员,入选百度学术全球华人AI青年学者榜单,担任ACM MM领域主席。相关成果获中国电子学会科技进步二等奖,ICCV人脸识别、FG人脸微表情等国际赛事冠军,中国图象图形学学会优秀博士论文提名奖,授权国家发明专利6项。研发的全姿态三维人脸重建受到国内外同行的广泛关注(谷歌学术引用1200余次),相关开源代码在Github上收获4700星,并被PyTorch官方Twitter报道。CCF-CV及CSIG-MV专委会委员,IJCV、IEEE TIP、IEEE TCSVT等国际期刊审稿人。主持北京科协青年人才托举工程、腾讯犀牛鸟专项研究计划、基金委面上及青年项目。

报告摘要:三维辅助视觉分析通过拟合三维模型使视觉系统获得对物体的三维理解,从而提高鲁棒性和泛化性的方法,是生物特征识别领域的前沿热点之一。本次分享将基于三维重建和三维辅助两个主题,介绍我们在三维人脸重建、三维辅助人脸分析、基于三维描述的生物特征识别上的最新成果,探讨如何在实际场景下快速准确地重建目标三维结构,并基于三维结构辅助视觉分析任务。

高林
中科院计算技术研究所

报告题目:人-物-场的神经建模与渲染方法

讲者简介:高林,CCF高级会员、中国科学院计算技术研究所博士生导师、副研究员,北京市杰青,英国皇家学会牛顿高级学者。研究方向为计算机图形学,在ACM SIGGRAPH\TOG, IEEE TPAMI, IEEE TVCG, CVPR 等国际知名期刊会议发表论文50余篇,相关研究工作入选ESI高被引论文,DeepFaceDrawing系列研究工作被180余个国家或地区的用户所使用,获亚洲图形学学会青年学者奖、CCF技术发明一等奖、CCF CAD&CG专委图形软件开源奖等奖励。

报告摘要:随着数字经济和虚拟数字世界的发展,数字内容成产愈发成为数字经济的关键支撑技术。数字内容即可以来自对真实世界的复刻也可以来自于用户的个性化创作,其中数字内容主要包含人、物和场景,如何对人-物-场进行高效高质量的建模成为热点和重点的研究问题。在本次报告中,我们将分享基于可微分方法的数字内容的重建与创造方法,包括数字几何模型与场景的重建、建模与编辑和数字人的重建与创作方法以及数字场景的合成方法。