青托论坛

会程安排

9 月 19 日 上午

分论坛主席

魏秀参
教授 ⋅ 东南大学
魏秀参,东南大学计算机科学与工程学院教授、博士生导师。主要从事计算机视觉、机器学习和机器人等方面研究。相关研究工作获“江苏省自然科学百篇优秀学术成果”及含CVPR iNaturalist在内的国际权威学术评测共10项世界冠军。担任IEEE TIP/TMM编委,CVPR、ICCV、AAAI、IJCAI等国际会议的领域主席、研讨会主席、讲习班主席等10余次,并任Fundamental Research/电子学报(英文版)青年编委、CSIG青托俱乐部主席、CCF-CV/CSIG-青工委副秘书长、VALSE常务AC等。曾入选CSIG青年科学家奖、吴文俊人工智能优秀青年奖、中国科协青年人才托举工程等。主编教材《解析深度学习(第2版)》入选省部级重点教材和“十四五”国家重点出版物出版规划,出版学术专著1部。主持国家重点研发计划青年科学家项目、科技委专项等。
彭春蕾
教授 ⋅ 西安电子科技大学
彭春蕾,西安电子科技大学教授,博士生导师,西电杭州研究院挂职副院长,网络与信息安全学院导学第四党支部书记。近年来从事视觉身份可信识别方面的研究,包括伪造检测、智能生成和鲁棒识别等。发表论文70余篇,主持国家自然科学基金面上项目、陕西省重点研发计划、CCF-腾讯犀牛鸟基金等,以排名第二参与2项国家自然科学基金重点项目。入选中国科协青年人才托举工程、陕西省青年科技新星,获吴文俊人工智能优秀青年奖、湖北省技术发明一等奖(3/6)、中国图象图形学学会自然科学二等奖(3/5)、陕西省优秀博士学位论文、中国图象图形学学会优秀博士学位论文奖。指导研究生入选中国电子学会硕士学位论文激励计划。担任国际期刊 Visual Computer Associate Editor,《网络空间安全科学学报》青年编委等。

分论坛报告

高效率三维数字人生成模型
朱昊 助理教授 ⋅ 南京大学
报告摘要:高效地重建三维数字人是影视游戏制作、元宇宙、沉浸式交互等前沿产业的重要需求。尽管现有方法提高了重建质量,但仍存在泛化能力有限、重建过程缓慢等问题。针对现有方法存在的这些问题,我们提出借助少量三维扫描模型以及视觉生成大模型所提供的先验知识,构建大规模、高精度的三维人物数据集。以此数据集为基础,构建三维全身生成大模型,旨在高效生成具有逼真纹理和精准几何外形的三维数字人。该模型能够在1秒内完成基于图像的可驱动三维数字人生成,且能够无缝适配动画制作、编辑等下游任务,显著提升了三维数字人建模的实用性。在不远的未来,高效率的三维数字人生成模型将为普通消费者提供便捷、高质量的数字人建模服务,拉近每一位用户与三维虚拟世界之间的距离。
讲者简介:朱昊,于南京大学获得学士和博士学位,现为南京大学智能科学与技术学院助理教授、姑苏青年教授、博导,共同指导南京大学三维视觉实验室(NJU-3DV),同时也是计算成像实验室(CITE)的一员,从事三维视觉和人工智能方向的研究。近年来聚焦数字人三维重建、生成与驱动技术,发表三十余篇学术论文,包括TPAMI、CVPR、AAAI、ECCV、SIGGRAPH等,代表工作包括FaceScape系列和MoFaNeRF系列。相关研究成果被应用于国内首部真人全CG电影的制作和联合国世界文化遗产大足石刻的三维建模。入选第八届中国科协青年人才托举工程、腾讯犀牛鸟专项研究计划,曾获得IEEE CAS杰出青年作者奖、江苏省双创博士、南京大学博士生校长特别奖等荣誉。
马尔视觉理论:2D-2.5D-3D表征的涌现
朱翔昱 研究员 ⋅ 中国科学院自动化研究所
报告摘要:计算机视觉奠基人大卫·马尔(David Marr)指出,视觉信息处理包含三个阶段,即"二维草图(2D sketch)、二维半草图(2.5D sketch)、三维模型(3D model)",最终以"部件-整体"解析树的形式构建出具有视角不变性的鲁棒物体表征。近年来,深度神经网络在视觉任务上的表现已接近人类水平,但其内部表征机制是否遵循马尔理论尚未得到充分探索。本报告将介绍围绕马尔视觉理论展开研究:我们以人脸感知为切入点,结合可解释性方法、胶囊网络架构及无监督三维重建技术,探究了深度神经网络各层级表征的几何结构。实验表明,在神经网络感知人脸过程中,呈现出"2D-2.5D-3D"的表征构建流程,最终形成"人脸-五官"的层次化表征。这一发现支持了马尔视觉理论,也为理解视觉神经网络的内部工作机制提供了新的视角。
讲者简介:朱翔昱,中国科学院自动化研究所项目研究员,从事生物特征识别、数字人、人工智能基础理论研究与应用。国际模式识别协会(IAPR)生物特征识别青年学者奖(YBIA)获得者(两年一次,每次从全球范围内评选40岁以下学者一名)。共发表论文100余篇,发表文章的Google Scholar总引用次数为10000余次。获得三次国际竞赛冠军以及四项最佳论文及提名奖。授权国家发明专利16项。获2024中国图象图形学学会自然科学二等奖(第一完成人),2021中国电子学会科技进步二等奖、中国图象图形学学会优秀博士论文提名奖,任中科院一区期刊T-IFS(CCF:A类)、Pattern Recognition (PR) 编委,中国图象图形学学会青托俱乐部副主席。
AI安全与治理
赵健 多媒体认知学习实验室主任 ⋅ 中国电信人工智能研究院
报告摘要:近年来,大语言模型与各行各业的深度融合推动了AI技术的广泛应用。然而,随着AI工具化日益普及,当普通人能够轻松利用这些AI工具的同时,由此引发的潜在的安全风险与伦理挑战也随之凸显。本报告将从多个维度介绍中国电信人工智能研究院(TeleAI)在AI治理方面的思考探索与创新实践,并给出未来展望。
讲者简介:赵健,中国电信人工智能研究院 (TeleAI)多媒体认知学习实验室(EVOL)主任、资深研究科学家,隶属李学龙教授(中国电信集团CTO、首席科学家、中国电信人工智能研究院院长)团队,2019年博士毕业于新加坡国立大学(导师:颜水成教授),主要从事AI治理、临地安防方面的研究工作。 共发表高水平国际期刊和会议论文80余篇,其中,一作代表作包括T-PAMI 2篇(影响因子:20.8)、IJCV 3篇(影响因子:11.6)、CCF-A类会议ACM MM(唯一最佳学生论文奖,1/208,2018)等,第一发明人授权国家发明专利6项。谷歌学术被引超5000次,H指数40,I-10指数72。入选国资委央企“科技领军人才”、中国科协及北京市科协“青年托举人才”,主持国自然面上、军口部委某类型等项目7项。相关技术成果服务于多个国家重要部门,同时也在中国电信等7个科技领军企业得到应用,产生了显著效益。曾获中国人工智能学会吴文俊人工智能优秀青年奖(2023)、中国人工智能学会吴文俊人工智能自然科学奖一等奖(2022,排2,中国智能科学技术最高奖)、新加坡模式识别与机器智能协会(PREMIA)2019 Lee Hwee Kuan奖(排1),10次在国内外重要科技赛事中夺冠。 担任北京图象图形学学会理事,国际知名期刊《Pattern Recognition》编委等。
智能矢量图生成技术研究与应用
于茜 副教授 ⋅ 北京航空航天大学
报告摘要:随着数字媒体与图形设计领域的快速发展,矢量图形因其无损缩放特性和高度可编辑性获得了广泛应用。然而,传统矢量图制作高度依赖人工绘制,在需要大规模生成的场景下面临效率低下、成本高昂等问题。因此,研究高效、智能的矢量图自动生成算法具有重要的理论意义和应用价值。本报告将系统介绍团队近两年在智能矢量图生成方向的研究进展。我们的核心创新在于深入挖掘矢量图特有的双模态表征特性——即同时包含视觉外观和结构化代码两种互补的表达形式。基于这一发现,我们提出了一系列创新方法,实现了高效可编辑的二维、三维和动态矢量图生成,有效提升了矢量图的生成质量和效率。
讲者简介:于茜,北京航空航天大学“卓越百人”副教授,博士生导师,入选第九届中国科协青年人才托举工程。2018年博士毕业于英国伦敦大学玛丽女王学院,之后在美国加州大学伯克利分校从事博士后研究。研究方向是计算机视觉和深度学习,主要聚焦于AIGC、草图理解与应用、矢量图生成等。目前发表学术论文40余篇,Google Scholar引用2600 余次。曾荣获2015年英国机器视觉大会(BMVC)的最佳论文奖,相关成果受到BBC在内的十余家海内外媒体的报道。自2020年入职以来,曾/现主持国自然青年基金项目、CCF-百度松果基金项目、北航-华为关键软件项目等,作为项目骨干参与科技部重大项目两项;担任ACM Multimedia 2024的社交媒体主席和CVPR 2024/2025的领域主席。
可信多模态表示学习
杨二昆 副教授 ⋅ 西安电子科技大学
报告摘要:多模态信息的智能感知与理解是实现通用人工智能的核心能力,随着各类传感器的广泛应用,基于图像、文本、声音、传感器数据等的多模态需求日益增加。与此同时,跨模态信息智能感知的挑战也日渐突出,如何克服不同模态间的模态鸿沟,发展自主可控、可信任的多模态一致表示学习方法,成为提升各种下游认知、理解与推理任务的关键。本次汇报以多模态对齐、噪声鲁棒等为切入点,介绍可信多模态学习的前沿进展。
讲者简介:杨二昆,西安电子科技大学副教授,主要研究方向为机器学习,计算机视觉,多媒体信息检索,噪声标签学习等,已在国际顶级期刊或会议上发表论文四十余篇,担任ICLR2026、ACML2026领域主席, DSM期刊青年编委。获陕西省优秀博士学位论文,NeurIPS 杰出审稿人,小米青年学者,入选陕西省高层次海外引进人才,获陕西省自然科学一等奖(序2)。