机器人与具身智能

会程安排

9 月 19 日 上午

分论坛主席

陈涛
教授 ⋅ 复旦大学
陈涛,复旦大学教授,上海创智学院全时导师,入选上海市以及国家高层次青年人才计划,全球2000位最有影响力的AI研究学者。他的主要研究领域包括计算高效的视觉基础模型和多模态大模型设计及压缩,以及这些理论在端侧智能、人形机器人运动控制等领域应用。他先后主持国家自然科学面上、联合基金项目,承担科技创新2030新一代人工智能重大专项子课题、上海市人工智能重大专项课题、上海市原创探索者计划项目,以及来自华为、中兴、小米、中国兵器等企业项目。迄今为止,他已经在各类国际学术期刊和会议如IEEE T-PAMI/T-IP/IJCV/CVPR/NeurIPS/AAAI上发表高水平论文200余篇,含10篇ESI高被引用论文和热点论文,带领团队获得2022年ECCV自动驾驶挑战赛季军,2023年ICCV三维室内密集场景理解冠军,CCF大模型加速体系设计竞赛三等奖。指导2名博士获得上海市图像图形学会优博论文,10余名研究生获得上海市优秀毕业生。2024年作为课题负责人获得工信部医疗器械揭榜挂帅重点项目优胜奖,2025年为复旦大学光华一号人形机器人研发的具身大脑入选复旦大学十大科技进展。
马月昕
研究员 ⋅ 上海科技大学
马月昕,上海科技大学研究员、助理教授、博导,博士毕业于香港大学。主要研究方向为三维视觉、具身智能、自动驾驶。共发表相关领域顶会或顶刊论文80余篇,其中一作与通讯论文40余篇,包括Science Robotics、TPAMI、CVPR、ICCV、ECCV、SIGGRAPH等,谷歌学术引用5000余次。参与指导的论文获MICCAI 2024唯一最佳论文奖,ACM MM 2024最佳论文候选。曾获上海市海外高层次人才、上海市优秀教学成果(高等教育类)一等奖;曾获SemanticKITTI、NuScenes、Argoverse等多个国际自动驾驶挑战赛冠军和亚军;曾获China3DV 2025年度优秀青年学者。
程龙
研究员 ⋅ 中国科学院自动化研究所
程龙博士,中国科学院自动化研究所研究员,博士生导师,中国科学院大学岗位教授,IEEE FELLOW。目前受聘IEEE CIS Beijing Chapter主席,担任《IEEE Transactions on Cybernetics》、《IEEE Transactions on Automation Science and Engineering》、《中国科学技术科学》、《自动化学报》等国内外刊物的编委。入选国家杰出青年基金项目、国家优秀青年基金项目、中组部万人计划青年拔尖人才计划、北京市杰出青年基金。获得2017年度国家自然科学二等奖。程龙博士的研究兴趣包括机器人与智能控制。
程吉禹
副教授 ⋅ 山东大学
程吉禹,工学博士,山东大学控制科学与工程学院副教授/硕士生导师,山东大学“青年学者未来计划”入选者。分别于2015年、2019年在山东大学和香港中文大学获得学士、博士学位。2020年7月入职山东大学,现为机器智能与系统控制教育部重点实验室骨干。主要从事多机器人系统、机器人感知与技能学习等领域的研究。近年来主持人工智能和机器人方向国家自然科学基金等国家级纵向项目4项,企业委托横向项目1项。代表论文以第一/通讯作者发表在IEEE TASE、TIE、TII、TITS、RAL、ICRA等领域权威期刊和会议。
蒋树强
教授 ⋅ 中国科学院大学
蒋树强,中国科学院大学特聘教授,博士生导师,先后担任期刊《IEEE TMM》、《ACM ToMM》、《IEEE Multimedia》、《计算机研究与发展》、《JCST》、《CAD学报》编委,中国人工智能学会具身智能专委会主任、中国计算机学会多媒体专委会副主任、中国自动化学会网络计算专委会副主任、ACM SIGMM中国分会副主席,研究方向是多媒体内容分析和具身智能技术。主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金青年基金A类(杰青)、B类(优青)、重点等项目20余项,发表论文200余篇,获授权专利20余项,多项技术应用到实际系统中,先后获省部级或学会奖励5项。

分论坛报告

合成数据驱动的具身VLA预训练新范式
王鹤 北京大学
报告摘要:具身视觉-语言-动作(VLA)大模型被认为是走向通用机器人的重要技术路线,然而具身动作数据的昂贵和不足是目前的重要瓶颈。相较于采集真实动作数据,大规模、高质量的合成动作数据为VLA的零样本泛化提供了一个更可行且低成本的方案。本报告以端到端操作模型GraspVLA 和端到端导航Uni-NaVid、TrackVLA 等系列工作为例,探讨完全以合成动作数据进行预训练的VLA新范式及其惊人的零样本泛化能力以及与真实数据的结合。
讲者简介:王鹤博士是北京大学计算机学院前沿计算研究中心的助理教授和博士生导师。他同时是北京银河通用机器人公司的创始人和CTO,智源学者。他的研究目标是通过研究具身多模态大模型和人形机器人技能学习来推进通用机器人的发展。他获得蚂蚁InTech科技奖,《麻省理工科技评论》“35岁以下科技创新35人”(TR 35中国区),2024年北京大学-中国光谷科技成果转化奖,英特尔中国学术英才计划荣誉学者等称号。他的论文获得ICCV2023最佳论文候选,ICRA2023最佳操纵论文候选,2022年世界人工智能大会青年优秀论文(WAICYOP)奖,Eurographics 2019最佳论文提名奖。他担任CVPR和ICCV的领域主席。在加入北京大学之前,他于2021年从斯坦福大学获得博士学位,师从美国三院院士Leonidas. J Guibas教授,于2014年从清华大学获得学士学位。
具身智能scaling law与可规模化数据
卢策吾 教授 ⋅ 上海交通大学
报告摘要:该报告介绍当前具身智能Scaling Law遇到的瓶颈,包括解空间巨大与数据不可规模化的问题。针对解空间巨大,提出面向操作结构世界模型的数据基因方法与力-位混合大模型,有效降低具身智能解空间。针对数据不可规模化问题,提出“数据生产伴随采集范式”以及对应的硬件设备、数据格式与算法。
讲者简介:卢策吾,上海交通大学人工智能学院副院长、教授,国家人工智能学院(创智学院)副院长,长江学者特聘教授,科学探索奖获得者,2016年获海外高层次青年引进人才,2018年被《麻省理工科技评论》评为35位35岁以下中国科技精英(MIT TR35),2019年获求是杰出青年学者,2020年获上海市科技进步特等奖,2022年获教育部青年科学奖,IROS/ICRA最佳论文之,2023年获机器人顶会RSS最佳系统论文提名奖(共四项),科学探索奖。以通讯作者或第一作者在《自然》,《自然·机器智能》,TPAMI等高水平期刊和会议发表论文100多篇;担任Sicence正刊,Nature子刊,Cell子刊等期刊审稿人,NeurIPS,CVPR,ICCV ,ECCV,IROS ,ICRA领域主席。研究兴趣包括具身智能,计算机视觉。
Intern Robotics『书生』具身全栈引擎及其关键技术
庞江淼 ⋅ 上海人工智能实验室
报告摘要:具身智能近期获得了较大的关注和进展,但仍存在任务定义不明确,数据匮乏、多样性差,模型泛化性差,评测困难等问题。本报告将重点介绍上海人工智能实验室推出的 Intern Robotics『书生』具身全栈引擎及其关键技术,包含仿真引擎,数据引擎与训测引擎,提供具身基座模型与专用工具链,支撑以虚实贯通的方式训练本体泛化、任务泛化、场景泛化的具身大模型,驱动异构机器人赋能千行百业。 
讲者简介:庞江淼,上海人工智能实验室青年科学家,具身智能中心负责人,研究方向为机器人学习、多模态学习、具身智能,目标构建一体可泛化的具身通用人工智能系统。在 TPAMI、IJCV、CVPR、CoRL 等计算机视觉与机器人学习领域顶级期刊与会议发表论文 60 余篇,谷歌学术被引 14000 余次,相关系列开源项目在 GitHub 累计星标 45000 余次,被产学界广泛使用。他曾获得 ECCV 2024 最佳论文提名,RSS 2025 最佳系统论文提名,CVPR 2023 与 ECCV 2024 最有影响力论文等荣誉。
不止于VLA:生成式驱动的新一代人形机器人大模型
陈涛 教授 ⋅ 复旦大学
报告摘要:传统视觉-语言-动作(VLA)模型在机器人任务中面临泛化性不足、动态环境适应性差等挑战。本报告提出基于生成式大模型的人形机器人运动决策框架,重点围绕:1)构建三维空间的多模态感知理解架构,融合视觉、语言、三维点云等多源感知数据,实现开放场景的具身机器人环境感知与动态建模;2)设计基于自然语言和视觉多模态驱动的生成式数字人运动大模型框架,实现从用户高层任务规划到底层人体运动控制的端到端三维运动序列生成;3)引入融合关节重定向的强化学习方法,支持通过仿真-现实迁移实现数字人到机器人本体的运动控制。报告将为生成式大模型驱动的人形机器人运控提供新范式。 
讲者简介:陈涛,复旦大学教授,上海创智学院全时导师,入选上海市以及国家高层次青年人才计划,全球2000位最有影响力的AI研究学者。他的主要研究领域包括计算高效的视觉基础模型和多模态大模型设计及压缩,以及这些理论在端侧智能、人形机器人运动控制等领域应用。他先后主持国家自然科学面上、联合基金项目,承担科技创新2030新一代人工智能重大专项子课题、上海市人工智能重大专项课题、上海市原创探索者计划项目,以及来自华为、中兴、小米、中国兵器等企业项目。迄今为止,他已经在各类国际学术期刊和会议如IEEE T-PAMI/T-IP/IJCV/CVPR/NeurIPS/AAAI上发表高水平论文200余篇,含10篇ESI高被引用论文和热点论文,带领团队获得2022年ECCV自动驾驶挑战赛季军,2023年ICCV三维室内密集场景理解冠军,CCF大模型加速体系设计竞赛三等奖。指导2名博士获得上海市图像图形学会优博论文,10余名研究生获得上海市优秀毕业生。2024年作为课题负责人获得工信部医疗器械揭榜挂帅重点项目优胜奖,2025年为复旦大学光华一号人形机器人研发的具身大脑入选复旦大学十大科技进展。
自主智能飞行机器人研究和应用
高飞 副教授 ⋅ 浙江大学
报告摘要:随着机器人和人工智能技术的快速发展,飞行机器人及其集群系统在复杂动态环境下的自主控制已取得长足进展。本报告将介绍飞行机器人最新自主导航算法,阐述面向高动态、强干扰、多约束场景下基于物理智能的模型构建和优化求解方法;介绍基于VLA技术路线的飞行机器人通用决策和数据驱动的高机动控制算法,并展示其在真实复杂环境中的验证效果。最后,报告将介绍飞行机器人群体智能方面的最新研究和落地进展,展示复杂环境适应性、系统鲁棒性及可扩展性方面的进展,为未来大规模智能集群的工程化应用提供理论支撑与技术参考。
讲者简介:高飞,浙江大学控制学院长聘副教授,研究员,博士生导师;微分智飞(杭州)科技有限公司创始人、CEO,国家自然科学基金委优秀青年基金获得者。本科毕业于浙江大学,博士毕业于香港科技大学。高飞的主要研究方向包括空中机器人、自主导航、集群智能灯。近年来以第一/通讯作者身份发表包括4篇Science Robotics、7篇IEEE Transactions on Robotics (TRO), 以及RSS, ICRA,IROS在内的100余篇国际知名机器人期刊/会议论文;提出了国际首个非结构化场景的自主飞行集群系统,成果以封面论文形式发表于国际机器人权威期刊Science Robotics;受到国家自然科学基金委专报高度评价,并被国内外媒体广泛报道。成果被选送参加“奋进新时代”主题成就展、“八八战略”实施20周年大型主题展等,并被国家博物馆收藏。承担多项重要国家级科研课题,先后获得IEEE TRO 2020年最佳论文荣誉提名奖、IEEE/RSJ IROS 2021 年最佳应用论文奖提名、IEEE ICRA 2024及2025两次最佳论文奖提名、国际基础科学大会ICBS 2024前沿科学奖等学术荣誉;入选爱思唯尔数据库2023年度及24年度全球前2%顶尖科学家、中国高被引学者榜单等。