泛在具身智能
8月22日（星期五）15：30-17：30
地点: 三楼广州厅

嘉宾简介
刘勇浙江大学	简介：浙江大学控制科学与工程学院教授，浙江大学控制学院智能驾驶与未来交通中心主任，浙江大学-天数智芯先进智能计算联合研发中心主任，浙江大学先进智能系统研究中心副主任，浙江大学控制科学与工程学院党委委员，浙江省机器换人专家。获浙江省自然科学一等奖、浙江省科学技术一等奖、浙江省科学技术进步一等奖、浙江省知识产权专利奖一等奖、浙江省自然科学学术二等奖、浙江省杰出青年科学基金项目，入选中组部万人计划青年拔尖人才、浙江省有突出贡献青年科技人才、2022年杭州市钱江特聘专家和浙江省151人才项目。主要研究方向为自主机器人与智能系统、机器人自主规划与导航控制、视觉识别与模式识别、SLAM技术及多传感器融合技术。报告题目：从人工智能到具身智能报告摘要：具身智能在多个领域具有应用潜力，包括工业制造、自动驾驶、物流运输、家庭服务、医疗康养等。本报告将简要介绍从人工智能热潮发展到具身智能的历史过程，并简要介绍具身智能的主要要素和实现途径。
刘偲北京航空航天大学	简介：北京航空航天大学人工智能学院副院长，教授,博士生导师，中国图象图形学学会理事、副秘书长。曾获获国家科技进步二等奖，中国图象图形学学会自然科学奖一等奖。国家自然科学基金优秀青年基金获得者，主持企业创新发展联合基金重点支持项目等多个项目，担任科技创新2030-重大项目课题负责人。主要从事具身智能与多模态内容理解的研究工作，发表CCF-A类论文100余篇，Google Scholar引用17000次。报告题目：大模型时代的无人机视觉语言导航报告摘要：近年来，对大语言模型的不断探索为增强具身智能决策的可解释性和可控性开辟了新的途径。然而，基于大模型的规划器仍然面临着重大挑战，包括大量的资源消耗和极长的推理时间，这对实际部署构成了重大障碍。鉴于这些挑战，本次报告介绍了异步大模型增强闭环决策框架，解耦了大模型和小模型规划器的推理过程。分别在无人机视觉语言导航与自动驾驶场景进行了验证，取得了优异的导航性能。
赵恒爽香港大学	简介：香港大学计算机科学系助理教授，国家优秀青年基金获得者。曾在麻省理工学院和牛津大学担任博士后研究员。研究兴趣涵盖计算机视觉、机器学习和人工智能等广泛领域，特别着重于构建智能视觉系统。在CVPR、NeurlPS和TPAMI等顶级会议和期刊上发表论文100余篇，研究成果被引约40,000余次，其中单篇一作论文被引超17,000次，五篇一作论文被引超1,000次。他曾获得过多次国际学术竞赛的冠军，世界人工智能大会明日之星奖和青年优秀论文奖，CVPR最佳演示荣誉奖，被Al 2000评为计算机视觉领域最具影响力的学者之一，被斯坦福大学列为世界前2%终身影响。报告题目：空间智能视觉基础模型 (Vision Foundation Models with Spatial Intelligence) 报告简介：随着深度学习模型能力的增强以及海量数据的高效获取和利用，大规模视觉基础模型的构建得到了广泛关注。这些视觉基础模型在处理跨领域的复杂视觉场景任务中表现出强大的泛化能力。然而，它们通常专注于图像和视频的理解，而忽略了对具有关键空间属性的高维视觉场景的理解能力。为了解决这些局限性，我们着重探索在2.5维和3维等更高维度上开发具有空间智能的视觉基础模型。本次报告将介绍我们近期一系列关于赋予视觉基础模型空间智能的研究成果，以及它们在诸多重要下游场景如自动驾驶和具身智能等的应用，并探讨视觉基础模型面临的一些挑战和未来前沿。
孙卓西北工业大学	简介：西北工业大学计算机学院教授、博士生导师，国家级青年人才。先后于西北工业大学和新南威尔士大学获得工学学士、硕士和哲学博士学位。2019年4月至2021年4月在澳洲国立大学担任博士后研究员。主要从事多智能体通信网络、任务驱动语义通信等领域的研究工作，主持/参与国家自然科学基金青年项目等国家级项目3项。在IEEEJSAC、TMC、Communication Magazine、Ubicomp等国际学术期刊会议发表论文30余篇。曾获2022 EAI Perva-siveHealth最佳论文奖和2024年《航空学报》最具传播力文章奖。报告题目：感通策协同的多具身智能体网络初探报告简介：随着越来越多的无人机、机器狗等具身智能体出现，多具身智能体通过网络连接并协同完成未知环境探索、协同导航等任务。在此过程中，多具身智能体将迭代执行时序动态耦合的感知、通信和决策过程，直至任务完成。同时，不同于现有蜂窝网，多具身智能体网络以任务完成性能为目标，具备自主决策且演进通信行为的能力。因此，设计感通策协同的多具身智能体网络成为实现多具身智能体协同的关键技术之一。为此，本报告将提出感通策协同的多具身智能体网络组成框架、特点及其初探研究。
陈龙彪厦门大学	简介：厦门大学信息学院副教授、博导，国家级海外高层次人才、厦门大学南强青年拔尖人才。主要研究方向为群体智能、具身智能、空间计算、普适计算。连续两次以第一作者获得CCF-A类会议UbiComp最佳论文提名奖(国内高校首次),荣获2022年度ACM SIGSPATIAL中国分会新星奖(年度全国唯一)。累计发表论文70余篇，含中国计算机学会A类论文14篇(一作及通讯),授权发明专利20余项，主持国家自然科学基金面上项目、青年项目、国防基础科研项目、国家高分遥感项目等6项。顶会程序委员。报告题目： Crowdverse: 大模型驱动的群体具身智能训练场报告简介：在人工智能与机器人技术深度融合的今天，具身智能体已突破单一任务执行的局限，展现出物理空间感知、多模态协同决策、集群自组织演化的复合系统能力。随着群体具身智能技术在多场景中的落地需求激增，亟需一种能够整合各种应用和算法的低成本的统一平台。报告人研究的Crowdverse训练场，旨在探索大模型与群体具身智能的深度融合，构建可模拟、训练和优化多智能体协作的系统化平台。Crowdverse包含高保真场景构建与群智更新能力、智能化任务理解与动态调度能力以及多智能体高效协同通信与自适应优化能力。通过将真实群智环境投射到虚拟群智模拟环境，利用大模型进行感知决策与模拟调度，调动场景中的智能设备执行群智任务，并利用模拟结果反馈现实，实现了开放现实系统的智能治理。

嘉宾简介

刘勇

浙江大学

简介：
浙江大学控制科学与工程学院教授，浙江大学控制学院智能驾驶与未来交通中心主任，浙江大学-天数智芯先进智能计算联合研发中心主任，浙江大学先进智能系统研究中心副主任，浙江大学控制科学与工程学院党委委员，浙江省机器换人专家。获浙江省自然科学一等奖、浙江省科学技术一等奖、浙江省科学技术进步一等奖、浙江省知识产权专利奖一等奖、浙江省自然科学学术二等奖、浙江省杰出青年科学基金项目，入选中组部万人计划青年拔尖人才、浙江省有突出贡献青年科技人才、2022年杭州市钱江特聘专家和浙江省151人才项目。主要研究方向为自主机器人与智能系统、机器人自主规划与导航控制、视觉识别与模式识别、SLAM技术及多传感器融合技术。

报告题目： 从人工智能到具身智能

报告摘要：

具身智能在多个领域具有应用潜力，包括工业制造、自动驾驶、物流运输、家庭服务、医疗康养等。本报告将简要介绍从人工智能热潮发展到具身智能的历史过程，并简要介绍具身智能的主要要素和实现途径。

刘偲

北京航空航天大学

简介：
北京航空航天大学人工智能学院副院长，教授,博士生导师，中国图象图形学学会理事、副秘书长。曾获获国家科技进步二等奖，中国图象图形学学会自然科学奖一等奖。国家自然科学基金优秀青年基金获得者，主持企业创新发展联合基金重点支持项目等多个项目，担任科技创新2030-重大项目课题负责人。主要从事具身智能与多模态内容理解的研究工作，发表CCF-A类论文100余篇，Google Scholar引用17000次。

报告题目： 大模型时代的无人机视觉语言导航

报告摘要：

近年来，对大语言模型的不断探索为增强具身智能决策的可解释性和可控性开辟了新的途径。然而，基于大模型的规划器仍然面临着重大挑战，包括大量的资源消耗和极长的推理时间，这对实际部署构成了重大障碍。鉴于这些挑战，本次报告介绍了异步大模型增强闭环决策框架，解耦了大模型和小模型规划器的推理过程。分别在无人机视觉语言导航与自动驾驶场景进行了验证，取得了优异的导航性能。

赵恒爽

香港大学

简介：
香港大学计算机科学系助理教授，国家优秀青年基金获得者。曾在麻省理工学院和牛津大学担任博士后研究员。研究兴趣涵盖计算机视觉、机器学习和人工智能等广泛领域，特别着重于构建智能视觉系统。在CVPR、NeurlPS和TPAMI等顶级会议和期刊上发表论文100余篇，研究成果被引约40,000余次，其中单篇一作论文被引超17,000次，五篇一作论文被引超1,000次。他曾获得过多次国际学术竞赛的冠军，世界人工智能大会明日之星奖和青年优秀论文奖，CVPR最佳演示荣誉奖，被Al 2000评为计算机视觉领域最具影响力的学者之一，被斯坦福大学列为世界前2%终身影响。

报告题目： 空间智能视觉基础模型 (Vision Foundation Models with Spatial Intelligence)

报告简介：

随着深度学习模型能力的增强以及海量数据的高效获取和利用，大规模视觉基础模型的构建得到了广泛关注。这些视觉基础模型在处理跨领域的复杂视觉场景任务中表现出强大的泛化能力。然而，它们通常专注于图像和视频的理解，而忽略了对具有关键空间属性的高维视觉场景的理解能力。为了解决这些局限性，我们着重探索在2.5维和3维等更高维度上开发具有空间智能的视觉基础模型。本次报告将介绍我们近期一系列关于赋予视觉基础模型空间智能的研究成果，以及它们在诸多重要下游场景如自动驾驶和具身智能等的应用，并探讨视觉基础模型面临的一些挑战和未来前沿。

孙卓

西北工业大学

简介：
西北工业大学计算机学院教授、博士生导师，国家级青年人才。先后于西北工业大学和新南威尔士大学获得工学学士、硕士和哲学博士学位。2019年4月至2021年4月在澳洲国立大学担任博士后研究员。主要从事多智能体通信网络、任务驱动语义通信等领域的研究工作，主持/参与国家自然科学基金青年项目等国家级项目3项。在IEEEJSAC、TMC、Communication Magazine、Ubicomp等国际学术期刊会议发表论文30余篇。曾获2022 EAI Perva-siveHealth最佳论文奖和2024年《航空学报》最具传播力文章奖。

报告题目： 感通策协同的多具身智能体网络初探

报告简介：

随着越来越多的无人机、机器狗等具身智能体出现，多具身智能体通过网络连接并协同完成未知环境探索、协同导航等任务。在此过程中，多具身智能体将迭代执行时序动态耦合的感知、通信和决策过程，直至任务完成。同时，不同于现有蜂窝网，多具身智能体网络以任务完成性能为目标，具备自主决策且演进通信行为的能力。因此，设计感通策协同的多具身智能体网络成为实现多具身智能体协同的关键技术之一。为此，本报告将提出感通策协同的多具身智能体网络组成框架、特点及其初探研究。

陈龙彪

厦门大学

简介：
厦门大学信息学院副教授、博导，国家级海外高层次人才、厦门大学南强青年拔尖人才。主要研究方向为群体智能、具身智能、空间计算、普适计算。连续两次以第一作者获得CCF-A类会议UbiComp最佳论文提名奖(国内高校首次),荣获2022年度ACM SIGSPATIAL中国分会新星奖(年度全国唯一)。累计发表论文70余篇，含中国计算机学会A类论文14篇(一作及通讯),授权发明专利20余项，主持国家自然科学基金面上项目、青年项目、国防基础科研项目、国家高分遥感项目等6项。顶会程序委员。

报告题目： Crowdverse: 大模型驱动的群体具身智能训练场

报告简介：

在人工智能与机器人技术深度融合的今天，具身智能体已突破单一任务执行的局限，展现出物理空间感知、多模态协同决策、集群自组织演化的复合系统能力。随着群体具身智能技术在多场景中的落地需求激增，亟需一种能够整合各种应用和算法的低成本的统一平台。报告人研究的Crowdverse训练场，旨在探索大模型与群体具身智能的深度融合，构建可模拟、训练和优化多智能体协作的系统化平台。Crowdverse包含高保真场景构建与群智更新能力、智能化任务理解与动态调度能力以及多智能体高效协同通信与自适应优化能力。通过将真实群智环境投射到虚拟群智模拟环境，利用大模型进行感知决策与模拟调度，调动场景中的智能设备执行群智任务，并利用模拟结果反馈现实，实现了开放现实系统的智能治理。

泛在具身智能8月22日（星期五）15：30-17：30地点: 三楼广州厅

泛在具身智能
8月22日（星期五）15：30-17：30
地点: 三楼广州厅