泛在具身智能
8月22日(星期五)15:30-17:30
地点: 三楼广州厅
| 嘉宾简介 | |
|---|---|
刘勇 浙江大学 |
简介:
报告题目: 从人工智能到具身智能
报告摘要: 具身智能在多个领域具有应用潜力,包括工业制造、自动驾驶、物流运输、家庭服务、医疗康养等。本报告将简要介绍从人工智能热潮发展到具身智能的历史过程,并简要介绍具身智能的主要要素和实现途径。 |
刘偲 北京航空航天大学 |
简介:
报告题目: 大模型时代的无人机视觉语言导航
报告摘要: 近年来,对大语言模型的不断探索为增强具身智能决策的可解释性和可控性开辟了新的途径。然而,基于大模型的规划器仍然面临着重大挑战,包括大量的资源消耗和极长的推理时间,这对实际部署构成了重大障碍。鉴于这些挑战,本次报告介绍了异步大模型增强闭环决策框架,解耦了大模型和小模型规划器的推理过程。分别在无人机视觉语言导航与自动驾驶场景进行了验证,取得了优异的导航性能。 |
赵恒爽 香港大学 |
简介:
报告题目: 空间智能视觉基础模型 (Vision Foundation Models with Spatial Intelligence)
报告简介: 随着深度学习模型能力的增强以及海量数据的高效获取和利用,大规模视觉基础模型的构建得到了广泛关注。这些视觉基础模型在处理跨领域的复杂视觉场景任务中表现出强大的泛化能力。然而,它们通常专注于图像和视频的理解,而忽略了对具有关键空间属性的高维视觉场景的理解能力。为了解决这些局限性,我们着重探索在2.5维和3维等更高维度上开发具有空间智能的视觉基础模型。本次报告将介绍我们近期一系列关于赋予视觉基础模型空间智能的研究成果,以及它们在诸多重要下游场景如自动驾驶和具身智能等的应用,并探讨视觉基础模型面临的一些挑战和未来前沿。 |
孙卓 西北工业大学 |
简介:
报告题目: 感通策协同的多具身智能体网络初探
报告简介: 随着越来越多的无人机、机器狗等具身智能体出现,多具身智能体通过网络连接并协同完成未知环境探索、协同导航等任务。在此过程中,多具身智能体将迭代执行时序动态耦合的感知、通信和决策过程,直至任务完成。同时,不同于现有蜂窝网,多具身智能体网络以任务完成性能为目标,具备自主决策且演进通信行为的能力。因此,设计感通策协同的多具身智能体网络成为实现多具身智能体协同的关键技术之一。为此,本报告将提出感通策协同的多具身智能体网络组成框架、特点及其初探研究。 |
陈龙彪 厦门大学 |
简介:
报告题目: Crowdverse: 大模型驱动的群体具身智能训练场
报告简介: 在人工智能与机器人技术深度融合的今天,具身智能体已突破单一任务执行的局限,展现出物理空间感知、多模态协同决策、集群自组织演化的复合系统能力。随着群体具身智能技术在多场景中的落地需求激增,亟需一种能够整合各种应用和算法的低成本的统一平台。报告人研究的Crowdverse训练场,旨在探索大模型与群体具身智能的深度融合,构建可模拟、训练和优化多智能体协作的系统化平台。Crowdverse包含高保真场景构建与群智更新能力、智能化任务理解与动态调度能力以及多智能体高效协同通信与自适应优化能力。通过将真实群智环境投射到虚拟群智模拟环境,利用大模型进行感知决策与模拟调度,调动场景中的智能设备执行群智任务,并利用模拟结果反馈现实,实现了开放现实系统的智能治理。 |