
原标题:具身智能新突破!来自西工大!
你是否体验过
这种与生俱来的“超能力”?
第一次走进陌生校园或商场
无需刻意记忆
仅凭扫过几眼地标、走过几条路
大脑便能自动构建出清晰的空间轮廓
还能灵活绕开障碍,直达目的地
这种人类与动物习以为常的直觉
被称为“空间智能”
如何让机器人突破单纯的视觉识别
获得像人类一样理解物理世界
进行自主推理与行动的能力
一直是具身智能领域面对的终极难题之一
如今,西北工业大学
人机物融合智能计算团队
给出了全新答案
近日,西北工业大学计算机学院於志文教授、郭斌教授团队的综述论文《Bio-inspired Cognitive Navigation for Embodied Agents》被Nature子刊《Nature Reviews: Electrical Engineering》录用。
该工作所有作者均来自于西北工业大学人机物融合群智计算教育部重点实验室,郭斌教授与於志文教授为共同通讯作者。团队从动物导航的生物学机制出发,系统梳理了“认知导航”这一前沿领域,并创新性地提出了面向具身智能体的认知导航框架,该框架旨在赋予机器超越简单移动的能力,使其能像动物一样,在未知环境中理解空间、调用经验并做出灵活决策。
机器的“迷糊”:
困在数据里的导航员
很长一段时间里,机器人的导航方式显得有些“笨拙”,它们遵循“建图-定位-规划-控制”的固定流程,这种导航方式在仓储、巡检等高度结构化的“稳定”场景中尚能应付,一旦进入开放、动态、未知的真实世界,便会暴露出致命弱点。首先是泛化能力差,即环境发生改变,机器人便会因为地图对不上而瞬间“失智”;其次,为了维持高精度地图,机器人需要消耗巨大的算力和能源,耗能耗时、响应迟钝,易“犯迷糊”,难以走向复杂多变的真实世界。

从传统导航到类脑认知导航
而动物靠的是“认知地图”——一种会思考、会抽象、会预测的空间能力,简单来说就是“三不一新”:不记无关细节,只抓关键地标,保留高价值经验;不只看当下,还能预判下一步,遇到新环境,直接复用旧经验,一言概之,动物会认路,靠的不是记性好,而是会总结、会联想、会活用。
人机物融合智能计算团队受动物导航机制的启发,开启了仿生学探索,探索能否将动物在认路过程中表现出的地标识别、经验记忆和灵活决策能力进行系统性提炼与解构,进而转化为可学习、可计算的机器人导航框架。
给机器人装上“生物大脑”
“按图索骥”走不通,团队便从认知神经科学角度拆解动物导航机理,创新性提出一套类脑具身认知导航框架。简单来说,团队试图给机器人装上一个“生物大脑”,让它们不再依赖外部的地图数据,而是通过内部的认知机制来理解空间,即可在动态环境中实时感知、灵活避障,这一框架的关键,在于实现了从“被动执行”到“主动思考”的跨越,核心可概括为四个关键词——多模态感知、预测式表征、记忆复用、分层规划。

生物导航机制启发的机器人类脑认知导航框架。
多模态感知打破了传统机器人“只靠眼睛看”的局限,使其还能结合运动、姿态、环境信号,更精准地判断自己在环境中的状态,预测式表征不只知道“我在哪”,还能预判“前面会有什么”,提前做出反应,记忆复用解决了机器人在陌生环境中“水土不服”的问题,把经验变成可迁移知识,陌生场景也能快速适应,并且“举一反三”,分层规划则先定大方向,再走小步子。从此,机器人导航不再是“执行指令”,而是真正“带着思考走路”。
开启具身智能的新赛道
从“执行指令”到“灵活认路”,不仅仅是技术参数的优化,更是一场深刻的范式转移。长期以来,家庭养老陪护、矿井作业、仓储物流等复杂场景的共同特点是动态、未知且充满变数,一直是机器人技术落地的“最后一公里”难题。类脑具身导航框架的出现赋予了机器人像生物一样在未知与动态环境中自主感知、决策与行动的能力,成功打通了具身智能规模化应用的关键路径,使其真正具备了走进复杂真实世界的潜力,更标志着一条融合人工智能与神经科学的全新技术路线正在逐步展开。

从“按图索骥”到“灵活认路”
该研究依托人机物融合群智计算教育部重点实验室、智能感知与计算工信部重点实验室、陕西省嵌入式系统技术重点实验室,团队长期从事普适计算与群体智能、仿生类脑启发的具身智能等领域前沿研究。近年来获得教育部自然科学一等奖、陕西省科学技术一等奖等多项奖励,并获ACM Ubicomp、ACM SenSys等国际顶级会议最佳论文奖,并与多家企业、院所开展技术转化及应用。