
现在,机器人不叫机器人,叫具身智能。
刚结束的北京世界机器人大会,这个词又被反复提起。展馆里,人形机器人能走、能跑,还能跳舞、打拳,与观众互动,看上去已经「有了身体」。
可这就意味着它们已经具身了吗?这个词怎么来的,又是什么意思?
具身是什么意思?
机器人界的具身智能(Embodied Intelligence)强调智能与身体的配合:通过「感知—行动—再校正」在物理世界中不断优化,不只是在计算机中计算。
具身与机器人高度绑定,就像语言与大模型绑定一样,但又不同于大模型那种只会字面回答、无法处理真实物体的智能。
那具身就是字面上的「有个身体」吗?李飞飞曾说,大模型没有身体,所以永远不能像人一样。那给大模型接上一个机器人,是不是就能让它像人?
先不急着回答这种把心智与肉身截然二分的逻辑。要理解它,我们得先回到具身这个词本身。

认知语言学中的具身
在认知语言学里,具身(embodiment)是核心概念1。学派创始人乔治·莱考夫认为,具身强调的是身体与世界的持续互动,而不仅仅是「具有」。
这个词和机器人领域的「具身」同源于embody,但中文翻译长期不统一,涉身、具身、亲身的、亲身化都有。分歧背后,是人们也在想如何去理解莱考夫的核心观点:「心智即肉身」。
具身不仅是「多了个身体」,而是说思维、推理、理解都扎根于身体经验、感知系统和神经结构。
莱考夫认为,心智与身体不可分割,这不仅是对笛卡尔身心二元论的批判,也是在强调:正因为我们有身体,才有与世界互动的方式,而这种互动塑造了更抽象的思维。很多时候,这些思维通过身体隐喻表现出来,只是太自然,以至于我们没察觉。
不易察觉的身体隐喻
这种「不能分开」在日常语言中随处可见,我们早已用身体经验组织和表达最抽象的想法。
比如「更多即向上」(More is up):倒水水面升高、堆物高度增加,这个简单的物理经验,被投射到数量和价格等抽象领域:「犯罪率在上升」「股票跌了下来」。

又如描述情绪:「心情沉重」「精神振奋」,是把情绪投射到身体重量和运动感受。它们不是修辞,而是思维方式的结构痕迹,背后都有身体感知的基础。
莱考夫强调,意义不是从符号的机械组合里冒出来的,而是从身体与世界的互动中生长出来。
这样看来,机器人大会的人形机器人即便能行走、搬运、跳舞、打拳,它们的「身体」并不承载这种意义生成的机制。
它们的感知与动作虽能被编排、被优化,却还谈不上有一个与人类相似的「具身心智」,因为那需要的不只是运动能力,还要有一套能把自身经验转化为概念,再用概念去塑造行为的循环。
具身其实非常反叛
具身不仅是技术用语,在认知语言学中,它带着强烈的反叛精神,直指西方哲学传统和强人工智能的核心假设。
反叛起源:颠覆西方哲学的「离身」
具身的反义词是离身(disembodied),它反抗的就是这个东西。
在西方思想史上,离身地位长期稳固:理性被设想为抽象、普遍、先验的存在,与肉体感知、文化情境、想象机制无关。
自笛卡尔确立身心二元论以来,心智被视作独立于身体「硬件」的「软件」。

在这套逻辑里,理解被看作一种机械操作:只是把符号转换成另一种符号。身体只是承载这种操作的容器,而理性则被认为可以独立于肉体存在。
反叛延伸:挑战心智计算理论
20 世纪的第一代认知科学继承了这种离身观,发展出「心智计算理论」:心智如计算机,思维是符号运算,符号本身无意义,只要按规则操作就等于理解。

在计算机中,所有信息的处理成本理论上应该是均等的,但人类认知明显不是这样运作的,比如此前介绍过的核型效应,心智计算理论无法解释为什么某些知识比其他知识更容易学习、记忆和使用。
第二代认知科学,如认知语言学,强调概念与理性强烈依赖于身体,以及概念化和推理的想象过程(隐喻、意象、转喻、核型、框架、心智空间和辐射状范畴)。
反叛极端:质疑强人工智能
心智计算理论的极端形式——强人工智能(Strong AI)认为,只要程序得当,计算机就能像人一样理解。大语言模型的奠基人辛顿,就是典型的强人工智能支持者,他认为大模型和人的思维方式一样。
哲学家约翰·塞尔在 1980 年提出「中文屋」实验反驳:一个不懂中文的人,依照规则操作中文符号,看似理解,实则毫无所知。计算机虽能处理符号,却无法赋予其意义,因为它没有身体和经验。
具身是要反对一切吗?
知道认知语言学的具身反对什么,就自然明白它坚持什么。
它并不全盘否定人工智能2,而是提醒我们:理性扎根于肉身,依赖感官、动作和环境互动;意义源自身体经验,而非符号与世界的简单映射;理解是一种生物性活动,离开身体及其与世界的循环,智能只是外在的模拟。

但这种坚持,确实触及了近现代英美分析哲学的根基:心智独立于肉体,理解就是符号运算。具身理论从根本上反对这种设想,认为意义与理性必须依赖身体经验和想象力的支撑。这不是能彼此包容的学派分歧,而是一种「有你没我」的对立。
具身理论对人工智能,反而是一种提醒。真正的挑战在于,如何让 AI 系统中的符号对人类有意义,而不仅仅是对 AI 研究者有意义。
就像计算机可以模拟水流,但这不代表河流本身受算法控制,也不代表计算机「理解」水流。具身理论呼吁 AI 研究超越纯粹的符号操作,从「心智如机器」的隐喻转向「心智是亲身的」现实。

这需要让 AI 的「理解」不能只是技术层面的精确操作,而要反映人类通过身体经验、感知和情感所内化的活生生的意义。
结语
伯牙智能 CEO 刘欣提到,很多机器人原本没有五指手,客户买些好看的手装上,只为跳舞时「看起来完整」。舞台上,一万元的手够用;生产中,第一分钟就宕机,不得不换上五万元的版本。
讽刺的是,在表演性的具身里,手是装饰;在真正的具身里,手是心智与世界的接口。前者满足观感,后者才触及莱考夫意义上的「心智即肉身」。
也许这就是答案:当我们问机器人是否真正具身时,关键不在于它们有没有身体,而在于这个身体是舞台上的道具,还是要让它产生意义。
本文首发「言辞之间」,同步少数派。
