当ChatGPT能写诗作画、AlphaFold破解蛋白质结构时,人类似乎已触摸到AGI的门槛。但宇树科技创始人王兴兴在IROS2025的宣言掷地有声:"具身智能若实现,离AGI已非常接近,甚至本就是AGI"。这一论断彻底颠覆了以认知能力为核心的AGI传统定义——物理世界的交互能力,或许才是通用智能的真正试金石。
王兴兴的AGI宣言:具身智能=通用智能?
王兴兴的论点直指AI发展史的认知盲区:现有AGI讨论过度聚焦"大脑"而忽视"身体"。他列举的场景极具说服力——从工厂流水线到星际采矿,AGI必须能在物理世界中完成人类所有生产性活动。这与传统弱AI/强AI划分形成鲜明对比:一个能通过图灵测试但无法拧螺丝的AI,算得上真正的通用智能吗?
宇树科技提出的"全场景任务能力"标准,将具身性列为AGI的必要条件。这解释了为何当前大语言模型仍被归为弱AI:它们缺乏将认知转化为物理行动的能力。王兴兴更预言,未来50年具身智能的实现概率远高于纯软件AGI,因为当今算力芯片已具备支撑条件。
技术突破的双面镜:算力充足 vs 算法滞后
硬件进展确实令人振奋。英伟达H100 GPU的千亿级参数处理能力,已能满足具身智能的实时计算需求。但王兴兴尖锐指出:机器人强化学习的ScalingLaw严重滞后。
具体表现为三大瓶颈:机械臂学习抓取需要数百万次试错,远高于NLP模型的训练效率;环境交互的物理延迟导致端到端训练难以收敛;缺乏类似Transformer的通用架构。对比ChatGPT通过数据规模实现能力涌现,机器人领域尚未找到可复制的规模化路径。
工业场景突围:宇树的具身智能实践路径
宇树科技的解决方案颇具启发性。其分布式服务器架构将训练负载分散到工厂本地,使机械臂控制延迟压缩至毫秒级。某汽车生产线案例显示,分布式训练使新技能迭代速度提升17倍。
这种工业优先策略揭示了一个可能的技术演进路线:AGI或将首先在标准化场景中诞生。工厂环境的高度可控性,能规避家庭场景的复杂不确定性。这也解释了为何王兴兴判断"工业AGI雏形可能早于消费级出现"。
技术链重构:具身智能催生的四大变革
具身智能的崛起将引发连锁反应。算法层面,离线批处理训练将被实时在线学习取代;硬件领域,传感器-芯片-执行器的集成设计将成为标配;评估体系面临颠覆,ImageNet式静态测试将被动态任务完成度替代;更深远的是,掌握物理交互能力的机器人公司,可能取代互联网巨头成为AI新霸主。
AGI黎明前的黑暗:我们该期待什么?
王兴兴的论断本质上是对智能本质的重新定义:真正的通用性必须包含物理世界的具身性。但这条路径同样存在隐忧,例如纯数据驱动能否理解重力、摩擦等物理常识。当机器人能完美叠衣服时,我们或许该追问:它理解"为什么衣服需要叠"吗?这最后一公里的距离,可能比想象中更漫长。
