终于,具身智能的“真机数据”难题有了新解法 (opens in new tab)
来源:深响作者|林之柏2026年,具身智能迎来新一轮空前热潮。春晚舞台上宇树“人机共武”、魔法原子“实景演出”相继出圈,荣耀“闪电”则在北京亦庄人形机器人半程马拉松刷新人类男子半马世界纪录,公众热情被一再点燃。资本侧同样反应积极,中国市场上估值超过100亿人民币的具身智能公司已超过20家。技术也在持续突破:从VLA到世界模型的迭代、到灵巧手的进展,具身智能逐步从Demo(演示)走向Deployment(实际部署)。但不得不说的是,热闹背后,一个核心难题始终横亘在行业面前:高质量真机数据极度匮乏。中国信通院报告明确指出,具身智能是一个“由数据驱动的智能系统”。对于具身智能而言,数据是决定行业发展上限的关键变量。如果缺乏高质量数据,机器人就无法实现精准操作和场景泛化。国家发改委相关新闻发言人也在最近的发布会上表示,下一步将加快具身智能训练基础设施建设,更好地支撑数据采集和“大小脑”模型训练,以提升具身智能在不同场景的通用能力。而且不同于大语言模型能规模化爬取文本数据,具身智能所需的描述人类运动、精细操作的真实数据少且难得。目前,全球文本数据早已达到万亿token级别,但高质量真机操作...
Read the original article