终于，具身智能的“真机数据”难题有了新解法 (opens in new tab)

来源：深响作者｜林之柏2026年，具身智能迎来新一轮空前热潮。春晚舞台上宇树“人机共武”、魔法原子“实景演出”相继出圈，荣耀“闪电”则在北京亦庄人形机器人半程马拉松刷新人类男子半马世界纪录，公众热情被一再点燃。资本侧同样反应积极，中国市场上估值超过100亿人民币的具身智能公司已超过20家。技术也在持续突破：从VLA到世界模型的迭代、到灵巧手的进展，具身智能逐步从Demo（演示）走向Deployment（实际部署）。但不得不说的是，热闹背后，一个核心难题始终横亘在行业面前：高质量真机数据极度匮乏。中国信通院报告明确指出，具身智能是一个“由数据驱动的智能系统”。对于具身智能而言，数据是决定行业发展上限的关键变量。如果缺乏高质量数据，机器人就无法实现精准操作和场景泛化。国家发改委相关新闻发言人也在最近的发布会上表示，下一步将加快具身智能训练基础设施建设，更好地支撑数据采集和“大小脑”模型训练，以提升具身智能在不同场景的通用能力。而且不同于大语言模型能规模化爬取文本数据，具身智能所需的描述人类运动、精细操作的真实数据少且难得。目前，全球文本数据早已达到万亿token级别，但高质量真机操作...

Read the original article