数据才是硬通货

长江日报 2026年06月08日

    过去几年,人形机器人热度不减。人们关注的焦点集中在芯片算力、电机扭矩、灵巧手指等硬件维度。但造一个机器人容易,教会它干活并融入人类生活,才是真正的难题。瓶颈不在硬件,在数据。

    6月1日,宇树科技IPO过会,同日英伟达宣布与宇树合作,共同开发下一代人形机器人。英伟达的创始人兼首席执行官黄仁勋直言,数据是最难解决的问题。他还预测,物理AI可能发展成数十万亿美元的市场。但数据从何而来?

    随着硬件加速标准化、开源化,真正的壁垒已从“造出来”转向“教会它干活”。湖北人形机器人创新中心首席运营官刘传厚判断,机器人进入家庭至少还需10年,国内外同行普遍面临高质量动作数据匮乏的发展瓶颈。业内人士测算,训练具备泛化能力的具身模型至少需要千万小时量级的高质量数据,而目前行业可获得的数据规模仅几十万小时,缺口巨大。

    放眼国内,人形机器人产业正从硬件竞赛转入数据竞赛。北京、上海、深圳纷纷布局数据采集中心,武汉率先将数据做成一门可交易的生意。武汉工程大学副教授曹吉胤在光谷开设的“机器人幼儿园”,训练师手把手教机器人叠衣服、端咖啡,把人类经验转化为高质量数据并进行交易。

    值得注意的是,数据采集只是第一步,如何规模化生成训练数据才是关键。大语言模型的数据可取自互联网,自动驾驶的数据可来自道路采集,而机器人需要的是包含动作、接触、受力、空间关系的物理交互数据,这是一类前所未有的数据形态,单靠真实世界采集远不足以满足需求。仿真合成数据提供了一条可行路径:将人类经验放入可控、可复现的虚拟物理环境中,规模化生成训练数据。

    人形机器人产业的进步,不能只靠硬件层面的迭代。当硬件门槛持续降低,数据正成为驱动智能升级的重要一环。正如光轮智能联合创始人杨海波所判断,2026年正在成为具身智能“数据规模化元年”。光谷的“机器人幼儿园”是一个生动的注脚,人类经验成为教材,数据采集成为启蒙教育,将看不见的人类经验转化为可交易、可复制的数字资产。武汉的这一尝试,值得期待。

    (长江日报记者陈智)

    统筹:陈智  制图:陈昌