曹吉胤:在汉开办“机器人幼儿园”

长江日报 2026年06月08日

    人形机器人正在学习端咖啡。

    武汉工程大学副教授曹吉胤。

    训练师头戴VR眼镜进行数据采集。

    长江日报记者陈晓彤 摄

    训练师在模拟超市收银场景中,佩戴EGO训练机进行第一视角数据采集。

    长江日报记者陈晓彤 摄

    □ 长江日报记者陈晓彤

    深耕人形机器人领域,武汉工程大学副教授曹吉胤在光谷打造了一家特别的“机器人幼儿园”。他带着一群“00后”机器人“幼师”,从零开始教机器人叠衣、取物、商超作业等生活化技能。这些动作看似简单,教起来却并不容易,人类随手就能完成的日常动作,需要耗费数十小时甚至数月反复调试、采集数据。

    针对全球具身智能海量数据缺口痛点,曹吉胤团队开发出一站式采标平台,打通数据采集、标注、核验全链条,大幅提升优质动作数据产出效率。依托平台产出的机器人动作数据,已成为行业刚需硬通货,持续为国内头部机器人企业供货。他怀揣愿景,以海量数据赋能人形机器人落地,推动智能机器人走出实验室,走进千家万户与各类产业场景。

    ■ 各地人形机器人来汉“入园求学”

    走进湖北人形机器人创新中心(以下简称创新中心)训练场,就像闯入一家“机器人幼儿园”。3100平方米的空间里,涵盖家居、超市、酒店、工业流水线、实验室等30多个高仿真场景,构成了机器人专属的“课堂”。

    在这里,数聚变(武汉)科技有限公司(以下简称数聚变)创始人曹吉胤担任“班主任”,100多位年轻训练师则化身“启蒙老师”,手把手教机器人学习扫地、叠衣服、拿瓜果等人类生活技能。

    数聚变采集中心负责人杨心怡介绍,“幼儿园”目前有100多名机器人“学生”,不仅有武汉本地的,还有来自北京、上海的。刚入学时,它们对人类世界一无所知,需要训练师带着它们一遍遍认识并学习人类社会的场景和规则。

    对人类而言轻而易举的动作,对机器人来说却充满挑战。现场,一台机器人正在学习拿水果。桌子上摆放着苹果、香蕉、橙子、芒果等十多种水果模型,杨心怡要带着它逐一练习。

    以“拿水果”为例,机器人无法像人类孩童那样举一反三。面对桌上十几种不同大小、形状和重量的水果,训练师必须变换不同角度与力度逐一教学,仅这一个简单任务,就需要耗费三四十个小时进行数据采集。

    像叠衣服这样的“高阶”动作,更是需要训练三四个月。“衣服可能是揉成一团,也可能是左右折叠,我们要将不同情况、不同步骤逐一拆解,甚至现场光线的变化都会对机器人的应对产生影响。”杨心怡说,“带机器人比带孩子更辛苦,我们需要极大的耐心克服重复训练的枯燥,但每天看着自己带的‘孩子’一点点进步与成长,很有成就感。”  

    ■ 机器人也能“上网课”

    在创新中心的毕业展示区,一批“好学生”正在展示学习成果。

    一台人形机器人用灵巧的五指夹取矿泉水,只见它微调夹持力度、平稳抬举移位,将矿泉水精准归置货架空位。另一台则单手握杯对准咖啡机出液口,另一臂触控面板研磨咖啡豆,定量萃取咖啡后缓步递送至访客面前。还有机器人在展示叠衣服、写毛笔字、整理货架等动作。

    达到什么标准能“毕业”?曹吉胤介绍,企业会指定训练场景和技能,训练师根据订单要求进行教学,每个技能都需要成百上千个小时的训练和视频录制。采集完成后,由工作人员将动作画面进行筛选和切分,并将“抬右手、抓取水果、放下水果”等动作步骤,“翻译”成机器人能读懂的语言数据。

    “一组高质量数据需要经过采集、清洗、标注、审核等步骤,我们将高质量数据输入机器人‘大脑’,若它们能精准完成动作,就等于学会了。”曹吉胤说,对于同厂商、同系统的机器人,企业只用“派一个代表”来学,产出的高质量数据可直接“喂给”其他同类机器人。

    最近,创新中心还开起了“网课”。在模拟超市,训练师张嘉头戴VR眼镜,动作缓慢地将收银台上的巧克力拿起、扫码、放下,再拿起一袋饼干,扫码、再放下。

    “这是最新的第一视角EGO训练机,完全由人来完成动作,机器人无需到场,采集的数据经过处理后,可直接‘喂’给机器人。”曹吉胤介绍,真机模式即使24小时不停地采集,一年也只能产出几千小时的数据,但事实上,一天能采集5个小时数据已不容易。而EGO训练机对环境要求低,训练师可在真实的社会场景中实现数据采集,成本仅为真机模式的三分之一。

    ■ 机器人训练数据“变现”卖出国内第一单

    曹吉胤坦言,人形机器人从实验室走向家庭、工厂、养老院,真正实现“会干活”,还有一段距离。

    目前,全球具身智能领域正面临严重数据缺口。据了解,训练一台通用人形机器人至少需要1000万小时高质量数据,而全球现有数据仅几十万小时,缺口超过95%。

    今年3月,创新中心硬件进一步升级。曹吉胤团队自研“多源异构具身采标平台”上线,覆盖从数据采集到数据处理、数据验证的完整链条,能快速产出高质量动作数据。

    “和人类学校的数智化教学平台类似,它能一站式完成机器人数据采集、清洗、标注、审核全流程,采集效率提高了一倍以上。最重要的是,该平台端口开放,不同厂商和系统的机器人都有适配的数据系统,可招收的‘学生’范围更广了。”曹吉胤说。

    目前,高质量经验数据已成为人形机器人领域的“硬通货”,而创新中心年采集数据能力超千万条,今年年初,智元创新(上海)科技股份有限公司与创新中心签署数据服务协议,这是国内首单企业间人形机器人训练数据交易,创新中心向智元创新售出数千小时的人形机器人训练数据,售出数据从23个仿真场景中采集,包含抓盘子、拿杯子、叠被子等诸多动作。

    “未来某一天,你家的机器人能熟练地叠好衣服、端稳水杯、贴心照顾老人,工厂里的机器人能精准分拣零件、高效完成工序,它可能就是从我们学校毕业的好学生。”曹吉胤说。