第A01版:要闻

率先破题!无锡城市级具身智能数据集拿下3万小时订单

  6月11日,在2026长三角机器人及自动化展览会暨无锡具身智能机器人产业链伙伴大会上,无锡首度公布城市级全域“千企百万小时”具身智能高质量数据集联合体的第一阶段建设成果——目前,联合体行动已精准对接约10万小时的市场数据需求,已成功签订3万小时数据订单,累计签约核心客户20家。

  “算力定义边界,数据主宰未来。”穹彻智能联合创始人兼CEO卢策吾在会上的主题分享时表示,具身智能大模型跨越“实验室到工业落地”的鸿沟,关键在于高质量数据的规模化集聚。不同于互联网天然存在的语言数据,具身人类的物理数据起点几乎为零,是行业发展中极具战略价值的稀缺资源,而“群众采集”则是实现其规模化获取的必然路径。无锡的“千企百万小时”计划,正是在这一战略节点上的率先破局之举。

  今年5月,无锡正式启动“千企百万小时”具身智能高质量数据集联合体行动,由无锡数据集团子企业华智(无锡)人工智能科技有限公司作为市级牵头单位联合产业链上下游企业共同推进,旨在全市域范围内实现全场景与全原子技能的广泛覆盖,为具身智能基座模型注入丰富、真实且高价值的“工业燃料”,打造以工业为特色、向城市全域覆盖的数据版图。项目严格遵循“真实场景、真实设备、真人操作”的“三真”原则。

  无锡数据集团在深耕行业的过程中,首创提出了“具身数据光谱”概念,为工业数据的价值深度重构了技术边界。这一理念构建起一套从硬件感知到数据沉淀的完整链路,通过“设备光谱”实现从低成本便携端到高精度真机的全域覆盖,不仅打破了传统数采对昂贵硬件的依赖,更依托“数采光谱”验证开启了社会化大规模采集的可行路径。

  在贝斯特涡轮增压器装配产线、新日电动车组装车间等实地场景中,一批轻量化、非侵入式的采集设备,正将资深技术工人碎片化的工业经验精准转化为“类人逻辑”语料。这种“无本体”数采模式可在不影响企业生产节拍的前提下,实现单日百GB级高质量数据的精准捕捉。

  “采集阶段成果远超预期。”卢策吾表示,人工智能发展至今,数据采集已经演变成一种类似公共基础设施工程的技术内容,“企业级”数采向“城市级”迈进是必然,无锡创新开放、产业强市的基因让这里成为“城市级”数采工程落地的首选地。这些采集得到的高质量数据将成为工业时代的“原油”,基座模型则是“炼油厂”;两者结合,向产业持续输出、计量并产出的,将是可循环变现的新质“Token业务”。

  无锡是数据富集高地,同时也是全国八大智算云服务节点之一。“十四五”时期,我市深入推进数据要素市场化配置改革,在全国首创“1+8+X”数据要素市场建设模式,(下转第3版)

  率先破题!无锡城市级具身智能数据集拿下3万小时订单

  (上接第1版)建立覆盖数据采集交易全环节的标准体系,争创国家和省级数据标注基地,探索数据出境便利化机制,并在全省率先开展企业数据资源披露,绘制数据产业图谱。截至去年,全市数据开放水平连续五年全省第一、全国前十,连续三年入围全球智慧城市“城市大奖”。去年,无锡全域纳入国家要素市场化配置综合改革试点。

  去年5月,无锡印发《无锡市促进数据产业高质量发展实施方案(2025—2027年)》,计划到2027年,建成高质量数据集300个。今年4月,华智(无锡)人工智能科技牵头申报的“具身智能行业基于无本体数据采集的柔性生产高质量数据集建设项目成果”入选省工业和信息化领域行业高质量数据集建设先行先试联合体及项目名单。

  “由头部厂商与本土产业深度协同而成的‘无锡范式’,为全球及国内具身智能行业提供了一个极具参考价值的实践范本。”卢策吾评价。无锡数据集团相关负责人透露,预计到2026年9月底,该计划将突破1000个数据采集场景,常态化数据采集人员规模将超千人。一个以城市为核心单元的具身智能数据规模化采集体系正在无锡加速成形,为我国制造业的AI具身化转型筑牢坚实的数据底座。

  “十五五”时期,我市将深化数字无锡建设,培育特色数据要素市场,构建数据安全治理体系,打造数据产业集聚区、人工智能数据标注先导区,努力成为开放、共享、安全的中国无锡“数码头”。

  (韩依纯)