CCF YOCSEF苏州技术论坛:
通用具身智能机器人下工厂,距离还有多远?
2025年被广泛称为“具身智能机器人量产元年”,多家人形机器人企业实现了上千台机器人的量产交付,仿佛机器人走进工业走进家庭已经近在咫尺。而另一方面,除了时常出现的机器人工作与服务的展示视频,真正能让机器人在工厂中长时间稳定可靠地运转起来,整个行业都鲜有成功案例,这其中既有机器人本体的技术难题亟待攻克,也有模型算法方面的能力缺失。想让具身智能机器人更快更好地实现场景应用,行业究竟应该在哪些方面发力?是一个亟待讨论的问题。
因此,2026年1月17日,由中国计算机学会(CCF)主办、CCF YOCSEF苏州学术委员会组织的技术论坛在CCF业务总部成功举行。论坛以“通用具身智能机器人下工厂,距离还有多远?”(CCF-Yo-25-140)为题,汇聚来自机器人本体厂商、制造业场景需求厂商、工业自动化服务企业、机器人硬件与模型算法相关学术研究机构,以及产业政策制定者等多方代表,围绕工业场景需求、机器人形态选择及产学研协同机制等核心议题展开深度思辨。本次论坛由YOCSEF苏州副主席晁平复(苏州大学副教授)与候任AC委员张午阳(中国科学技术大学特任教授)共同担任执行主席。
图1 论坛与会嘉宾合影
一、引导发言:从硬件、系统与模型的维度丈量工业应用的距离
李治军:工业场景需要“对物理世界有本质理解”的机器人
第一位引导发言嘉宾为哈尔滨工业大学二级教授、上海具识智能科技有限公司董事长李治军,他指出当前行业存在“概念模糊但落地迫切”的矛盾。他以“在工厂溜一圈谎报完成任务”的生动比喻,揭示出机器人缺乏对物理世界本质理解的现状——“它们连‘手里是否有东西’都无法判断”。
李治军认为,当前机器人技术面临三大核心挑战:感知精度不足(吸盘失效、物体定位偏差频发)、决策系统与工业场景脱节(大模型缺乏领域know-how)、执行机构可靠性差(机械爪开合故障)。他以Windows蓝屏类比技术迭代必经的不稳定期,强调技术成熟度与工业稳定性要求之间存在巨大落差。
基于30年系统论研究经验,李治军坚定主张“机理融合”的解决思路,反对纯端到端模型方案。他提出系统设计要遵循“机制与策略分离”的原则,强调信息论基础和容错设计的重要性——“单个部件粗糙但整体稳定”。他以俄罗斯飞机零件重组为例,说明复杂系统应追求整体稳定性而非零件的精密。
邓家俊:2025年是产业落地元年,但数据与泛化仍是瓶颈
第二位引导发言嘉宾为中国科学技术大学特任教授邓家俊,他从技术架构演进角度梳理了行业发展脉络。邓家俊指出,当前机器人技术正从模块化设计向大模型控制演进,直至端到端的VLA(视觉-语言-动作)模型阶段。以谷歌DeepMind的RT系列为代表,π0能灵巧完成已见任务,FAST能改进动作编码方法提升训练效率,π0.5能在全新环境理解并执行,π0.6能从真实交互中持续进化。最新成果如Helix已实现机器人10毫秒级的身体控制。
邓家俊同时介绍了世界模型的发展前景——通过预测未来状态来理解物理世界,可应用于驱动智能平台、模型验证和数据生成。但他指出,当前发展面临三大瓶颈:真实数据稀缺、泛化能力弱、安全与伦理挑战。他特别强调,工业具身智能虽产值不及家庭服务领域,但因场景固定性更可能成为深度智能的下一阶段目标。
图3 引导发言嘉宾——邓家俊
张大鹏:长三角人力成本倒逼机器人需求,但技术成熟度仍存差距
第三位引导发言嘉宾为乐聚机器人行业助理副总裁张大鹏先生。他指出2023年行业才真正起步,当前行业更倾向于数据驱动的解决方案,核心判断是“即使外观不完全像人,只要能完成复杂任务即可”。
他分析了长三角地区成为机器人研发热土的原因:产业集中度高但人力成本攀升,技术工人年成本达14-20万元,且90后独生子女政策加剧了劳动力缺口。与会嘉宾透露,当前工厂端项目验证面临末端适配问题,零配件销售成为瓶颈——如何让机器人具备人类般的灵活双手仍是难点。传感器领域尚处起步阶段,高危场景应用需求迫切。
张大鹏同时指出,当前行业技术突破显著,从实验室概念验证到量产成本已降低50%以上,资本正密集涌入。但他坦言,AI模型仍是当前行业瓶颈,现阶段推动场景应用更多的是有一种“教猴子盖房子”的无力感。
二、思辨讨论:深度探讨场景、技术与合作模式的可行路径与融合点
思辨一:工厂究竟需要怎样的具身智能?
工业场景被普遍视为具身智能2026年最可能的落地突破口,但真实需求是什么?
来自汽车零配件制造领域的代表分享了一线痛点:多品种零件的分拣与目视检查、物料最后一米的上料投放、机加工多机床的上下料、产线巡检中的目视与操作调试,以及高温、高空等不安全或限制空间场景。其中,高达90%的现有自动化方案在这些环节“折戟沉沙”。
另一位工业代表直言:“我们最需要的是能处理‘例外情况’的能力——比如袋装物料的抓取、衣服口袋位置的识别、异物检测,这些当前视觉系统根本无法完成。”他以汽车零配件质检举例:“客户对表面瑕疵零容忍,但自动检测需要多个机械臂配合360度摄像阵列,而人工只需要看一眼。”而这从模型技术上仍存在一定挑战。
来自服装制造领域的代表补充了另一类挑战:软包分拣需要“灵巧手”感知力度,退货检品需要视觉+触觉多模态感知。一位咖啡机器人创业者分享了实际运营数据:“机械臂制作一杯咖啡需要60-120秒,而人工只需要30秒。”他同时指出,移动服务机器人在高并发场景下的调度稳定性问题至今无解。
与会专家在讨论中提炼出关键分歧:学术界追求通用性,企业要的是性价比。有嘉宾犀利指出:“工厂最实用的设备是皮带机、滚轴和转换盘,不是看起来酷炫的人形机器人。”而对于能够最先产生落地机会的场景,与会嘉宾多次提到:(1)在工业流水线的上料与下料环节,涉及物料种类多变、涉及复杂的视觉检查与多变的动作等工业自动化难以处理的场景,是具身智能的机会;(2)面向大量的离散制造场景中的工人工位替代,且操作对于灵巧手灵活程度与精度要求不高的场合,有更早被具身智能攻克的可能。
思辨二:什么样的机器人形态更适合工业?
“端到端”还是“模块化”?人形还是非人形?这场讨论揭示了当前行业最深层的路线之争。
以特斯拉自动驾驶为代表的端到端方案引发了热烈讨论。支持者认为,数据驱动能够解决传统方法无法应对的长尾问题:“大模型出现能力跃迁的事实已经证明,堆数据可以带来质变。”一位算法专家表示,其团队在化学安全场景的实验中已验证端到端技术路径的可行性。
但反对声音同样强烈。李治军明确表达了对纯数据驱动方法的质疑:“‘在工厂溜一圈谎报完成任务’——这是当前机器人的真实写照。它们连‘手里是否有东西’都无法判断,缺乏对物理世界的本质理解。”他强调,感知精度不足、决策系统与工业场景脱节、执行机构可靠性差——这三大挑战都不是靠数据量能解决的。
李治军主张“机理融合”的路线:“Python代码融入模型能够显著提升效能,逻辑注入与知识表示才是本质路径。”他以盲人生活类比反馈机制的重要性,认为具身智能需要“像人类小脑那样实现快速条件反射”。
在形态选择上,与会嘉宾普遍认同现阶段“场景适配优先于形态模仿”。一位工业自动化专家直言:“短期内,AGV底盘+机械臂的组合最务实;长期来看,‘六条胳膊的机器人’不仅审美上令人不适,从功能效率看也未必合理。”他提出,机器人形态设计应基于任务需求,而非人类形态模仿,“未来自动化方向应超越人类生理限制,人类角色应定位在决策层而非执行层。”
值得注意的是,硬件成本成为制约技术落地的关键瓶颈。现有的6-7自由度机械手存在力度不足、触觉传感器性能差等问题,而高性能的27自由度机械手单台售价高达20万元。但嘉宾统一认为灵巧手是突破场景的重点硬件,同时触觉传感器为代表的具备执行反馈能力的硬件也是场景应用刚需。然而现状难以规避“硬件迭代还需要时间,但算法等不了那么久。”
思辨三:场景、本体与技术方如何形成合力?
产学研脱节是与会者共同关注的焦点问题。学术界与产业界存在巨大gap——数据、场景、算力资源分散,转化率严重不足。
多位来自产业界的代表指出了供需对接的结构性矛盾。“工厂管理者对AI技术的认知存在严重偏差——他们把具身智能简单等同于机器人,对大模型的能力有不切实际的幻想。”有嘉宾以“黑暗森林”形容当前产业对接的盲目状态,呼吁建立政府或行业牵线的对接平台。
外资制造企业的困境同样值得关注:“在华工厂面临空间限制和改造成本高的双重压力,数字化转型的物理条件受限。”而国内中小企业在ROI不明确的情况下,更缺乏开放场景的意愿和动力。
政府层面的推动被视为关键变量。论坛中提到,国家政策正推动场景开放从国家向地方逐级下沉,但企业参与意愿不足仍是痛点。有嘉宾建议政府牵头促成“百万级规模的场景开放”,认为这对头部大厂而言并非沉重负担,但能显著加速技术验证周期。
图5 思辨话题讨论环节
另一方面,从数据的开放角度,除了大量人力采集的数据,李治军提出人或机器人在真实场景中执行所生成的数据仍是一块待开发的矿藏。他强调,具身智能必须与物理世界互动才能产生真实价值,“实际操作产生的数据才是关键,正如大模型时代的数据源头互联网数据,其本质是人类活动的副产品,而非为AI训练专门生成。”
三、论坛总结
执行主席张午阳在总结中对本次论坛给予了积极评价。他指出,本次活动汇集了供需两侧的核心声音——既有来自制造业一线的真实痛点,也有算法与本体领域的前沿探索,更有政策制定者的视角补充,这种多元化的碰撞为后续聚焦工厂场景的软硬件方案奠定了良好的沟通基础。
张午阳强调,具身智能的工业落地不是一个纯技术问题,而是需要场景方、本体方、技术方乃至政策方共同参与的系统工程。他引用与会嘉宾的观点指出,当前最紧迫的任务是建立有效的供需对接机制——让技术提供者真正理解工厂需要什么,让应用场景愿意开放并参与验证。他呼吁,学术界与产业界应主动“双向奔赴”,而非相互等待。
执行主席晁平复在总结中对与会各方表示感谢,并指出此次论坛虽已触及核心问题,但距离真正落地仍有距离。他表示,后续将继续组织力量,围绕工厂场景的实际需求,在软硬件协同、行业标准建立、训练场开放共享等方向开展持续探索。
与会嘉宾普遍认为,具身智能下工厂不是一场颠覆式的革命,而是渐进式的进化。这场论坛汇聚的多元声音、碰撞出的思想火花,将成为推动这一进程的有益养分。
撰稿人:晁平复、张午阳
















