2025年11月16日,由中国计算机学会(CCF)主办、CCF YOCSEF深圳与深圳市计算机学会共同组织的《智控觉醒:端侧高效推理探索具身时代新路径》技术论坛在深圳市南山区深圳大学城国际会议中心顺利召开。论坛由CCF YOCSEF深圳AC主席漆舒汉与CCF YOCSEF深圳AC委员沈力共同担任执行主席,邀请了哈尔滨工业大学(深圳)医工学院院长教授、欧洲科学院院士刘洪海,哈尔滨工业大学(深圳)教授王轩,中山大学网安学院院长教授操晓春,南方科技大学研究员唐茗,中山大学副教授王可泽,香港中文大学(深圳)助理教授李镇,中山大学·深圳副教授岳晟,深智城集团AI算法高级研究员邹若奇等知名专家学者担任嘉宾。
本次论坛聚焦端侧大模型驱动的具身智能技术前沿,围绕开放场景下的技术突破与实践应用展开深入探讨。论坛吸引了来自斯坦德、智平方等知名企业以及鹏城实验室、光明实验室、深圳改革开放干部学院等科研机构的50余位代表参与,现场学术氛围浓厚,思想交流活跃,为推动我国具身智能领域的技术创新与开放场景落地注入了新的动力。
在论坛的开场环节,CCF YOCSEF深圳AC委员沈力介绍了论坛举办的背景与核心价值。他指出,随着大模型推理效率的快速提升,端侧独立运行的大模型技术为具身智能在开放场景下的实时时空认知与决策提供了全新路径,但如何构建一个通用的技术框架,使核心技术能随环境实时变化自适应决策,在推理质量、效率与功耗间找到最优解并实现高效端云协同,是当前行业面临的关键挑战。本次论坛以 “智控觉醒:端侧高效推理探索具身时代新路径” 为主题,正是希望汇聚学界业界智慧,探索面向开放场景、由端侧大模型驱动的具身智能决策框架,分享前沿解决方案,促进智能机器人与大模型技术的融合创新。
本次论坛邀请了四位国内具身智能与端侧计算领域知名专家作引导报告。哈尔滨工业大学(深圳)医工学院教授院长刘洪海带来题为《人体行为功能感控与智能系统》的报告。刘洪海首先回顾了自身研究历程的转变:从早期专注于机器人多手指抓取技术,到博士毕业后二十余年间逐渐转向人体行为功能变化研究。他指出,这一转变源于对机器人技术发展瓶颈的深刻认识——如何有效识别并将人的技能技巧转移到机器人上,是具身智能系统面临的核心挑战。他从脑科学、人体运动系统与神经系统机制、以及智能系统设计三个层面展开论述,强调理解人体行为的功能性感知与控制机制,需要深入探索大脑如何通过感知-整合-决策-行动的闭环实现自然交互。通过研究人体行为功能变化,不仅能够为康复医疗提供技术支撑,更重要的是为具身智能系统如何"学习"人类技能、如何实现类人的行为控制提供了理论依据和技术路径。这种从脑科学到具身智能的跨学科研究,为构建能够真正理解人类行为、实现自然交互的智能系统奠定了重要基础。
哈尔滨工业大学(深圳)计算机科学与技术学院教授王轩以《轻量化大模型驱动的智能手语机器人》为题作报告。王轩详细阐述了智能手语机器人的研发过程和技术细节,介绍了虚拟数字人、3D打印机器人和人形机器人三类实现路径,以及涵盖中国标准手语词库的手语库构建,通过"人体运动捕获-人体运动编辑-手语合成"三步流程,为机器人实现标准化手语交互提供数据支撑。他从具身智能在开放场景下的实时交互需求出发,指出智能手语机器人需要具备实时数据采集、处理和推理能力,以及高效的分布式计算和存储系统,但大模型的高算力需求与边缘设备有限资源存在矛盾,网络通信不稳定也无法满足具身智能交互的实时性要求。围绕该核心挑战,王轩系统介绍了团队在端边云协同框架、模型轻量化技术两大方向的研究成果。王轩指出,轻量化大模型驱动的智能手语机器人展现了端侧高效推理在具身智能应用中的巨大潜力,通过端云边协同架构与轻量化模型技术,为具身智能系统实现实时多模态感知和决策提供了重要技术支撑,为解决具身智能在开放场景下的实时性、算力与部署成本平衡问题提供了可产业化的技术方案。
南方科技大学计算机科学与工程系副教授唐茗带来了《端侧高效训练:分割协同与模块解耦优化方法》的报告。唐茗从边缘智能和网络计算的研究背景出发,深入探讨了端侧高效训练的技术革新与思路拓展,特别是分割协同与模块解耦的优化策略。她首先剖析了云端训练所面临的数据隐私保护、高昂成本及动态数据适应性等挑战,随后转向边缘训练的优势与局限,尤其是设备算力和内存资源的限制问题。针对这些挑战,她提出了两种创新的边缘训练解决方案:一是实施模型拆分策略,将模型的前几层部署于网络边缘以进行高效的数据抽象处理,而后半部分则依托云端的强大计算能力。二是采用无反向传播训练方法,通过正向梯度估计与模型更新过程的解耦,有效降低内存占用,实现训练效率的进一步提升。唐茗强调,端侧高效训练技术为具身智能系统在端侧设备上实现持续学习和优化提供了关键技术支撑,使得模型能够在端侧设备上实现自适应能力,为构建端云协同的具身智能系统、探索端侧高效推理在具身时代的新路径奠定了重要基础。
中山大学计算机学院副教授王可泽以《面向具身智能的多智能体协同推理》为题作报告。王可泽从视觉计算与推理的研究视角出发,深入分享了其关于面向具身智能的多智能体协同推理的最新研究进展。他明确指出,尽管大模型技术的迅猛发展极大地推动了多媒体处理能力的飞跃,但在空间理解、长程任务规划等关键领域,现有技术仍面临显著挑战与瓶颈。针对上述挑战,团队针对视觉场景透彻理解、鲁棒可信的推理问答以及思维链范式进行了扎实的研究。团队创新性地提出了融合人脑高效思维模式与多智能体协同工作框架的策略。在类脑认知方面,团队构建了模拟人脑双通道认知的类脑计算范式,通过快思维系统实现快速感知与操控,慢思维系统解决复杂规划与推理问题。在多智能体协同框架设计方面,团队构建了包括规划、执行、因果、反思、编程五大智能体的协同体系,为构建更加智能化的系统提供了新思路。王可泽指出,多智能体协同推理框架通过分工明确的智能体专业化协作与动态调整,有效提升了具身智能系统在复杂任务中的推理准确性和执行效率,展现了多智能体协同在端侧高效推理场景下的独特优势,为探索具身时代新路径提供了重要技术支撑。
紧接着,论坛进入了热烈而深入的思辨环节。与会专家围绕“智控觉醒:端侧高效推理探索具身时代新路径”主题展开三个思辨议题讨论。
香港中文大学(深圳)助理教授李镇率先聚焦“实现开放场景下具身智能实时决策,当前最核心的挑战是什么?”这一议题破题,他直指核心挑战集中在数据、算法与软硬件协同三方面。在数据层面,面临分布偏移和博弈场景数据缺失问题,需通过物理或端到端仿真器构建数据。在算法层面,具身智能范式尚未固定,需明确算法定义与评测标准。在软硬件协同方面,实时决策需云边结合,可通过小模型量化、蒸馏及国产芯片联动实现软硬件优化。
随后,中山大学网络空间安全学院副教授岳晟针对“构建高效可靠的端侧决策框架,需要突破哪些关键技术?”展开论述,他认为构建高效可靠端侧决策框架需突破三大核心技术方向。一是模型部署层面,要优化适配端侧的模型架构,探索结合场景与任务复杂度的自适应、动态模型压缩技术,应对设备异构性挑战。二是决策过程层面,需构建可高效复用、动态更新的任务级知识库,同时解决大模型缺乏主动探索及决策推理有效性验证的问题。三是策略演进层面,需实现软硬件协同的持续学习,同时具备遗忘非关键知识的能力,以高效利用少量、有噪声甚至负样本数据优化决策。
深智城AI算法专家邹若奇则围绕“该技术框架最有望在哪些场景率先落地?其端云协同的模式应如何设计?”发表观点,他围绕新技术应用场景与学习方式选择展开探讨。在学习方式上,他对大模型预训练与强化学习的选择提出疑问,认为人类的学习方式更接近强化学习,通过与环境交互实现知识迁移,而大模型的优秀泛化性源于预训练找到的模式,未来视觉或空间模型需权衡两种路径。在落地场景上,他认为人形机器人家庭落地难度大、周期长,更易落地的方式是让不同机器人承担单一简单任务,通过业务场景叠加实现复杂需求。在端云协同模式设计上,他提出群智协同与端边云分级部署方案,工业园区等局部环境中,端侧和边侧处理简单、高实时性任务,云端承接复杂、低实时性任务,正在探索动态混合精度、动态蒸馏剪枝及轻重查询分级等技术,推动智慧城市领域群智异构机器人协同落地。
之后,多位专家围绕开放场景下具身智能实时决策的核心挑战、端侧决策框架的关键技术突破、技术框架的落地场景与端云协同模式等维度补充讨论,交换见解。在核心挑战方面,专家们从产业实践、基础设施巡检、模型泛化性、数学建模等不同视角深入剖析,指出开放场景中存在大量未被关注的复杂变量,实时决策需应对极端实时需求与安全风险控制的双重约束,数据稀缺与模型可解释性不足是当前面临的主要瓶颈。在关键技术突破方面,专家们围绕模型架构与压缩技术、脉冲神经网络的低功耗优势、INT8量化与硬件适配、低精度训练与训推一体技术等路径展开探讨,指出端侧决策框架应坚持场景任务驱动,关键在于突破对端侧决策内在机理的分析与解释能力,这是保障可靠性的核心前提。在落地场景与端云协同方面,专家们结合企业实际部署场景,指出具身智能系统落地与推广的核心痛点在于维护成本高与场景迁移难度大,具身智能更易在封闭环境、对实时性要求不高且非持续决策的“工具人”场景落地,随着芯片性能提升,端侧大模型已能独立完成部分工作,在网络短暂中断时可脱离边缘节点自主运行,更适用于需日复一日重复同步操作的场景。大家一致认为,端侧高效推理在具身智能领域的应用不是简单的技术叠加,而是要实现数据、算法与软硬件的深度协同,静态知识与动态环境的有效衔接,端侧快速响应与云端深度理解的动态适配,未来具身智能研究需兼顾技术突破与安全可控,通过人工智能、计算机科学、工程技术等多领域的深度交叉协作,构建可靠、可解释、可扩展的端侧决策框架,让端侧高效推理更好地赋能具身智能在开放场景下的广泛应用,探索具身时代新路径。
最后,YOCSEF深圳主席漆舒汉对论坛进行了总结。他表示,端侧高效推理与具身智能的未来发展离不开跨学科深度协作,需要计算机科学、人工智能、脑科学、工程技术等多领域的共同努力。只有在科学研究与应用实践的双轮驱动下,才能真正推动端侧大模型与具身智能深度融合,探索具身时代新路径。论坛在热烈的掌声与学术交流中圆满落幕。
图文|漆舒汉 沈力
编辑|王晶晶
审核|漆舒汉














