分论坛 > 深圳 > 新闻动态
CCF YEF 2025专题分论坛 《抽丝剥茧:求索大模型后训练时代的深度推理》圆满落幕
2025-06-09 阅读量:41 小字

2025年5月25日,中国计算机学会青年精英大会 (CCF YEF 2025)专题分论坛 《抽丝剥茧:求索大模型后训练时代的深度推理》在深圳启幕。论坛由CCF主办,CCF YOCSEF 深圳承办,华为诺亚方舟实验室、中科曙光等多家创新主体参与。论坛聚焦大模型深度推理领域的前沿议题与技术创新,旨在探讨高效推理引擎构建、认知智能边界拓展、软硬协同生态培育等方向,共同探索大模型深度推理技术的发展路径。本次论坛由哈尔滨工业大学(深圳)教授陈科海与中山大学教授任文琦共同担任执行主席。国防科技大学教授刘新旺、同济大学教授赵生捷、西湖大学教授张岳、华为诺亚方舟实验室研究员曾幸山、中科曙光总裁助理兼智能计算产品事业部总经理杜夏威等专家担任引导嘉宾。

论坛吸引了来自大模型基础研究、高效推理算法、软硬协同架构、高质量数据工程、工具链开发、产业应用落地等领域的多名顶尖专家学者与行业领袖,围绕高效推理引擎创新、知识协同推理机制、因果性与泛化性提升路径、工具赋能与潜能激发、国产算力生态构建等前沿技术热点,以及深度推理核心突破点、算法/数据标注贡献度分析、深度思考与内容输出平衡路径等关键议题展开深入探讨。

论坛开始,陈科海教授首先阐述了大模型后训练时代的核心定义及其重要性。他强调,后训练时代标志着通过推理模型进行大模型训练与优化的新阶段,而推理模型以其开源、高性价比等显著优势,正成为大规模模型训练的关键路径。随后,来自学术界和产业界的特邀专家分别围绕大模型后训练时代的发展现状与未来趋势展开了专题报告。

图片1

同济大学教授赵生捷在报告中指出,当前大模型高效推理面临延迟、资源与质量的“三维失衡”困境,表现为高成本、高时延、执行路径偏差与资源错配等核心瓶颈。他提出亟需构建“数据-算法-系统”协同优化技术体系,通过发展数据蒸馏、轻量微调及异构硬件适配三大关键优化技术,研制智能推理引擎,旨在突破效率瓶颈,提升复杂任务推理效能与硬件利用效率,最终推动智慧城市灾害预警、工业制造参数优化等关键场景的实时应用,并构建行业标准与评估范式。

图片2

国防科技大学教授刘新旺在报告中指出,当前知识推理技术面临逻辑深度不足、响应效率受限及路径依赖显著等核心挑战,具体表现为小模型推理浅层化、大模型时延过高、过度依赖统计共现等瓶颈问题。他提出亟需构建大小模型协同推理技术体系,通过发展自适应思考机制、跳跃式推理加速、图谱知识优化等关键技术,突破动态推理模式选择、核心逻辑跳转加速与负样本上下文构建等技术瓶颈,研制面向军事决策、医疗诊断等复杂场景的知识推理平台。该研究旨在通过大小模型的深度知识协同,实现推理效率与精度的双重突破,推动智能化决策系统在资源受限场景的规模化落地应用。

图片3

西湖大学教授张岳在报告中指出,当前大模型逻辑推理面临因果性薄弱与泛化性不足的双重挑战,表现为易被语言表面模式干扰、分布外场景性能锐减、虚假关联阻碍因果特征提取等核心问题。他提出亟需构建因果增强的推理技术体系,通过发展反事实数据增强、动态语义干预、混合策略强化学习等关键技术,突破虚假模式解耦、关键注意力修正与离策略轨迹优化等技术瓶颈,研制面向数学推理、复杂决策等多场景的鲁棒推理框架。该研究借助反事实训练强化因果关联、混合策略平衡探索稳定性,成功实现了数学推理准确率的大幅提升,并在分布外任务中保持超过90%的泛化保持率。未来将围绕因果框架设计、多模态逻辑迁移及轻量化引擎开发持续突破,推动大模型在科学计算、战略推演等复杂场景的可靠应用。

图片4

华为诺亚方舟实验室研究员曾幸山在报告中指出,当前大模型工具协同推理面临显著的“能说不会做”实践瓶颈,具体表现为工具迭代泛化性差、多步需求处理效率低、数据质量与系统通用性难以兼顾等核心挑战。他提出亟需构建系统性工具协同推理技术体系,通过发展工具语义动态进化框架(ToolACE)、自然对话交互优化(ToolFlow)及自适应潜能激发机制(ToolACE-R)三大关键技术,突破API语义树构建、工具关联图动态规划与能力感知迭代训练等技术瓶颈,研制面向复杂多轮协作的实用化Agent系统。未来将围绕多轮思考时延压缩、推理与行动深度耦合等方向持续攻关,旨在推动大模型从对话交互向自主决策升级演进,为构建工业控制、智能服务等领域的完整Agent生态提供核心技术支撑。

图片5

中科曙光研究员陈伯龙指出,当前大模型产业面临场景适配模糊、算力成本高企、专业人才短缺及数据安全风险等核心挑战。为此,构建软硬协同的国产算力生态,通过四维技术体系实现模型压缩优化与低代码开发,突破FP8混合精度训练及分布式调度技术,推动推理成本下降。未来将深化通算融合架构与开源工具链建设,赋能千行百业智能化转型,引领国产算力生态标准化发展。

图片6

论坛接下来进入思辨环节,与会嘉宾围绕着“大模型后训练时代深度推理的突破点是什么?”“深度推理源自于算法本身还是高质量数据标注?”“深度推理重在深度思考还是内容输出?”展开激烈的讨论。

哈尔滨工业大学(深圳)教授周逊围绕"大模型后训练时代推理的突破点"展开深度思辨。他深刻剖析了当前推理能力跃升的核心路径,强调突破点集中于知识增强、数据融合、可信保障与协同演进四大方向的系统整合与创新。周逊指出,知识增强推理的关键在于精准识别模型知识图谱的薄弱环节并进行针对性嵌入;数据与大模型的深度融合应聚焦于探索大数据在复杂场景下的辅助作用及模型自身数据利用效率的提升;可信推理是保障模型决策可靠性的基石;而大小模型的协同旨在综合发挥小模型的灵活性优势与大模型的泛化能力,通过知识推理实现效能共振。他特别强调深度思考的核心价值,指出思维淬炼与表达锻造应形成"思考-表达-反馈-修正"的螺旋上升闭环,此乃现代认知视角下深度推理的本质体现。周逊通过大模型辅助学生作业的实例,引发了关于其对人类思维模式影响的深层思考,最终清晰勾勒出知识注入、数据驱动、可信增强、协同优化四大突破方向相互耦合、共同驱动的认知螺旋上升路径,为大模型深度推理能力的持续进化提供了前瞻性的思辨框架。

图片7

四川大学教授雷文强围绕思辨议题“大模型深度推理的能力源自算法还是高质量标注的数据”进行引导发言。他从研究学者的视角出发,深入剖析了深度推理能力的构建本质,指出其核心在于算法演进与高质量数据工程的深度协同与动态平衡。雷文强强调,模型的深度推理能力需在逻辑层面强化规则学习及其泛化性,算法优化对效果提升至关重要;同时,他更倾向于深度推理根植于广泛的常识知识积累,并着重指出高质量标注数据是不可或缺的基础,尤其在垂直领域应用中,需突破数据稀缺瓶颈,依靠数据融合与合成提升模型表现。他进一步探讨了深度推理的本质应是思维深度与表达有效性的统一体,其价值在两者动态平衡中得以体现,并警示当前以人类标准评判大模型思考正确性可能存在认知偏差。展望未来,雷文强提出需探索在算法与算力支持下加速深度思考的可行路径。他的发言系统性地勾勒了深度推理能力突破的三大方向:算法能力构建、高质量数据驱动以及思维表达的动态平衡,为理解这一核心能力的来源提供了清晰的分析框架。

图片8

深圳大学教授王毅围绕“深度推理重在深度思考还是内容输出”议题展开深刻思辨。他鲜明指出深度推理的本质在于深度思考与内容输出的辩证统一与共生共荣,缺一不可。王毅强调,深度思考是推理过程的核心引擎与根基,其内在的逻辑推演能力能够激发创造性洞见,为高质量输出提供不竭动力;而内容输出则是深度思考的外显化验证,其结果的有效性与准确性是对思考质量的关键评判依据,也为后续修正与完善提供了闭环反馈。他进一步阐释二者非孤立存在,而是形成紧密耦合的动态循环:深度思考为输出注入核心逻辑与创新灵感,内容输出则反过来验证、强化并指引思考的深化。从现实应用考量,用户视角聚焦于输出端成果的效用与体验;而学术研究则更关注思考过程的严谨性与内在逻辑链条。王毅特别援引现代认知科学成果,揭示了“思考外化”过程能显著激活大脑多区域协同并重构神经链接,从底层神经机制上佐证了深度推理中思考深化与输出表达的内在协同演进规律,最终深刻论证了二者一体两面、相互成就的共生关系。

图片9

本次论坛不仅梳理了大模型后训练时代的前沿技术格局,更凝练了实现知识推理、因果关联、工具协同与算力支撑“多维共振”的发展共识。论坛立足大湾区创新生态,以产学研深度协作为核心引擎,通过引导报告、专家报告与思辨讨论相结合的方式,从军事决策推理加速、医疗诊断路径优化、工业控制自主Agent构建、科学计算因果框架设计等多维度、多场景切入,深度探讨大小模型协同、软硬件深度适配等关键技术与效益平衡点。论坛有力链接学术界、产业界及科研机构力量,聚焦加速知识图谱优化、反事实训练、低精度量化等核心技术突破路径,致力于构建国产化推理技术标准体系,为大湾区乃至全国培育人工智能新质生产力提供全栈式技术支撑与实践方向。


图文|陈科海

编辑|王晶晶

审核|漆舒汉

热门动态
2022-08-25
2022年8月20日,中国计算机学会(CCF)青年计算机科技论坛(CCF ...
2022-08-16
   7月25日,由CCF主办、YOCSEF深圳承办,国家超级计算深圳中心...
2022-12-16
        2022年12月10日下午19:00-23:00,由中国计算机学会主办...
2022-11-17
2022年11月12日,中国计算机学会(CCF)青年计算机科技论坛(CCF...
2022-11-16
2022年11月12日上午,由中国计算机学会(CCF)主办,CCF青年计算...
2022-11-14
论坛掠影视频第37届中国计算机应用大会(CCF NCCA 2022)智慧医...
2022-08-18
近年来,人工智能快速发展、赋能千行百业,催生新技术、新产品、...
2019-08-29
2019年8月25日,YOCSEF广州分论坛、深圳分论坛在广州大学城中山...
2019-06-04
2019年6月2日,YOCSEF广州分论坛、深圳分论坛在广州大学城中山大...
CCF聚焦