CCF YOCSEF杭州举办特别论坛(技术论坛):从更大到更聪明:后Scaling时代的大模型续命之路
2026-02-06 阅读量:8 小字

2026年1月31日下午,由中国计算机学会(CCF)主办,中国计算机学会青年计算机科技论坛杭州分论坛(CCF YOCSEF杭州)组织的“从更大到更聪明:后Scaling时代的大模型续命之路”技术论坛(论坛编号:CCF-YO-25-168)在杭州市西湖区公元大厦成功举办。

1-全体

全体参会人员合影

本次论坛由YOCSEF杭州AC委员孙国道和温震宇共同担任执行主席。论坛邀请中国人民大学赵鑫、上海人工智能实验室王毅、西湖大学林涛担任引导嘉宾,浙江大学朱闽峰、行业专家陈政聿研究员、AI嘉宾杭小赛、杭小优担任特邀嘉宾。论坛汇聚了来自浙江大学、西湖大学、华东师范大学、西电杭研院、福州大学等高校学者和行业专家,以及吴伶(YOCSEF福州 候任主席)、祖建(YOCSEF长春 候任副主席)、阎维青(YOCSEF青岛 AC委员)、范林坤(YOCSEF郑州 委员)、袁鑫(YOCSEF武汉 候任学术秘书)、杨胜利(YOCSEF苏州 委员)等兄弟论坛嘉宾到场,累计超过60人参会。

本次论坛在组织形式上大胆创新,首次引入AI智能体作为特邀嘉宾与人类专家同台互动,对学术思辨展开新的尝试。这种“人机协同”的模式打破了传统论坛的思维边界,使讨论不再局限于传统问答形式,也更直观地呈现了人工智能从“辅助工具”走向“参与讨论”的应用形态,有助于提升技术交流的覆盖面与讨论深度。

论坛伊始,执行主席孙国道与温震宇代表主办方,向与会嘉宾致以热烈欢迎,详细阐释了CCF YOCSEF“承担社会责任、提升成员能力”的核心文化理念,同时介绍了本次论坛的选题初衷、核心研讨议题及议程。

执行主席特别强调,本次论坛之所以命名为“大模型续命之路”,是希望聚焦探讨(1) Scaling 还能带来多少真实能力、提升点在哪里? (2) Scaling的增长路径有哪些?(3)以及在当下阶段,中国大模型的技术体系与学术界应如何布局与突围。

2-孙国道主持3-温震宇主持

执行主席孙国道和温震宇作开场发言

 引导发言

引导发言环节,三位专家分别从AGI演进路径、多模态视频理解、模型高效优化三个核心维度,围绕后Scaling时代大模型的发展突破与实践路径展开分享。 

一、AGI 之路:大语言模型现状与未来

赵鑫系统阐述了大模型从“训练时扩展”转向“推理时扩展”的AGI进化之路。他指出当前预训练Scaling因高质量数据枯竭与边际效益递减而受阻,Transformer虽是强大的数据容器,但学习效率仍难以支撑更高级别的智能跃迁。他强调利用强化学习在数理、代码等可验证领域建立过程感知,使模型从依赖直觉的文本补全转向具备逻辑推演能力的深度推理。针对后Scaling时代的挑战,他强调需在架构、训练效率及环境建模上寻求突破。面对国内大模型发展的现实困境,赵鑫主张将人才培养视为首位,呼吁打破数据封锁并引导算力资源流向学术界,围绕慢思考与高效预训练等前瞻性科学问题进行持续探索。

4-赵鑫

赵鑫作引导发言

二、   InternVideo:通用视频理解大模型体系

王毅系统阐述了InternVideo通用视频理解大模型体系。他首先指出视频数据规模大,但利用率低的现状,认为视频理解正从动态感知向长时推理与具身交互演进。他介绍了团队通过渐进式多粒度视觉语义对齐的技术方案,并重点分享了针对长视频建模的分层压缩方法,实现了万帧级的精准信息检索。同时,其团队提出的任务偏好优化机制,有效解决了MLLM细粒度视觉理解难题,赋予模型在跟踪、分割等任务上的零样本能力。王毅总结道,后Scaling时代应从海量堆砌转向高质量多模态融合,通过迭代感知增强多模态推理,实现从单一表征向细粒度感知推理的深度进化。

5-王毅

王毅作引导发言

 三、   Scaling One-Step Diffusion Model: A Unified, Stable, and Efficient Framework

林涛在报告中系统阐述了One-Step Diffusion Model时代高效生成模型的设计路径,指出扩散模型推理步数带来的速度瓶颈已成为规模化落地的核心阻碍。他从“少步/一步为何不稳”这一痛点切入,提出 UCGM 统一连续生成框架,用统一代理目标把扩散、流匹配与一致性模型收拢到同一训练语言中,并引入一致性比例λ作为关键旋钮,平衡主生成目标与自对齐约束,避免少步训练被对齐项主导而失稳。围绕实际部署的效率需求,他进一步给出 UCGM-T 统一训练器与 UCGM-S 通用采样器的工具链,实现对不同推理预算的可控适配,并在减少 NFE 的同时保持甚至提升生成质量与稳定性。林涛认为,生成模型的“续命”关键在于用统一目标打通算法范式、用可控接口连接训练与推理,让高质量生成在更少步数、更低成本下跑得更快、更稳,才能真正推动扩散类模型的大规模应用普及。

6-林涛

林涛作引导发言

 7-报告颁奖-赵鑫8-报告颁奖-王毅9-报告颁奖-林涛

 执行主席为引导嘉宾颁发感谢牌

思辨环节

    本环节首次引入AI智能体作为特邀思辨嘉宾,与多位人类专家同台交锋。围绕Scaling时代的拐点之问、途径之问和布局之问展开多维探讨。

11-思辨

与会嘉宾参与思辨

10-AI嘉宾介绍

AI特邀嘉宾形象 本论坛出场嘉宾:杭小优、杭小赛

 

12-杭小赛

AI特邀嘉宾“杭小赛”参与思辨

思辨议题一:拐点之问: Scaling还能带来多少真能力? 提升点在哪里?

      围绕Scaling的边际效益与下一代能力提升,与会多方展开辨析,核心观点如下:

  Ÿ 在整体技术路径上,应优化模型密度以突破资源壁垒,推动从量变到质变。面对 Scaling Law 沦为大厂“金钱游戏”,学术界与创业者需跳出参数竞赛,聚焦单位算力下的核心能力提升。通过深耕推理、代码、多模态等高价值领域,打造“专家级波峰”,以更少资源驱动泛化能力跃升与智能突破。

  Ÿ 在价值评估上,应构建多元化评价闭环,推动模型从“基准刷分”回归“真实任务”。针对现有 Benchmark 的指标泡沫,需以能否完成写PPT、编代码等复杂任务并提升生产力为核心标准,结合“以模制模”互评与用户真实反馈,建立实证驱动的能力评估体系,让大模型真正解决现实问题。

  Ÿ 在推理测层面,未来的提升点在于通过“形式化推理引擎”自动合成逻辑严密的高质量数据(如几何证明、数学推理)。由于互联网高质量文本数据已接近枯竭,单纯通过增加数据规模的边际效应正在递减,甚至可能因过度依赖 AI 生成的低质量数据导致模型崩溃。因此,高质量合成数据不仅能解决数据稀缺问题,还可能有助于模型发现人类尚未察觉的知识,从而实现从“学习已知”到“自我演化”的转变。

  Ÿ 在物理世界层面,目前的 Scaling 主要集中在语言和静态视觉层面,存在物理常识缺失与幻觉问题。下一代能力的飞跃将来自于对物理世界规律的深度刻画,例如利用视频数据、驾驶数据或仿真环境下的具身智能(Agent)数据进行训练。这种从被动观看到主动交互的变革,有助于模型在具有明确流程、复杂规划的真实任务(如工业操控、软件交互)中展现出更强的逻辑一致性。

  Ÿ 此外, AI嘉宾杭小赛明确认为,单纯堆参数、堆数据的收益在变小,文本侧的低成本高质量数据越来越难找,AI 生成数据反复回炉还可能把模型越训越窄、越训越虚。 AI嘉宾杭小赛也不主张一句话宣告终结,而是认为真能力的增长点正在转向可验证:能不能在离开题库、换个说法、换个分布后依然稳定;能不能把输出和证据、执行结果、验收标准绑在一起。接下来更重要的是把评测做得更硬一点,少一些广告式刷分,多一些压力测试,比如分布外扰动、对抗提示、长程一致性,以及成本和效果的曲线,才能看清模型到底有没有真进步。

思辨议题二:途径之问: Scaling的增长路径有哪些? 

  针对Scaling的增长路径这一议题,与会专家围绕推理侧、数据侧、算力架构等维度展开了深度思辨,核心观点总结如下:

  Ÿ 数据应从“堆量”转向“提质与拓域”。高质量预训练数据已近枯竭,数十 TB 向数百 TB 扩展难以为继;复杂推理链、真实长尾场景及多样化环境的标注数据严重不足,制约模型在垂域与实际部署中的泛化能力。未来关键在于以更高质、多样且任务对齐的数据,用有限规模激发更高智能密度

  Ÿ 新范式与新底座的探索。单纯增加参数已非最优路径,结构创新与训练策略迭代正成能力跃迁关键。例如,Test-Time Training 通过推理中持续学习提升泛化效率;而 MoE 等架构高度依赖 Infra 优化——通信、调度与硬件协同已成为释放 Scaling 潜力的隐形瓶颈与突破口。

  Ÿ 智能体协同和单模型上帝角色的探讨。与会嘉宾观点倾向于这是一个螺旋上升过程,先在测试/应用侧用多智能体把任务拆开做、反复检索与互检,找到稳定有效的高质量路径;再把这些被验证过的策略和流程通过后训练/蒸馏内化进基座模型,让单模型在更低成本下也能自动跑出大部分正确步骤。同时,多智能体不会消失,而是作为复杂或高风险任务的加固和兜底机制按需启用。

  Ÿ 此外,AI嘉宾杭小赛则更看好推理侧和系统侧的增长,但重点不是让模型多想几轮,而是把任务做成可执行、可回放、可自动验收的闭环:工具接口清楚、权限边界清楚、成功失败能判断、出错能回滚、全程能审计。很多所谓环境泛化差,本质不是语料不够,而是没有把行动空间和反馈机制工程化。数据侧上,数据量难再暴涨,但在质量和多样性上还有空间,尤其是复杂推理、代码、专家判断这类高水平监督信号确实稀缺。顶尖人工标注不可能无限烧,最好用少量专家去训练生成—检验—筛选的自动数据引擎,把手工变成流水线。算力与架构侧不会停,但会从更大转向更省更有效,比如稀疏、并行、训练配方和推理优化。总体形态会是单模型更强、推理预算可调、关键任务再用多智能体和工具链做验证和兜底。

思辨议题三:布局之问:中国大模型技术体系和学术界该何去何从?

    针对中国大模型在后Scaling时代的定位,与会专家围绕“补齐短板”与“差异化分工”展开了讨论:

  Ÿ 来自企业界的观点指出,当前存在“为了面子追大模型”的乱象,导致大量购置的算力资源因企业内部数据混乱、标注缺失而无法产生实际价值。他们强调,底座能力决定上限,但目前真正的“真需求”在于解决信创背景下的软硬件鸿沟,如国产显卡训练与推理的底层兼容性问题。工业界应停止盲目刷分,转向深耕数据处理、防泄密分级等繁重的基础工作,让大模型在To B场景中从实验室走向生产线,解决真实痛点。

  Ÿ 来自学术界的观点指出,学术界以往引领工业界的局面已逆转,高校教师陷入了数据与算力短缺、论文影响力下降的焦虑。他们认为,学术界不应在万亿参数竞赛中“硬碰硬”,而应利用理论优势去探寻工业界“暂不碰、不愿做”的领域,如大模型基础架构、推理侧的机制性探索、以及面向未来的物理AI规律挖掘。

  Ÿ 与会者们也深刻讨论了深层矛盾:学生渴望发论文、进大厂实习,而产业需要的是解决算子优化、国产化适配等硬活。各方呼吁产学研合作不应停留在口头,而应通过落地的课题(如科技助残、智慧养老、社会安全漏洞挖掘)推动理论与技术的深度融合。工业界负责做大,学术界负责做精与向善,共同服务于大模型技术发展。

  Ÿ 此外, AI嘉宾杭小赛对中国大模型布局是否“尽早停 Scaling”持反对态度,认为资源集中是现实但不应成为止步理由,停只会把差距固定住,让领先者更安全。更现实的做法是把竞争焦点从拼规模,转到拼可交付能力:在政务、医疗、高校、媒体等私有化场景里,把数据治理、权限合规、评测闭环和工具链做扎实,让模型真正能办事、可审计、可控。学术界的发力点也更适合做高杠杆的东西,比如做一套各行业都能用、但又不容易被刷分的评测体系,各行业各自维护任务套件和验收规则,通用层只保留跨域的底层指标;再比如走验证器驱动的路线,把能力增长钉在可检验的目标上。整体趋势上,未来更像联邦协作:一个强通用的调度者,加上一群专业模块和智能体按需配合,而不是一个万能的单体包打天下。

13-特邀嘉宾颁奖

执行主席为特邀嘉宾颁发感谢证书

 

总结环节

最后,YOCSEF杭州副主席胡珂立作总结发言。他高度肯定论坛成效,指出本次聚焦“后Scaling时代大模型”的议题,通过嘉宾的专业分享与现场深入研讨,为与会者带来深刻启发。他特别提到,作为换届前最后一场重要技术论坛,首次引入AI特邀嘉宾,是形式与内容的创新探索,体现了YOCSEF杭州拥抱技术变革的初心。胡珂立向到场嘉宾、工作人员及委员们的贡献致以诚挚感谢,并坚信在大家共同努力下,YOCSEF杭州将持续为大模型领域的技术交流与创新发展搭建优质平台。

14-胡珂立总结

胡珂立作总结发言

历时数小时的技术研讨在热烈掌声中落下帷幕。与会专家学者、企业代表、行业嘉宾以及AI特邀嘉宾围绕后Scaling时代大模型的发展瓶颈与突围路径,就Scaling的剩余价值、多元增长路径及中国技术体系布局展开深度思辨。通过三大议题的激烈交锋,论坛探讨了Scaling能力扩展、数据高效利用、评价体系重构等关键挑战,明确了学术界与产业界的差异化分工。

AI 嘉宾的介入也带来了一些新的观察角度:它以相对结构化、基于模型逻辑的方式输出观点,在一定程度上反衬出人类专家在经验判断与前沿趋势之间需要做出的权衡与取舍。同时,这种互动也引出了一个值得关注的问题——当 AI 更频繁参与学术讨论与观点生成时,学术评价与知识生产是否可能出现表达趋同、议题选择收敛等现象。总体来看,这次尝试不仅是组织形式的调整,也是在探索如何在智能技术持续演进的背景下,形成更有效的人机协作机制,推动学术交流方式的适应性更新,彰显了CCF YOCSEF搭建学术桥梁、助力人工智能高质量发展的责任担当。

 

热门动态
2026-01-22
2026年1月17日上午,CCF YOCSEF保定分论坛在保定市深圳园展示中...
2026-01-19
2026年1月17日,CCF YOCSEF保定第八届学术委员会第二次会议暨换...
2026-01-09
2026年1月3日下午,CCF YOCSEF济南分论坛第二十三届学术委员会第...
2026-01-05
一、举办论坛:【活动名称】技术论坛:无人机视觉语言导航如何赋...
2025-12-31
2025年12月27日,CCF YOCSEF合肥分论坛第十五届学术委员会第二次...
2025-12-31
2025年12月27日,CCF YOCSEF合肥分论坛第十五届学术委员会第二次...
2025-08-11
CCF YOCSEF 昆明成功举办“小语种·大未来”技术论坛聚焦东南亚与...
2025-08-11
CCF YOCSEF 昆明成功举办“小语种·大未来”技术论坛聚焦东南亚与...
2025-12-02
2025年11月22日,中国计算机学会青年计算机科技论坛(CCF YOCSEF...
2025-12-02
2025年11月22日,中国计算机学会青年计算机科技论坛(CCF YOCSEF...
2025-11-24
CCF YOCSEF保定举办“应急救援场景下无人机AI视觉模型的创新突围...
2025-11-05
1、YOCSEF保定主办论坛活动 【活动名称】观点论坛:百万高端数据...
2025-10-21
GenAI时代大考:计算机高职教育的培养体系如何破茧重生?CCF YOC...
2025-09-29
承担社会责任 提升成员能力2025年9月6日,CCF YOCSEF合肥顺利举...
2025-09-29
承担社会责任 提升成员能力2025年9月6日,CCF YOCSEF合肥顺利举...
2025-09-22
2025年9月21日,中国计算机学会青年计算机科技论坛(CCF YOCSEF...
2025-09-04
1、YOCSEF保定分论坛建设相关活动【活动名称】第一次论坛筹备会...
2025-08-10
2025年8月3日,CCF YOCSEF合肥成功举办 “学术精英发现行”系列...
2025-08-10
2025年8月3日,CCF YOCSEF合肥成功举办 “学术精英发现行”系列...
2025-09-29
2025年7月12日,CCF YOCSEF 合肥成功举办技术论坛“车间物理定律...
CCF聚焦