分论坛 > 上海 > 新闻动态
大模型时代,高校失去了原始创新能力了吗?
2025-03-29 阅读量:0 小字

01

论坛背景

2025年2月22日,由中国计算机学会主办,CCF YOCSEF上海学术委员会组织,复旦大学、上海交通大学支持的CCF YOCSEF上海观点论坛:“在大模型时代,高校失去了开创颠覆性新技术的能力吗?”在复旦大学计算机学院顺利召开。

高等院校是基础研究和知识创新的主要场所,致力于推动科学前沿和培养科技人才。但在人工智能时代,科技公司如微软、谷歌、OpenAI、深度求索、阿里巴巴等凭借雄厚资金,推动基础研究与技术应用的融合,提出了ResNet、Transformer等神经网络架构,并推出了ChatGPT、GPT-4、DeepSeek、Qwen等具有广泛影响力的新产品。相比之下,高等院校在人工智能领域的研究面临巨大挑战,尤其是在计算机视觉、自然语言处理和机器学习等领域,相关研究的科学和产业意义受到挑战。本论坛旨在通过思辨讨论促进学术界与产业界的合作,探讨如何在大模型时代推动跨学科研究、技术创新和知识进步。

本次CCF YOCSEF上海观点论坛由CCF YOCSEF上海AC委员和候任学术秘书、复旦大学戈维峰和CCF YOCSEF上海AC委员和候任副主席、上海交通大学郑臻哲共同担任执行主席,由CCF YOCSEF上海AC委员、候任副主席、联通(上海)产业互联网有限公司徐冰茹担任微论坛主席。

此外,论坛邀请到上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩、复旦大学副教授魏忠钰、上海交通大学助理教授朱怡飞、复旦大学教授陈涛作为引导发言嘉宾就论坛主题进行相关背景引导,还邀请了上海谛视万象总监闫明、华东师范大学研究员李翔、上海大学助理教授李梦甜作为思辨嘉宾参与议题研讨。参与本论坛的还有百度智能云汪刚,万家基金朱华,上海成趣信息科技有限公司杨晓春,浙江灵巧智能科技上海公司范祥如,魔狸科技陈敏敏,博世公司曹秋实,上海复旦资产经营有限公司危达,辽宁工程技术大学谭福生,复旦大学顾启凡、张子溦、李松宇、郭杭闻,上海大学张骁桐、刘景方,上海第二工业大学谭金菁、谭文安,YOCSEF上海候任主席石亮,副主席李洋,秘书长刘斐,候任学术秘书许盛诚,学术委员易芬、高永彬、蒋龙泉、吴一鸣,优秀委员谭书华,通讯委员朱昌明、邱堃,以及YOCSEF上海老委员王加溢、YOCSEF河南2023-2024主席张磊、YOCSEF总部老委员袁瑛、YOCSEF苏州张露瑶、YOCSEF昆明郃永航、YOCSEF福州张晨然。

02

引导发言

1

戴国浩-“大模型时代的研究思考” 

上海交通大学教授

无问芯穹联合创始人兼首席科学家


戴国浩的发言围绕大模型时代的研究思考,指出高校在大模型研究中面临巨大挑战,强调高校研究者应顺应中美科技竞争的大形势去规划研究方向。他指出人工智能发展过程中经历了算法、算力和数据驱动三个阶段,而当下高质量数据或成关键。他阐述了原始创新到产业落地的流程及各阶段需求,指出了高校在各个阶段充当的角色,以及国内需培养复合型人才以适应新时代的需求。最后,他提出高校年轻教师应回归本心培养学生,助力国家和社会的发展。

图片

戴国浩引导发言


2

魏忠钰-“大模型智能体驱动的社会仿真” 

复旦大学副教授


魏忠钰讨论了大模型在社会模拟中的应用,包括智能驱动的自主智能体在复杂社会场景中的作用。通过大模型驱动的智能体,具备环境感知、行动决策以及任务规划的综合能力。在医疗场景中,使用大模型驱动的智能体可以进行早诊,并通过多智能体的交互产生高质量对话数据,从而提高导诊模型的效果。此外,在大规模社会场景中,通过大模型模拟人类行为并聚合群体结果,可以确保模拟出的智能体行为分布与真实人群一致,以及每个个体的行为与社会中真实人的行为一致。他表示大模型时代业界和交叉学科研究者应该在人才培养和技术创新上进行合作,推动突破性应用落地和学科交叉融合。

图片

魏忠钰引导发言


3

朱怡飞-“面向智能应用的网络与计算重设计” 

上海交通大学副教授


朱怡飞指出在人工智能时代计算和网络重设计的背景下,当前计算架构无法完美支撑大模型算法广泛应用。计算架构与大模型算法、数据以及大模型训练需求存在不匹配等问题,他提出了一系列相应的解决方案,如端云协同、模型切割和联邦学习等。他对学术界发展持积极态度,并建议政府建立大型计算集群,以推动技术持续发展进步。

图片

朱怡飞引导发言


4

陈涛-“从DeepSeek说起:大模型时代高校和企业AI的创新分工和协作” 

复旦大学教授


陈涛介绍了在大模型发展背景下,高校需要以企业实践为切入点,剖析企业贴近市场的优势,对比国内外主流大模型以确定新的人工智能技术发展方向。同时,他阐述了大模型技术的发展对高校定位的启发,强调跨学科人才培养,指出高校应该在基础理论研究方面加强探索,分享了课题组部分研究成果,包括构建了分布式群体智能模型实现从语言到动作的推理,以及探索适用于人形机器人的异构计算等内容。

图片

陈涛引导发言


03

研讨环节

在研讨环节中,思辨引导嘉宾和参会人员对三个研讨问题展开了充分的讨论。

01

图片

研讨问题一:从DeepSeek看,大模型研究是算法优先于算力,还是算力优先于算法?


上海谛视万象有限公司的闫明认为,算法、算力和数据三者并行,在大模型应用中均发挥重要作用。他指出,在过去的时代,算力的重要性高于算法,但随着成本曲线的变化以及高校与企业的合作,算法和工程优化可以解决许多算力问题。此外,他讨论了企业市场优化,并提到了零样本训练的概念,以及如何通过工程化整合的方式将学术成果应用于行业前端。

上海大学的李梦甜认为,算法和算力是关键因素,尤其在艺术领域数据较少的情况下,需要关注模型优化和蒸馏等技术。她探讨了如何解决小数据问题,以及如何基于基础知识针对艺术领域的场景进行生产。

华东师范大学的李翔提出,将结构化数据注入大模型中可以提高其对结构化数据的处理能力。同时,他也关注大模型的优化研究。他指出,在早期阶段,算力优先于算法,但随着技术的发展,算法优先于算力的趋势逐渐显现。强化学习在深度推理方面取得了显著成果,但在学术界的小模型上效果有限,而在大规模模型上则表现良好。因此,如何平衡算法和算力的人才培养是一个重要问题。此外,他探讨了强化学习在深度学习中的应用,并强调了算法优先的重要性。尽管深度学习在高效计算方面取得了突破,但单纯依赖算力的时代已经过去,更深入的算法创新变得尤为重要。

魏忠钰在探讨算力资源配备问题时,提及如幻方这类公司构建的万卡平台,具备超大规模训练能力,为训练奠定了优势。他同样认为,单纯依赖算力的时代已过,算法创新变得关键。他指出,当下的重要任务是将Deepseek R1的深度思考与特定领域的专业知识进行对齐,即使在有限资源下,也能够取得进展,这是当前可行的方向。

陈涛讨论了视觉模态的理解和应用,以及多模态大模型在高校和企业合作中的发展。尽管高校在资源上难以独立完成大模型训练,但可以通过与企业合作,在算法和算力之间取得平衡。他指出,多模态大模型的核心仍然是语言模型,通过融合不同模态的 token 并将其串联至语言基座模型,实现多模态理解。在输出阶段,语言模型的结果可被转换为视觉或点云等形式。近年来,CV 会议逐渐演变为由多模态或自然语言技术衍生的会议,大量研究工作采用了大语言模型。


图片

思辨嘉宾发言1


YOCSEF 上海候任主席、华东师范大学的石亮强调,应用与底层的深度融合设计至关重要,以确保技术真正能够普惠所有人。他提醒学术界的同行要保持定力,不被商业成功所左右,应关注算法、算力与应用的深度融合优化设计。除此之外,他还探讨了 AI 领域的颠覆性创新,包括硬件与算法的联合设计。他提出,是否可以针对特定模型设计专门的算力,以突破现有显卡的限制。同时,他也探讨了通用人工智能的实现路径,包括在低功耗环境下完成复杂任务的可能性。  

YOCSEF 上海候任学术秘书、论坛执行主席、复旦大学的戈维峰从视觉研究的角度指出,当前大模型的主要突破集中在语言领域,而多模态大模型的实现方式是将图像编码为 Token 并与文本对齐,但这一方法存在问题。文本信息密度高且可以完整收集,而视觉数据量远超文本,但视觉大模型尚未取得突破,多模态模型的处理能力仍然有限,并且幻觉较多。未来,在大模型的进一步发展中,算力可能成为瓶颈,但这也为算法设计提供了新的方向。例如,若视觉模型能够像语言模型预测下一个单词一样,依据前文视频生成后续视频,并结合物理规律和人类认知等因素,则有望进一步逼近所谓的“世界模型”。  

YOCSEF 郑州 2023-2024 主席、河南大学的张磊认为,算法与算力的优先级是一个阶段性问题。从大模型应用的外延发展来看,随着应用场景的拓展和集中化发展,对数据的需求量不断增加,算力要求也随之提升;而从内部研究来看,在多模态大模型领域,许多人正在探索新型计算结构与人工智能芯片。若未来的 AI 芯片能够像人脑一样运作,大模型或许能够集成至小型芯片中,使得算力与算法呈现阶梯式、交互式的发展模式。此外,他指出,算力本身也包含算法设计问题。  

百度智能云的汪刚表示,百度在 AI 领域的产品线覆盖广泛,从芯片到文心一言等均有布局。他指出,大模型的发展推动了市场变革,使原本百亿级规模的市场有望扩展至千亿级,行业参与者也随之增多,与美国的竞争差距可能缩小。从商业落地的角度来看,过去高校与企业训练大模型多依赖英伟达的 GPU,而如今许多企业开始考虑国产算力。他认为,当前阶段算法优于算力,但中国具有集中力量办大事的优势,一旦芯片及生产能力达到一定水平,算力可能会重新占据主导地位。他呼吁高校与企业在大模型研究中更多关注国产算力,并介绍了百度昆仑星 P8 版,其显存达到 96GB,一台服务器即可实现高效训练。  

灵巧智能的范祥如以“沙漠里的鱼”作比喻,将算法比作生物的基因,决定发展方向,而算力则是生存环境,影响发展速度。他认为,算力的载体形式可能会发生改变,就像仿生学的发展一样。他结合生活场景,以《哪吒之魔童降世》的“我命由我不由天”为例,指出基因(算法)决定发展的长远程度,而大环(算力)决定发展的速度,因此算法和算力应兼容并进。  

总体而言,在大模型研究中,关于算法与算力的优先级,不同观点并存。有人认为二者应并行发展,根据应用效果决定侧重;有人主张算法优先;也有人认为算力更为重要;还有观点认为这是一个阶段性问题,算法与算力呈阶梯式、交互式发展。此外,与会者还围绕产学研合作、应用拓展等话题展开了深入探讨。


02

图片

研讨问题二:大模型时代,通用人工智能创新主力在企业还是在高校?高校还具有开发颠覆性新技术的能力吗?


魏忠钰认为,过去十年,自然语言处理领域的突破性创新多源于企业,而高校在这一领域的创新能力有所减弱,落地能力也相对不足,这种无力感正日益显现。然而,高校应更加重视长远的理论方法框架研究布局,这对于人才培养和知识体系构建至关重要,而非盲目追逐热点或关注短期成果。此外,科技创新并不局限于大模型,人工智能学者可以与其他交叉学科相结合,拓展更广泛的科学创新领域。

朱怡飞认为,在算力有限的情况下,高校可以与企业开展合作,同时政府也应积极参与,例如建设面向 AI 的数据中心,以促进算力复用,缓解算力资源紧张的问题。他指出,通用人工智能只是计算机领域的阶段性成果,并非通向通用智能的必经之路。在当前阶段,应将这一成果广泛应用于更多领域,推动跨学科融合,以促进各行业的发展,并最终回馈社会。计算机领域的从业者对此负有责任,应积极推动这一进程。


图片

思辨嘉宾发言2


陈涛指出,目前通用人工智能的创新阻力在企业层面更为明显。短期内,该领域主要依赖数据来验证模型和算法,而大规模数据处理主要由企业完成,高校难以在这一过程中发挥核心作用。同时,由于数据和空间等问题,具身智能也难以形成通用模型。然而,高校在颠覆性技术的开发上具有独特优势。目前 AI 大模型中常用的反向传播算法、强化学习等理论,最早可追溯到高校在二三十年前的研究,如霍普菲尔德网络、卷积架构等,尽管当时受限于算力,未能充分发挥作用,但其理论根基源于高校。因此,高校应保持专注研究的态度,作为颠覆性新理论的主要孵化地,而企业往往缺乏足够的耐心。此外,deepseek 在 AI 推理能力上的表现较为出色,其创新成果也从侧面验证了通用人工智能创新在企业层面存在阻力的观点。  

闫明探讨了创新的本质与驱动力,并提出三点观点:第一,创新不等于发明,突破性变革并非唯一的创新路径。例如,当前人工智能的发展类似于人类掌握火与火药的过程,应先应用再探索其本质;第二,以 deepseek 为例,它虽然未发明全新的技术,但通过连接和重组,实现了科技普惠,为企业思考如何突破高成本壁垒提供了思路;第三,创新的核心驱动力在于实现平权,例如互联网推动了信息平权,大模型促进了知识平权,而企业可通过与高校合作,优化技术整合,使行业知识平权得以实现。目前,企业的创新重点在于大模型的小型化、国产化、降本增效及算法解耦,以使更多垂直行业受益。未来,企业期待与更多高校合作,将高校技术与产业深度结合,创造更大的社会价值。  

李翔持相对保守的观点,他认为高校的作用正变得模糊,因各种因素,颠覆性技术与高校的距离越来越远,且高校在一定程度上耗费了大量时间去做不属于自身职责的事务。尽管颠覆性技术并非全由企业主导,例如腾讯、字节等企业的综合实力远超 OpenAI、deepseek,却未能推出类似的突破性成果,这表明企业内部的合作、竞争及业务考量可能会影响创新进程。他认为,高校的核心任务是培养学生,例如 deepseek 的研究人员在高校期间虽然未直接产出产品,但发表了大量论文,并在学术训练过程中形成了良好的思维模式,这对后续工作具有积极影响。不过,他对高校能否在大模型的矩阵分解和推理等关键技术上实现重大突破持怀疑态度。  

李梦甜则强调,高校的首要任务是人才培养。在探讨人工智能创新的主力时,她指出,除了通用人工智能,专用的垂直领域模型同样值得关注。以电影制作和戏剧创作为例,电影是一套成熟的工业体系,而当前学术界关于电影的研究往往与产业实践脱节,使得高校提出的新技术难以被行业采纳。因此,在成熟行业,技术研究应由企业和产业主导,而非仅依赖高校构想。然而,戏剧创作作为一门相对灵活且尚处于发展初期的艺术形式,为 AI 技术的引入提供了更大空间。例如,在与上海戏剧学院的合作中发现,从剧本分析、排演到舞美设计等环节,AI 技术均有可能带来颠覆性创新,改变传统排练模式并自主定义行业发展。因此,高校是否具备颠覆性技术的能力,很大程度上取决于其所面向产业的发展成熟度。  

高永彬指出,ChatGPT 虽然应用广泛,效果显著,但其核心技术仍然基于二十年前的基础理论,仅是在算力提升的基础上实现了产业化应用。如果高校单纯依靠大模型堆叠算力来进行创新,前景并不乐观,且难以与企业竞争。然而,高校仍具备开发颠覆性新技术的能力。例如,大模型目前仍面临可解释性和专业场景适配等问题,因此高校应基于基础理论,探索不同于大模型的发展路径,否则在 AI 领域的竞争力将进一步削弱。  

戈维峰认为,大模型的崛起对高校的经费、资源等方面造成了冲击,导致高校新技术的影响力下降,话语权变小。例如,复旦大学关于通用人工智能的研究团队,因 GPT 的出现而被解散,这反映出高校在 AI 研究中的资源和话语权正被企业逐步占据。此外,高校在技术评估和研究方向选择上面临挑战,人工智能领域的研究正处于危机之中。

郑臻哲认为,在搜索空间方面,高校因算力限制,其探索能力受限,难以研究需要大规模算力支撑的问题空间。而企业则能在高校研究基础上,通过算力部署和算法优化,实现更深入的探索。但高校在无算力支撑的研究空间中,依靠学者和学生对前沿技术的持续关注,仍有机会找到突破性的技术方案,并明确关键研究方向。  

石亮认为,学术研究的优势在于能够较少受产业链和现实条件的限制,从而进行创新探索。科研创新需要长期积累和试错,而不应被当下产业的发展框架所束缚。一方面,在大规模算力管理和 transformer 运行优化等产业需求驱动下,需要有研究人员开展相关基础研究;另一方面,也应保持独立思考,避免盲目追随行业趋势,确保研究方向的正确性。总体而言,高校可以贴近产业,但应保持一定的学术独立性,不应过度依赖市场导向,以确保自由探索的能力。  

朱华则从产业视角出发,认为高校在学术前沿方面仍是引领者。尽管高校研究受限于外部环境,但企业同样面临类似的挑战,学界与业界均有“围城”之感。他支持邱老师对创新的分类方式,指出不同创新方向有不同的主导力量。在算法和底层理论创新方面,高校仍然发挥着关键作用,即便许多论文由企业发表,其理论基础仍然离不开高校科研人员的贡献。他强调,产学研结合是一个互补过程。例如,在 Sora 诞生后,国内企业如快手、字节等,利用自身的数据和算力优势,并结合高校提供的底层技术,开发出了效果更优的文生视频大模型,这表明只有产学研协同合作,才能真正实现技术的突破和产业化。  

谭书华认为,通用人工智能的创新在企业和高校之间相辅相成。高校在颠覆性技术开发上具有优势,而企业更擅长短期应用和商业化落地。从企业视角来看,三至五年的技术发展主要依赖企业,而十至二十年的技术演进则需要依靠高校的研究积累。因此,企业实验室需要借助高校的理论研究,与企业实际应用结合,以实现规模化生产和商业价值创造。例如,尽管 deepseek 在 AI 领域取得了成功,但这并不意味着高校在相关算法和技术上的积累较少。以圆通为例,其在数据化和人工智能领域的早期投入,使其成为物流行业首个获得国家工程实验室认证的企业,这正是高校长期研究支撑企业创新的例证。因此,通用人工智能创新既需要企业,也需要高校,而高校仍具备开发颠覆性技术的能力。


03

图片

研讨问题三:新时代高等院校应聚焦于什么类型的研究与方向,以适应大模型技术的快速发展与应用?


魏忠钰认为,在高校成立课题组并实现长期发展与传承,需要制定长远规划,深入思考持续创新的驱动机制。目前,大模型已进入工业落地阶段,高校在该领域的研究优势逐渐减弱,因此,更适合布局短期内难以落地的前沿课题,如具身智能,以保持长期竞争力。短期内,他倾向于布局半年至一年内可产出学术论文的研究,以培养学生,例如针对 DeepSeek R1 在强化学习与深度推理方面的不足进行探索。中期目标(五年内)则聚焦于学科交叉,计划布局医疗服务等具有落地潜力的课题;长期目标(十年及以上)考虑拓展至人体神经系统、基因蛋白质分析等研究方向,这是基于实际操作与可持续发展的考量。  

朱怡飞指出,当前政策和行业导向使高校承担了更多责任,不同学术主体原本在各自领域专注研究,而如今高校需更关注短期(一至三年)内可见的成果产出,工作量随之增加。在研究方向上,他的团队长期专注于视频研究,因视频不仅信息丰富,还对底层基础设施有较大冲击。尽管团队名为“多媒体”,实际研究重心更多集中在视频领域。未来,他计划进一步融合多模态信息,不仅限于视觉和触觉,而是拓展至视觉、声音、文本及其他传感器感知的信息,与具身智能研究高度契合,同时满足数字人等应用发展的需求,推动从单模态视频向多模态感知的拓展。  

陈涛认为,相较于其他学科的高校教师,计算机或人工智能领域的从业者拥有更多参与应用研究、产学研合作及创新项目的机会。然而,许多大学教师并非如此,例如数学系的基础数学研究者更专注于纯学术研究,对应用问题兴趣较低,甚至抗拒被问及研究的实际用途。他指出,高校教师在生存压力下,需要兼顾基础探索与现实需求。例如,他刚回国时研究传统视觉模型压缩,随着大模型的兴起,为适应论文发表的趋势,转向大模型的压缩、训练与推理,并深入学习相关架构原理。随后,他进一步聚焦于终端大模型,因其在无人机、无人车等领域具有广阔应用前景,同时也符合机器人创业公司的发展需求。他强调,高校教师尤其是计算机与人工智能相关领域的研究者,应不断调整自身方向,在新兴赛道中寻找特色,并结合自身优势拓展研究领域。  

李梦甜分享了她的经历。入职上海电影学院后,她希望使研究方向与电影产业深度结合,于是积极与不同领域的教师交流,最终确立了“AI for Art”研究方向,涵盖电影、游戏、戏剧等多个领域。为解决科研经费问题,她避开竞争激烈的传统项目,成功申请到腾讯资助的与传统文化结合的研究项目。此外,她在学院内推动计算机应用方向的人才培养,带领学生发表了学院首篇 CVPR 论文,并开设了全国首门“人工智能与电影制作”课程。她认为,高校教师应顺应学科发展趋势,结合自身研究背景、行业需求和实际条件,综合考量研究方向与发展路径,以适应学术与产业环境的变化。


图片

思辨嘉宾发言3


来自高校、企业等各界人士认为,在大模型快速发展的背景下,高校应明确自身定位。高校教师应坚守研究兴趣的同时,兼顾现实需求,在满足学校考核要求的基础上,保持对纯粹学术探索的追求。在研究方向上,应紧跟大模型技术发展趋势,围绕行业关键问题展开研究,攻克视觉大模型核心技术,关注可信安全与隐私保护。同时,应针对垂直领域的实际需求,深化产学研合作,推动技术落地,并结合产业发展培养高水平人才。高校与企业应形成协同创新机制,高校聚焦前沿技术突破,企业负责产品商业化,同时,企业可将高附加值的技术问题交由高校研究。由于不同企业需求各异,具体合作模式需因地制宜、深入分析。


04

论坛总结

最后,执行主席戈维峰和郑臻哲分别对本次论坛进行了总结。戈维峰表示,本次论坛围绕三个核心议题展开深入讨论,分别涉及创新算法与算力的关系、高校与企业的创新分工及高校所面临的挑战、大模型时代高校创新方向的调整。论坛成果显著,与会者观点多元,优秀学者分享的经验极具启发性。郑臻哲认为,大模型技术正处于前沿发展阶段,能够投身计算机学科相关工作,无论是在高校从事教学科研,还是在企业推动技术应用,都是一件十分荣幸且意义重大的事情。能参与前沿科技研究并推动其影响人们的生活,令人倍感自豪。  

本次论坛围绕大模型时代的关键议题展开深入探讨,与会者充分交流观点,促进了对高校与企业协同创新、合作共赢的共识,为未来的发展提供了重要思考和启示。

图片
图片


参会合影


热门动态
2018-07-31
CCF YOCSEF 上海分论坛于2018年7月23日晚在上海交通大学徐汇校区...
2018-07-14
人工智能(AI)在理论、技术和应用等方面得到学术界、产业界、教...
2018-07-11
CCF YOCSEF上海分论坛于2018年7月6日晚上在上海市黄浦区洛克外滩...
CCF聚焦