解锁 AI “因果密码” !YOCSEF 广州大模型技术思辨风暴来袭
2025-03-26 阅读量:16 小字

随着大模型技术的不断发展,人工智能领域对因果关系理解和推理的需求日益增长。大模型在识别因果关系、判断因果方向、提供解释以及进行推荐等方面展现出巨大潜力。然而,如何准确实现和应用这些能力仍面临诸多挑战,如数据偏见、模型可解释性以及跨领域适应性等。为了深入探讨这一前沿话题,中国计算机学会(CCF)青年计算机科技论坛(YOCSEF)广州分论坛于2025年3月22日举办了题为“大模型与因果推断”的技术论坛。论坛邀请了大模型与因果推断领域的资深学者,分享他们在相关科技前沿取得的最新成果,并围绕可解释性在大模型技术的应用、知识推理与多智能体协同以及因果推断在工业界的应用等热点话题展开深入探讨,为人工智能的发展探索新的方向。

本次论坛由CCF主办,YOCSEF广州学术委员会组织,YOCSEF广州现任AC委员陈炳丰(广东工业大学)和YOCSEF广州现任AC委员、候任副主席朱鉴(广东工业大学)共同担任执行主席,广州唐邦信息科技有限公司、荔峰科技(广州)有限公司提供赞助支持。此次论坛邀请了华南理工大学教授黄翰、上海交通大学长聘副教授张拳石、中山大学副教授王可泽担任引导嘉宾;广东工业大学教授蔡瑞初、中山大学教授权小军、广东外语外贸大学副教授颜学明担任思辨嘉宾。

汕头大学校长郝志峰教授,广东金融学院副校长、CCF广州分部主席黄琼、YOCSEF总部候任主席贺瑞君(人民邮电出版社),YOCSEF总部候任副主席鄢兴雨(北京智谱华章科技有限公司),YOCSEF南京主席吴天星(东南大学),YOCSEF厦门主席周奕毅(厦门大学),CCF广州分部副主席杨育斌,CCF广州分部秘书长吴一冰(赛尔网络),YOCSEF广州往届主席谭台哲(广东工业大学)、黄书强(暨南大学)、黄栋(华南农业大学)、龙锦益(暨南大学),现任主席李冠彬(中山大学),往届副主席高静(广东恒电信息科技股份有限公司)、许正强(广州职赢未来信息科技有限公司),往届优秀AC刘雷(广东科技报),现任副主席、候任主席苏申(广州大学),现任副主席黄培涛(广州唐邦信息科技有限公司),现任学术秘书陈俊颖(华南理工大学)、姜思羽(广东外语外贸大学),往届AC委员蓝连涛(华南农业大学),现任AC委员刘伟莉(广东技术师范大学)、张帆(云米)、李雯霖(广东财经大学),候任AC委员崔金荣(华南农业大学),广州大学教授仇晶、荔峰科技(广州)有限公司总经理肖茂财,广东湾聚科技发展有限公司总经理蔡少东,香港中文大学(深圳)李镇,刘阳、陈泽川、刘名威、吕子钰、汤子逸、万文韬、吴贺丰、张巨声、廖巧丽、闫恩亮、李勇军、林浚、张祺、张峻涛、庞科健、海钰佳、雷浩等来自广东地区多所高校及企事业单位共70多人参加了此次论坛。

在论坛开幕环节,首先由本次论坛执行主席陈炳丰和朱鉴逐一介绍与会嘉宾,并详细阐述了本次论坛的背景。论坛聚焦于探讨大模型与因果推理之间的相互关系,以及二者如何能够相辅相成、互相促进。论坛的最终目标是从这些讨论中提炼出有助于技术迈进通用人工智能的高质量见解与建议。

随后,汕头大学校长郝志峰教授,广东金融学院副校长、CCF广州分部主席黄琼教授和广东工业大学计算机学院院长李小平教授代表会议主办方对与会者表示欢迎。


郝志峰教授和黄琼教授致欢迎辞

在引导报告环节,首先由华南理工大学软件学院黄翰教授以“可见的‘帅’,潜藏的‘才’——关于大模型与因果推断的一点思考“为题,深入探讨了因果推断在大模型技术应用领域的核心挑战。黄教授指出,当前大模型本质是显式变量的序列生成器,缺乏因果推断能力,难以应对现实世界中普遍存在的隐变量问题。他形象地将大模型的“帅”(强大的生成能力)与“才”(基于因果推断来挖掘深层规律)进行对比。在技术实践方面,黄教授团队聚焦因果建模领域,研发了结构方程自动生成与分析系统,该系统已服务全球200多个国家和地区的科研用户,覆盖15个应用领域,展现出广阔的应用前景。


黄翰教授作引导报告

上海交通大学张拳石副教授以“神经网络是否可以被严谨地解释清楚?”为题,分享了模型面临的可解释性挑战,指出法律、医疗等领域是典型应用场景。他提出基于博弈交互的可解释性理论体系,证明神经网络决策逻辑可分解为稀疏符号化概念,突破长期经验性悲观论调。该理论通过公理体系确保符号化解释的严谨性,实现对多种归因算法的统一解释,并揭示交互复杂度与模型泛化性、鲁棒性的数学关系。


张拳石副教授作引导报告

中山大学王可泽副教授以“大模型知识推理与多智能体研究”为题,分享了在ChatGPT、DeepSeek等大模型技术快速发展的背景下,模型面临的幻觉生成、多模态融合等垂直落地挑战,还指出健康、气象等领域是典型应用场景。王教授提出基于人类认知双通道理论的计算框架,结合三段论推理思维链与多智能体协同技术,突破单向预测架构限制,实现事实性与逻辑性提升。相关成果成功应用于广东省气象预报自动化生成、数说故事百亿级商业大模型SocialGPT优化及视频因果干预分析,显著提升服务效率与生成质量,为大模型在垂直领域的深度应用提供了创新解决方案。


王可泽副教授作引导报告

引导报告结束后,由YOCSEF总部候任主席贺瑞君、南京分论坛主席吴天星、厦门分论坛主席周奕毅分别为三位引导嘉宾颁发感谢牌,以示对他们的诚挚谢意。


引导发言结束后,论坛进入思辨环节,该环节由执行主席陈炳丰和朱鉴共同主持。思辨嘉宾包括:广东工业大学计算机学院的蔡瑞初教授、中山大学计算机学院的权小军教授、广东外语外贸大学的颜学明副教授等众多与会嘉宾。会场嘉宾围绕“大模型究竟是记忆的产物还是泛化的结果?”、“大模型是否需要具备因果理解能力?”、“如何引导大模型理解因果关系?”三个核心议题,展开激烈思辨。

思辨议题1:大模型究竟是记忆的产物还是泛化的结果?

针对此议题,一些嘉宾认为大模型在很大程度上是记忆的产物。蔡瑞初提出,大模型主要是基于记忆的基础知识和推理模式,这给人一种它具备泛化能力的错觉;然而,在面对新场景时,其泛化能力可能不足。周奕毅补充道,大模型主要通过记忆来体现所谓的“泛化能力”,例如在处理简单的数学加法时也可能出错,这表明大模型只是记住了数学知识,并未真正理解数学原理。

另一方面,也有嘉宾强调大模型的能力更多体现在泛化上。黄栋表示,在实际交互中,大模型经常需要处理训练集中未曾出现的情况,并根据已有的训练进行泛化以做出回应。谭台哲同意此观点,并指出虽然因果关系能够带来更好的泛化效果,但它并非提升泛化的唯一途径。

此外,一些嘉宾认为应综合看待大模型的记忆与泛化能力,不宜孤立思考。鄢兴雨介绍了业界的一种测试方法:对于一种新的游戏规则,若大模型在学习后能作为游戏角色提出合理策略,则表明其具有泛化能力;反之则说明它是基于记忆。张拳石强调,大模型对不同知识点的泛化能力存在差异,特别是在复杂交互中,这种能力可能会显著下降。刘阳认为记忆和泛化不可分割,两者之间存在交集,且因果关系有助于解释事务逻辑,从而大幅提升大模型的泛化能力。吴天星总结说,大模型在推理过程中既表现出记忆特性也展示了泛化能力,但讨论这个问题时不能脱离具体的应用场景、数据集及任务需求,并建议建立详细的评测体系来验证模型的表现是基于记忆还是泛化。

思辨议题2:大模型是否需要具备因果理解能力?

针对此议题,部分嘉宾认为大模型需要具备因果理解能力。权小军认为大模型应当具有逻辑推理的能力,而因果推理作为一种合理的推理形式,表明大模型确实需要具备因果理解能力。黄栋则强调应更关注于大模型解决问题的实际效果,即使缺乏完全的可解释性,大模型仍能作为强大的工具使用;不过他也指出,只有当大模型具备因果能力时,才能被视为迈向通用人工智能的重要一步。蔡瑞初进一步阐述了引入因果的重要性,认为这不仅是为了改进大模型本身,更是为了更好地改造世界。刘阳支持因果推理能够增强系统的可解释性、稳定性和可靠性。苏申补充说,仅靠现有的语料无法使大模型达到理想的表现,还需要通过归因分析来提升其性能,因此不能忽略因果逻辑。

另一方面,一些嘉宾则认为因果理解能力不一定是大模型的基础能力,更多地依赖于逻辑推理能力。陈俊颖提出,虽然大模型需要实现可解释性,但这不一定非要通过因果理解来达成,逻辑或规则同样可以实现这一目标。

此外,还有嘉宾从不同角度探讨了大模型与因果推理的关系。鄢兴雨表示,尽管在技术层面上实现通用人工智能不一定需要因果推理,但为了让公众接受和信任通用人工智能,因果推理是必要的。吴贺丰认为大模型本身就包含了一定程度的因果理解和推理能力。刘伟莉则指出,在某些特定应用场景如医疗和金融领域中,因果理解能力对大模型来说至关重要,但在其他场景下可能并非如此必要。

思辨议题3:如何引导大模型理解因果关系?

针对这一议题,部分嘉宾提出了以数据为中心的方法。蔡瑞初认为,静态数据不足以使大模型理解因果关系;相反,通过与现实世界的交互产生的动态数据可以赋予大模型这种能力。张拳石强调,人类对因果的理解源于自我反思的过程,因此,为了提升大模型的因果理解能力,也需要开发一套方法来促进其进行类似的反思和总结。鄢兴雨则建议,可以通过识别长链逻辑内容中的共性部分作为归因,生成因果数据,并将其反馈给大模型,从而辅助其理解因果关系。

另一些嘉宾对于以数据为中心的研究范式是否足以帮助大模型理解因果关系表示怀疑。周奕毅指出,由于大模型本质上是一个条件概率模型,主要用于解决概率分布问题,因此让大模型像人类一样理解原因或原理是相当具有挑战性的。陈俊颖补充道,虽然数据本身并不包含因果关系,但通过将人类对因果关系的理解融入数据设计中,并结合考虑因果关系的模型设计,然后将这些数据输入模型进行训练,可以在一定程度上增强模型对因果关系的理解。

此外,颜学明提到,大模型的应用已经对传统的自然语言处理教学和科研带来了革命性的变化,使得许多传统任务得以更高效地解决。黄栋认为,某些大模型之所以能够进行因果推理和逻辑推理,并不一定是因为它们从嵌入了因果关系的数据中学习,而是因为这些模型的结构本身就适合此类任务。权小军进一步指出,尽管传统的机器学习特征选择方法和自然语言处理中的句法结构分析等研究思路可能已不再适用,但在当前环境下,无论是深度学习还是大模型,数据驱动的范式依然显示出其有效性。



嘉宾热议

在思辨环节之后,由郝志峰教授依次为各位思辨嘉宾颁发了感谢牌。此次论坛历时四个多小时,最后贺瑞君对此次论坛进行总结并表示肯定。


颁发思辨特邀嘉宾感谢牌留念

候任主席贺瑞君对论坛作总结


与会嘉宾合影留念

本次论坛围绕“大模型与因果推断”这一主题,汇聚了来自学术界与业界的众多专家。与会者围绕大模型和因果推理的协同发展机制展开深入探讨,重点分析了二者如何相互促进、融合发展,并为实现通用人工智能提炼出一些高质量的观点和建议。期待在各领域专家学者的共同推动下,继续深化大模形与因果技术的融合,扩大影响力,为产业实践指明发展方向。


热门动态
2024-08-27
2024年8月3日,CCF YOCSEF合肥顺利举办技术论坛“从基座模型到终...
2023-05-05
AI为科学提供了强有力的工具和方法,帮助领域学者发现新的知识、...
2023-03-24
2023年3月18日,CCF YOCSEF成都在四川省成都市五岳宫街28号成都...
2023-03-02
近十年,我国交通运输事业取得了历史性成就,发生了历史性变革,...
2023-01-12
2023年1月7日-8日,CCF YOCSEF成都在四川省峨眉山市峨眉山...
2022-11-13
CCF YOCSEF成都成功举办“当行为数据分析遇上云边智能”技术论坛...
2022-11-03
习近平总书记在二十大报告中指出:全面推进乡村振兴,加快建设农...
2022-08-25
2022年8月20日,中国计算机学会(CCF)青年计算机科技论坛(CCF ...
2022-08-16
2022年8月13日下午,由中国计算机学会(CCF)主办,CCF YOCSEF成...
2022-08-16
   7月25日,由CCF主办、YOCSEF深圳承办,国家超级计算深圳中心...
2025-01-17
EDA(电子设计自动化)是用于辅助超大规模集成电路芯片设计,制造...
2025-01-14
2025年1月11日,中国计算机学会(CCF)青年计算机科技论坛(YOCS...
2025-01-13
AI for Science:探索人工智能重塑科学研究之路AI 会改变现有科...
2024-12-06
在信息技术的时代浪潮中,程序设计竞赛与训练成为培育创...
2024-10-24
2024年10月19日上午,CCF YOCSE昆明“AI技术如何赋能云南高原特...
2024-08-02
近年来国家明确提出,要大力发展特色县域经济。但是在特色县域经...
2024-06-22
2024年6月22日下午,中国计算机学会青年计算机科技论坛昆明分论...
2024-05-14
同力同心,共筑未来——CCF YOCSEF昆明成功举办2024-2025年论坛...
2024-03-16
2024年3月16日上午,CCF YOCSEF昆明“AI助力,走进古滇之遗”技...
2023-12-26
人工智能从诞生经历了包括符号主义、连接主义、统计学习...
CCF聚焦