在大模型技术的冲击下,以聚类分析、隐结构分析为例的经典机器学习算法在医学领域应用该如何发展和变革?2025年9月27日,由中国计算机学会主办、CCF YOCSEF郑州学术委员会组织“大模型时代下,经典机器算法在医学领域应用如何变革”技术论坛在郑州举行。
大模型技术的快速崛起,以其强大的泛化能力和丰富的应用场景,冲击了经典机器学习算法的传统地位。以医学应用为例,原本依赖逻辑回归、聚类分析等方法的建模任务,逐渐被大模型替代,引发对经典算法存在价值的质疑。在大模型技术的冲击下,以聚类分析、隐结构分析为例的经典机器学习算法该如何发展和变革?本论坛以对无监督经典机器学习算法在大模型背景下进行深入讨论,以促进其自身发展及在医学领域的落地应用。
本次技术论坛由CCF YOCSEF郑州学术委员、河南中医药大学许玉龙和CCF YOCSEF郑州学术委员、浪潮电子信息产业股份有限公司贺磊共同担任执行主席。
论坛邀请多位专家担任嘉宾,包括河南省中医药科学院副院长赵移畛、北京科技大学教授张德政、河南中医药大学第三附属医院副院长邵明义、浪潮电子信息产业股份有限公司AI技术总监杨振宇、河南农业大学特聘教授刘亮亮、河南中医药大学第一附属医院互联网医院负责人董鹏永、山西财经大学信息学院数据科学与大数据技术教研室主任肖宁等。
论坛伊始,CCF YOCSEF郑州分论坛主席陆丽介绍了本次论坛举办的背景。
一
引导发言
在引导发言环节,河南省中医药科学院副院长赵移畛以“人工智能+行动”为背景,围绕智慧中医院建设展开分享,核心从时代之需、变革之痛、脱胎之变三个维度系统阐述,其中“脱胎之变”为针对性解决方案,旨在推动中医院数智化转型。提出以“角色、关系、业务流程”为核心的数智化建设路径,具体通过梳理核心角色及对应业务场景、关系、流程、功能点,构建业务、数据、应用、技术四大架构,并强调医疗人工智能需深度结合临床场景以生成高质量数据,最终实现中医院的数智化转型。
北京科技大学教授张德政剖析了人工智能在医学辅助诊疗领域的应用,分享了研究成果:智能问答优化和疾病诊断模型。将多任务学习技术应用于医学智能问答,可优化问答逻辑,为临床医生、患者提供更精准的医学信息查询支持。研发以张仲景中医药大模型V1.0为核心,构建了从基础支撑到临床应用的完整技术体系,且专科智能体能够复刻名老中医用药思路,助力中医药诊疗传承。
河南中医药大学第三附属医院副院长邵明义分享了基于人工智能的中医经方医案知识重塑与应用,涵盖人工智能与中医结合、具体研究案例,展望经典名方传承转化等工作。包括与中国知网合作共建病房数据库,可线上检索经方信息;制定规则,用黄金分割法分析,实现经方数据重塑;构建辅助决策系统,实现经典名方传承转化,挖掘经验重塑伤寒论知识体系。
浪潮电子信息产业股份有限公司AI技术总监杨振宇围绕“AI助力医学与科研范式及应用创新”主题,系统阐述了AI技术的发展趋势、医学AI的演进逻辑,并提出大模型与无监督学习的三种协同范式,核心是结合大模型的泛化优势与无监督学习对数据规律的挖掘能力,提升医学AI的应用效能。对于未来,两者将在医学领域形成互补协同格局——以无监督学习为代表的经典机器学习算法与大模型各有侧重场景,通过持续迭代优化,共同推动医学科研范式的深度创新与临床应用的广泛变革。
二
思辨环节
活议题一:智能诊疗技术在医疗场景中的实现需求与应用痛点如何辩证看待?
河南中医药大学第一附属医院互联网医院负责人董鹏永主要从患者、医生、管理者三个方面出发进行思辨引导。患者:诊前需要导诊智能体&名医推荐智能体,推荐诊疗方案、疗法等。诊后涉及智能随访、诊疗穿戴设备数据回传等。医生:获取患者与智能体交互的结果作为预问诊资料;根据患者提供的家族史、过敏史或其他的预警信息,出具医疗建议作为医生决策的辅助。医疗机构:算法和底层疾病逻辑的映射关系困难,患者隐私外漏、数据安全问题。
李学真认为智能诊断技术有可能会阻碍中医发展,造成中医人才断代。现在训练的智能体准确率达到99%以上,今后需要普通医生的意义不大。
邵明义指出在如今的信息时代,人工智能已经延伸到我们生活的方方面面,正在重塑我们各行各业,医疗也是被重塑的对象之一,只有拥抱人工智能,驾驭人工智能,而不能害怕他抢了什么?他能加速中医师的成长过程,把一些原本需要几十年就揣摩的东西,通过总结和学习能很快掌握。
刘德功认为技术不能代替医生,病重的患者还需要医生,智能诊疗的普及也会提升乡镇医疗水平。
肖宁强调人工智能肯定不能完全替代人类,尤其是大模型,它存在一定的算法偏见,有算法数据幻觉的问题,尤其是在关系着一个人的健康问题的医疗方面上,幻觉是绝对不允许出现的,所以大模型只能辅助作用。
张楠认为智能诊疗需要大量数据,数据隐私与安全性怎么办是最重要的。不同的机构,数据的结构不一致,训练的标准不一致,模型的泛化性也存在差异。
刘奥祥指出多智能体的一个协同应用,要做关于隐私保护的标准、机制建立?
张德政强调AI发展非常快,很多现在关注的问题将来都会被解决,中医的生成式体系与生成式大模型互通。大模型的发展,会对未来就业产生较大冲击,但首要考虑的是安全问题。
南姣芬指出现在发布的模型分类准确性较高,但为什么落地推广不尽如人意?模型收集训练的数据很多是不可用的,与医院实际的数据不太匹配。
赵移畛提出模型训练质量,是由高质量的数据来保证,数据与模型要匹配。安全隐私问题也是要重点考虑。
经过与会人员充分讨论,大部分认为,医疗场景中虽然存在诸多痛点,重点讨论的就是安全性,包括数据的安全性和可信性,如患者如何去信任医生?医生如何去信任这个智能服务这条决策性?但这些问题后期通过技术均能逐步解决,而最终落地使用才是王道!
议题二:大模型与经典机器学习方法在医学落地时的技术路径差异?
山西财经大学信息学院数据科学与大数据技术教研室主任肖宁首先阐述问题背景,指出大模型结合知识库的方式虽已取得较好效果,但落地面临算力与数据两大核心问题;而传统机器学习算法虽可解释度高,却难以适配大数据场景,因此提出将两者结合的思路——通过机器学习算法与轻量化大模型结合,提升大模型的可解释性,同时借助大模型扩展传统机器学习算法的能力,使其更好地适应大数据场景。围绕这一融合思路及融合后的落地可能性,嘉宾们分别从科研与医院角度展开讨论。
张楠提出大模型特点为“大而全”,传统机器学习算法则是“小而精”,但在特定医学场景中,大模型的可行性存疑,尤其需关注数据量能否支撑其训练、运行效率是否满足实际需求。
南姣芬认为传统机器学习算法的核心优势是可解释性,不过其学习到的特征较少,且缺乏预训练大模型具备的经验先验能力;尽管大模型在学术界展现出良好潜力,但技术落地仍面临统一数据等现实问题。
杨宇聚焦大模型落地的具体难点,提出幻觉问题与成本问题是其主要障碍。
刘亮亮强调大模型真正面临的首要问题是数据可获取性,其次才是算力与算法问题,同时指出科研使用数据与现实场景数据存在较大差异,导致大模型落地效果不佳,提出将机器学习算法作为工具与大模型结合以推动更好落地。
侯守明从医学模型的核心需求出发,认为可信性至关重要,提出大模型在处理复杂场景时具有优势,传统机器学习算法则凭借可解释性立足,将大模型比作“全科医生”、机器学习算法比作“专科医生”的分工融合模式,或许是可行的落地思路。
赵雪专进一步辨析了大模型与机器学习算法的本质区别,并补充指出大模型在增量学习中存在的遗忘问题,为两者技术路径的差异与融合提供了新的思考角度。
经过大家讨论,大模型与经典机器学习在医疗落地时技术路径的差异,总体的思路是大模型技术落地时比较快捷,这种快捷是指在使用大模型的时候。大模型泛化性好但是可解释性差;而经典机器学习方法可解释性高,但是比较繁琐、泛化性弱,适合于数据量小的数据和小的应用场景。
议题三:大模型时代下经典机器学习如何通过迭代升级找到“生存法则”?
河南农业大学特聘教授刘亮亮指出大模型给科研尤其是高校科研带来困扰,发文章周期变长、要求提高,冲击原有机器学习方法。机器学习方法具有可解释性强、规则性强的优势。机器学习方法不被替代而是融合,数据量足够时,将SVM(支持向量机)等机器学习方法放在大模型后拓展可解释性。大模型用于理解和生成,小模型(机器学习)用于专业知识校正和规则探索。可在大模型前后放置机器学习方法,或先以机器学习筛选数据,再与大模型提取的图像信息拼接,增强模型性能与可解释性。
党豪认为传统机器学习算法可用于数据预处理和分类器设计,还提及相关实验及应用,深度学习兴起时追求端到端,后在预处理阶段更注重用传统机器学习算法处理数据。
刘奥祥认为机器学习和大模型应用应围绕最终用户,未来医疗应用应综合,经典机器学习应注重与大模型融合。
种大双从哲学角度谈大模型与经典机器学习,认为所学数学多为16、17世纪经典且基础的内容,还以医院问诊系统为例,指出大模型应用中缓存概念的作用,认为两者有竞争,应考虑应用场景。
赵雪专提出经典机器学习与大模型的两种结合路径:混合模式是流程分工,大模型处理非结构化数据,经典算法做高效决策;融合模式是架构耦合,将经典技术嵌入大模型,降70%-90%算力,本质都是以“轻”补大模型“重”。
刘亮亮提出大模型研究困境:自主开发耗时耗力,如团队搞图片、图文大模型,耗时耗力但效果未达预期。传统机器学习方法仍有潜力,可与大模型、深度学习方法结合发挥更大潜力。
穆辉宇指出大模型用途广泛,是当前研究热点,但是若一味追逐热点,如大模型All in One的趋势,可能永远追不上,关键还是看落地场景,实际落地时有可能简单方法就能解决问题。
孙丹阳认为大模型除推理能力外,交互能力强,能提供情绪价值,这是与机器学习在落地应用上的显著差异。大模型可解释性差,输入模型的数据存在冗余,传统机器学习在前端噪声滤除工作上或有帮助借鉴。
侯守明认为使用大模型解决问题方便且能提供有价值建议,思考能否利用大模型技术解决经典机器学习问题,为其总结特征和规则,助力其升级应用。
南姣芬认为机器学习优势可能会被淘汰,大模型或深度学习方法存在不可解释性,可能通过不确定性测量、知识图谱引导等非机器学习手段提高其解释性。
陆丽认为大模型与隐结构算法各有优劣,若二者结合、共同发展,或推动新技术出现,关键在于算法能否找到定位。
张磊认为其现有应用有局限,因自身特性及中医数据特点,未来在中医领域发展面临挑战。大模型存在不可解释性,中医诊断需长期经验和非标准化数据训练,数据缺乏,大模型在中医领域发展路程漫长。
董鹏永指出若无医疗专家参与,经典机器学习、大模型下等技术无落地应用场景,也无法带来技术进展和应用。
谢佳指出经典机器学习在中医部分落地场景已有较好应用,如利用CT扫描图片诊断肿瘤。经典机器学习任务明确,从零训练;大模型需海量数据预训练、调参等。经典机器学习与大模型应融合,数据量少或任务明确时,仍由经典机器学习处理。
刘亮亮强调本次探讨类似深度学习中Dropout机制与机器学习的关系,是两者融合成果,通过大模型测试表明其需数据引导,不必担心被完全取代。近年来机器学习与深度学习融合较多,如神经决策树、可微SVM等,既保留深度学习特性又兼具可解释性。
宋景琦认为机器学习与深度学习是不同赛道,深度学习、强化学习当下很火。经典机器学习算法虽不如他们,但潜力大,若能提升准确率,科研贡献度大。
李太忠认为传统算法某些点识别率低,使用大模型后识别率提升,但调参和优化后针对某些点识别率稳定,若增加样本量改进传统算法,识别率也有提升。思考此思路对中药某些类别是否有借鉴。
朱红磊认为经典机器学习与大数据各有所长,两者都有各自适应场景,如油车与电车,可将经典机器学习算法与大模型相结合,学习大模型推理能力。
经过大家热烈讨论,关于大模型时代下经典机器学习如何通过迭代升级而找到生存法则,少数认为会优胜劣汰,经典机器学习方法将来可能慢慢的不存在。大多数认为还是要走融合:可以在大模型之前,增加LLM数据的可靠性、校验性,还可以在大模型之后做融合,还有直接将机器学习用于某一个大模型的模块。
三
关键共识总结:
会议达成三点共识:
1)智能诊疗需重点解决安全性与可信性问题;包括落地应用时的安全性,数据的隐私性以及可信性,患者如何去信任医生,医生如何去信任智能系统提供的决策结果。
2)大模型快捷但可解释性差,经典方法精确但繁琐,应分场景使用。快捷指的是使用大模型技术落地部署,其泛化性好但是可解释性差;而经典机器学习方法可解释性高,但是比较繁琐,适合于数据量小应用场景。
3)经典机器学习可通过与大模型应用的前后段融合实现迭代升级。少部分观点认为会优胜劣汰,经典机器学习方法将来可能不存在。大多观点认为要走融合发展,可以在大模型之前,增加大模型数据的可靠性、校验性,还可以在大模型后段做融合,也可直接将机器学习附加到大模型的某个模块。
附:CCF YOCSEF郑州简介
中国计算机学会(CCF)青年计算机科技论坛(Young Computer Scientists & Engineers Forum,YOCSEF)是CCF于1998年创建的系列学术活动,是CCF创新机制的试验田,平等、民主的氛围吸引和造就了一批CCF的中坚力量,带动了学会的改革和发展。
CCF YOCSEF郑州成立于2005年,是中国计算机学会青年计算机科技论坛在全国的28个分论坛之一。CCF YOCSEF郑州将肩负引领学术前沿探索的重任,针对计算机学术、产业和技术点问题进行思辨,思其本质、辨其真伪。CCF YOCSEF郑州成员主要来自河南省内著名高校和计算机信息类企业中的专家教授与负责人。自2005年至今, CCF YOCSEF 郑州历任AC主席分别是周清雷(郑州大学)、甘勇(郑州工程技术学院)、寇怀忠(黄委会信息中心)、赵长升(河南金鹏信息)、赵长升(河南金鹏信息)、张素智(郑州轻工业大学)、张浩军(河南工业大学)、李玲玲(郑州航空工业管理学院)、钱慎一(郑州轻工业大学)、张丽(河南金鹏信息)、单征(信息工程大学)、贾俊亮(河南金明源信息)、邓淼磊(河南工业大学)、夏冰(中原工学院)、吴怀广(郑州轻工业大学)、贾丹丹(长城计算机)、刘福东(信息工程大学)、刘云龙(省保密协会)、张磊 (河南大学)、任建吉(河南理工大学)、现任主席陆丽(嵩山实验室)。
CCF YOCSEF 郑州活动赞助欢迎联系。联系人:陆丽(18437128000,微信同号)。
供稿丨许玉龙、贺磊
初审丨穆辉宇、赵雪专
终审丨陆丽
所有评论仅代表网友意见