近年来,智慧医疗在图像和文本处理等技术的迅猛发展推动下取得了突飞猛进的进步。ChatGPT的横空出世在众多学习任务领域也表现惊人,引发了新一轮的生成式大模型热潮。过去半年,国内外众多企业科研机构竞相推出各自的大模型,打响“百模大战”。大模型在通用领域取得的效果有目共睹,同时也给智慧医疗带来了新的发展机遇,当然也带来了诸多挑战风险。
在此背景下,2023年8月12日,由中国计算机学会(CCF)主办、CCF YOCSEF青岛学术委员会承办、中国海洋大学信息科学与工程学部、哈尔滨工业大学(威海)计算机科学与技术学院联合协办的“智慧医疗大模型:中国的突围之路在何方?”观点论坛在青岛举办。此次论坛由YOCSEF 青岛委员、中国海洋大学副教授蔡青和YOCSEF青岛AC学术秘书、哈尔滨工业大学(威海)副教授晁国清担任执行主席,YOCSEF青岛AC、山东科技大学副教授李哲和YOCSEF青岛委员、青岛质点数字科技总经理牛长乐担任执行秘书。中国海洋大学信息科学与工程学部副部长郭忠文教授受邀担任致辞嘉宾,中国海洋大学仲国强教授、哈尔滨工业大学赵森栋副教授、青岛滨海学院肿瘤防治中心吴铁成主任医师受邀担任引导嘉宾,哈尔滨工业大学(威海)隋典伯博士、中国海洋大学张树刚博士、烟台大学吕骏副教授、青岛大学附属医院马俊伟副主任医师、东北师范大学计算生物研究所王晗所长、烟台大学郑强教授受邀担任思辨嘉宾出席本论坛活动。CCF YOCSEF青岛2021-2022主席李昕、YOCSEF青岛2022-2023主席包永堂以及来自新闻媒体、科研院所等近50人参加了此次论坛活动。
论坛活动主要分为致辞、引导发言、思辨讨论和会议总结四部分。
在致辞环节,中国海洋大学信息科学与工程学部副部长郭忠文教授首先对大家的到来表示欢迎、介绍了中国海洋大学信息科学与工程学部的整体情况、并对大模型的发展给出了自己的见解,最后预祝本次论坛活动圆满成功。
在引导发言环节,中国海洋大学的仲国强以“基于深度学习的医学图像处理”为题介绍了深度学习的发展简史和智慧医疗大模型的常见类型,并介绍了自己课题组在智慧医疗图像处理方面所做的一些工作,国强认为智慧医疗大模型的应用场景是极其广阔的,面临的问题和挑战也很多。
哈尔滨工业大学的赵森栋以“面向智慧医疗的大语言模型微调技术”为题,对大语言模型进行了讲解,并介绍了大语言模型的三大关键核心技术:大规模预训练模型、指令微调和基于人类反馈的强化学习。随后他又对大语言模型在垂直领域智慧医疗应用遇到的问题进行了分析,认为医学领域数据量小、数据质量低、存在数据隐私保护,专业知识复杂等特点,并针对这些特点给出自己的见解:医疗领域需要数据和算力需求小,需要定制化、私有化大语言模型。随后,又对大语言模型的微调技术进行详细的讲解并介绍了自己所做的工作--“本草”中文医学大模型。
青岛滨海学院肿瘤防治中心的吴铁成以“肿瘤防治与人工智能”为题介绍了对疾病的发病理论、预防和治疗等问题的传统健康观点和态度。他引出对于疾病的科学认识起源“生命的细胞学说”,认为一切生命的关键问题都需要到细胞中寻找答案,并介绍了医学研究最前沿的研究领域细胞水平监控病情变化。他主要从还原论和系统论两个方面进行了介绍,涉及精准医学和系统生物学,最后还对人工智能在临床应用的前景进行了展望。
在思辨讨论环节,与会嘉宾主要围绕三个议题展开。
议题一:智慧医疗大模型的实现主要面临哪些数据问题和算力问题,数据和算力中的哪一个是阻碍智慧医疗大模型到来的关键问题?
哈尔滨工业大学(威海)的隋典伯和中国海洋大学的张树刚针对该议题进行了思辨引导发言。 隋典伯认为医学数据规模小,算力价格也相对便宜,认为医疗数据是关键问题。此外,他还指出模型设计实际上也是医疗大模型实现面临的另一个重要问题。张树刚认为生物信息和医疗应该区分来看,大模型如果面向医疗领域,数据应该是关键问题;如果面向生物信息,算力应该是关键问题,并阐释了生物信息海量的数据需要强大的算力支撑。
与会嘉宾针对该议题展开了激烈的思辨,青岛科技大学的刘金环认为在数据方面主要问题是数据安全和隐私保护,数据是关键的因素。没有数据,医疗大模型的落地就成为空中楼阁。但是如果遇到海量数据,算力也将成为关键问题。山东科技大学的包永堂认为从零构建医疗大模型,算力是关键问题;如果微调,数据是关键问题。赵森栋认为医疗数据是关键问题,因为医生太忙,而且也没有动力去做智慧医疗。吴铁成和马俊伟都谈到医生工作负担很重,人工智能可以辅助医生做决策减轻医生负担,医疗领域的需求挖掘需要人工智能专家和医生的双向交流合作。王晗认为数据和算力都不是问题,大多数的临床问题不需要大模型,大模型只对通用的医疗才起作用,认为可以做针对具体疾病领域的医疗大模型。
议题二:智慧医疗大模型会给我们带来哪些机会和风险?
烟台大学的吕骏和青岛大学附属医院的马俊伟针对该议题进行了思辨引导发言。吕骏认为风险主要来自病人信息的泄露,不过她更多的看到的是机遇,随后结合她的四个研究方向:多通道线圈增强重建、多对比度超分辨重建、联合图像重建和分割、联合运动校正及重建阐述了可能存在的医疗大模型研究方向。马俊伟从医生的角度谈到了病人看病难、医生负担重、神经外科发展空间大,这都是医疗大模型或人工智能发挥作用的空间,这也需要研究人员和医生的双向奔赴。
烟台大学的王莹洁从计算机和自动化的理论基础差异出发,谈到医疗大模型需要更大的学科融合才可以实现落地应用,她认为医疗大模型带来的主要风险还是个人隐私的泄露。杜文彬认为垂直领域的大模型数据不允许上传云端服务器,不能使用公共算力,还要做好隐私计算。仲国强认为生物医学工程和基因治疗的未来成功可能会使人类寿命延长,有可能带来人口爆炸,这对人类社会也是一个潜在的风险。中科院人工智能创新技术研究院的姜丽莉认为医疗大模型可能会推动远程手术的早日实现。中国石油大学(华东)李昕认为科研人员更应该考虑模型构建和算法设计等工作,思考大模型是不是真正发挥了作用,是否可以切实减轻医疗工作者的负担。
议题三:对我国而言,如何抓住机会化解风险解决难题实现智慧医疗的国际突围赶超?
东北师范大学的王晗和烟台大学的郑强针对该议题进行了思辨引导。王晗认为大模型甚至人工智能在临床应用实际很少,我们的很多医院信息化建设还没做好,目前的医学应用更多的关注了影像,未来需要关注多模态,对可解释性、医疗需求甚至各方面利益等问题都应关注并解决才能推动我国智慧医疗的跨越式发展。郑强认为医疗大模型是国家的重大战略需求问题,现在面临的是怎么做的问题,他认为实验设计是关键问题,需要医生从算法的角度给出实验设计的方案。针对单个疾病,医疗大模型可以按照科室或疾病分类进行专门的大模型构建;针对落地实用,还需要对大模型进行体量化的训练轻量化的部署;针对数据隐私问题,需要进行数据脱敏,实现数据的规划化伦理化。通过这些操作,我们的智慧医疗一定可以得到更好的发展。
吴铁成、赵森栋、王晗和郑强都认为在我国,医生不懂计算机,计算机人才不懂医学,医学和计算机复合人才的培养是非常必要并需要深入探索的一个重要问题。王晗、郑强、宫文娟都认为医疗数据的信息化标准化是实现智慧医疗面临的另一个重要问题。赵森栋、吕骏、张树刚都提到科研同质化问题,认为大模型的过度火热使得国内太多人跟踪这一热点技术,但却难以完成超越,并认为科研人员还是要把研究落在重大科学问题上长年积累攻坚才可能实现原创的重大技术发现。李昕认为我国医疗的基础数据大,优势明显,但需要人工智能研究人员充分整理挖掘这些数据,做出一个可以解决实际问题的医疗领域专用大模型。
最后,YOCSEF青岛2022-2023主席包永堂进行会议总结发言。他首先肯定了这次论坛活动的成功,并感谢了所有引导嘉宾思辨嘉宾和所有与会者的支持,也希望大家会后可以进行更深入的交流,在智慧医疗领域进行更多的合作 ,为我国智慧医疗在国际范围的突围赶超贡献我们的一份力量。