分论坛 > 苏州 > 新闻动态
“大模型背景下,知识图谱如何 更好赋能行业智能?”技术论坛
2023-09-25 阅读量:363 小字

2023年9月16日,CCF YOCSEF苏州技术论坛“大模型背景下,知识图谱如何更好赋能行业智能?”(论坛编号:CCF-YO-23-148)在苏州大学天赐庄校区举办。本次论坛由中国计算机学会主办,中国计算机学会CCF YOCSEF苏州学术委员会承办,得到了苏州大学支持。来自苏州高等院校、科研院所和企事业单位的专家学者、企业代表,以及CCF YOCSEF苏州AC委员等30余人参加了论坛。

Fig9

1:本次会议全体参与人员合影

随着ChatGPT等一系列大型模型的发展,通用人工智能技术的潜力开始显现。认知智能代表了人工智能技术发展的高级阶段,通常被定义为赋予机器理解数据、知识表达、逻辑推理和自主学习等方面的能力。然而,在大模型的背景下,如何更好地将知识图谱应用于行业智能技术,这个问题却未能在学术界和工业界得到充分的深入讨论。

本次论坛执行主席是CCF YOCSEF苏州的许佳捷和谷飞。本次论坛引导发言环节由YOCSEF苏州谷飞主持,开场致辞环节,对YOCSEF文化进行了介绍,对论坛的背景以及嘉宾作了精彩的引导发言。

谷飞老师

2:执行主席-谷飞

引导发言环节,来自华东理工大学阮彤教授作了题为《知识增强的医疗大模型应用架构》的报告。分享了有关医疗大模型的应用架构的重要信息,她强调了医学领域的特殊性,并详细分享了知识图谱结合大模型在临床信息系统中的巨大机遇和挑战。

1

3:阮彤作为引导嘉宾发言

苏州大学曹自强副教授作了题为《无需适配器的多模态大语言模型》的精彩报告。重点讨论了多模态大语言模型(MLLM),首先详细分析了主流MLLM模型以及他们的优缺点,其次介绍了多模态编码器-ALBEF来解决如何感知prompt的图像编码和⾼代价的adapter训练两个问题。

曹志强 - 副本

4:曹自强作为引导嘉宾获得感谢牌

苏州大学的李俊涛副教授作了题为《OPENBT5-开源双语语言基座模型训练与应用》的报告,介绍了OPENBT5,这是苏州大学提出的第一个开源的双语语言基座大模型。他详细解释了如何设计这个模型的方案,包括数据方案和算力方案。他还分享了该模型的训练流程、增强策略以及评测结果。详细阐述了大模型应用范式、推理能力以及大模型与专用模型的关系。

Fig4.2

5:李俊涛作为引导嘉宾获得感谢牌

思辩发言环节,许佳捷主持,与会专家就“知识图谱在落地过程面临哪些困难,是否可以通过大模型解决?”、“知识图谱V.S.文本检索,谁是大模型的更好补充?”、“实际业务中,大模型该如何调用知识图谱中的知识?”三个辩题进行了激烈讨论。参与者除了引导嘉宾和执行主席之外,思辨的嘉宾有引导发言的嘉宾,执行主席许佳捷和谷飞,还有YOCSEF总部联系AC鄢兴雨,YOCSEF苏州09-10主席、苏州科技局姚建民,YOCSEF苏州AC委员、西交利物浦大学副教授李华康,微软的干强,南京大学的张绍群,上海擎朗智能科技有限公司的刘斐,上海特高信息技术有限公司的许文波,苏州大学瞿剑峰,苏州畅达软件研发有限公司的史国良等。


Fig6

6:思辨环节

思辨问题一:知识图谱在落地过程面临哪些困难,是否可以通过大模型解决?

与会多位嘉宾分别从产业界与学界总结了当前知识图谱领域的发展情况,特别关注了知识图谱的落地应用过程中所面临的一系列挑战。这些挑战主要包括图谱数据的获取与维护、知识图谱的稀疏性以及可扩展性等方面。

首先,就图谱数据的获取与维护问题而言,与会嘉宾一致认为,这是知识图谱建设的重要瓶颈之一。对此,鄢兴雨表示,企业需要不断努力以获取和更新图谱数据,以确保其信息的准确性和时效性。除此之外,李华康、王超、张绍群等人从学界的角度发表了看法,认为研究人员应当探索各种技术和方法,以提高图谱数据的质量和更新效率。这方面的工作至关重要,因为一个优质的知识图谱是支撑各种智能应用的基础。

Fig7

7:思辨环节鄢兴雨发言

其次,干强、李华康、瞿剑峰还强调了知识图谱的稀疏性问题。知识图谱往往包含了海量的知识点,但其中许多链接和关系可能相对稀疏,这限制了某些应用的效果。解决这一问题需要不断的知识扩充和链接的建立,这也是知识图谱持续演化的一部分。

最后,与会嘉宾一致强调了当前大型语言模型为知识图谱构建和应用带来的全新机会。这些大模型具备强大的自然语言处理和文本理解能力,可以用于自动化地构建和更新知识图谱,同时也可以用于更智能的知识图谱搜索和推理。这为知识图谱的发展开辟了新的道路,也促使产业界和学界加大了对大型语言模型的研究和应用投入。

Fig8

8:思辨环节瞿剑峰发言

综合而言,与会嘉宾对知识图谱领域的未来充满信心,认为通过结合大型语言模型的力量,知识图谱将会展现出更为广泛的应用前景。

思辨问题二:知识图谱V.S.文本检索,谁是大模型的更好补充?

鄢兴雨、仇鹏、王超等多位嘉宾均认为,大模型具有强大的语言生成和理解能力,但是存在强语言、弱知识.不可控等问题,难以直接保证业务所需的精度。也就是说,大模型则可以在更广泛的语境中进行语言生成和推理,而知识库可以提供精确的知识表达。它们之间存在很强的互补性。综合使用这两种方法,可以进一步提高系统的智能和表现能力。因此,在大模型中引入任务所需的知识库知识是技术落地的关键。

刘老师

9:思辨环节刘斐发言

而知识库有不同的组织形式,最有代表性的包括预料检索和知识图谱查询。在此背景下,我们有两种方式,可以将大模型与文本检索引擎结合。也可以调用知识图谱,以此实现外部知识的注入。相比较,“大模型与文本检索引擎结合”这种方式适用于需要理解自然语言文本的应用,例如问答系统、情感分析、文档摘要等。大模型能够处理非结构化文本,并且在广泛的语言理解任务中表现出色。“大模型调用知识图谱” 适用于结构化数据和实体关系的查询,例如实体关系抽取、实体链接、关系推理等。知识图谱提供了结构化的知识表示,有助于精确的信息检索和关系分析。知识图谱的推理可以基于规则或逻辑的推理。这种方法适合于需要准确的、基于已知规则的推理任务。

思辨问题三:实际业务中,大模型该如何调用知识图谱中的知识?

鄢兴雨、刘斐、仇鹏等多位嘉宾探讨了实际业务中大模型和知识图谱落地情况。他们认为大模型可以生成知识图谱的查询,类似于Text2SQL的方式。这样的查询可以包括头实体、尾实体和关系,用于从知识图谱中检索相关信息。这种方法适用于需要精确的结构化查询的任务,如实体关系抽取或精确的知识图谱查询。其次对于已知的事实或关系,可以将大模型的回答与知识图谱中的对应实体和关系进行匹配,以确保一致性。总的来说,大模型和知识图谱的相互校验是为了提高准确性和可信度。这需要综合考虑任务需求、数据质量、逻辑一致性等因素,并根据具体情况采取适当的校验策略来确保准确性。

李华康

10:思辨环节李华康发言

本次论坛现场讨论十分激烈,参会人员意犹未尽,希望以后围绕认知智能评价体系与大模型对产学研的影响继续开展深入思辨。

CCF聚焦