生成式大模型“幻觉”检测技术的实现路径与挑战
2023年8月13日(星期日)13:30 - 18:00
论坛编号:CCF-Yo-23-066
地 点:兰州奥体如意华玺酒店黄河厅
主 办 方:中国计算机学会
承 办 方:CCF YOCSEF兰州
协 办 方:兰州飞天网景信息产业有限公司
执行主席:李子荣(兰州财经大学) 郑炜豪(兰州大学)
面向对象:CCF会员、高校科研机构以及相关企业技术人员
论坛背景:
生成式人工智能(AI)大模型的出现开启了由AI生成内容的新时代。它能够生成各种真实、富有创意的信息,包括文本、图像、音频、视频、代码等。尽管生成式AI已经取得了一定成功,但是在其发展过程中“幻觉”问题开始显现。所谓的“幻觉”即AI生成的内容不存在于现实世界,而是大模型自身想象的产物。例如,面对用户的提问,ChatGPT等工具会杜撰出一些看上去像是权威正确的虚假信息,包括不存在的书籍和研究报告、假的学术论文和法律援引等。这些真假难辨的“幻觉”内容和虚假的“权威”信息开始引发大众新的担忧和恐慌。
CCF YOCSEF兰州分论坛在前期调研的基础上,举办本次论坛,邀请资深学者、领域专家和青年学者共聚一堂,针对如何检测生成式大模型的“幻觉”内容进行探讨,以期提出针对此问题形成有效可行的技术方案。
论坛议程:
时 间 | 内 容 |
13:30 – 14:00 | 签到、开场视频播放 |
14:00 – 14:05 | 背景及嘉宾介绍 |
14:05 – 14:10 | 文化介绍:李晓旭 CCF YOCSEF兰州主席 |
第一阶段 引导发言 | |
14:10 – 14:30 | 引导发言1:曹娟,中国科学院计算技术研究所 |
题目:《伪造检测中的取证和溯源技术》 | |
14:30 – 14:50 | 引导发言2:刘毅,人民网传播内容认知全国重点实验室 |
题目:《生成式人工智能的应用和治理》 | |
14:50 – 15:10 | 引导发言3:龙翀,清华大学博士 |
题目:《大模型安全性研究》 | |
15:10 – 15:30 | 茶歇、合影 |
第二阶段 思辨讨论 | |
15:30 – 17:30 | 思辨议题1:现阶段大模型生成的“幻觉”内容检测面临哪些挑战? 思辨议题2:目前可应用于“幻觉”内容检测的技术及其局限性。 思辨议题3:如何构建面向生成式大模型“幻觉”内容检测的有效技术方案? |
17:30 – 17:40 | 论坛总结 |
引导嘉宾:
曹娟,中国科学院计算技术研究所研究员,博士生导师,数字内容合成与伪造检测实验室主任。中国科学院大学岗位教授。入选中科院“青年促进会”首批成员。计算所“十四五”规划重点培育方向“数字内容伪造与检测”的带头人。成果获2022世界互联网大会领先科技成果奖,北京市2020年“三八红旗奖章”和2020年北京市科技进步一等奖。近年来发表领域主流国际期刊和会议论文60余篇,研究成果Google Scholar累计引用3000余次。申请专利40项,19项已授权。举办2019年“互联网虚假新闻检测挑战赛”和“虚假新闻检测学术论坛”,以及2020年“科技战役-大数据公益挑战赛”系列中的“疫情期间虚假新闻检测”比赛,公布了目前业内最大规模的中文多模态虚假新闻数据集,鼓励研究人员探索基于多种模态的虚假新闻自动检测方法。作为项目负责人围绕多媒体内容安全方向承担十余项国家级重要课题,成果在多个国家部委和重要企业中落地应用。
刘毅,中国科学院计算技术研究所博士,人民网传播内容认知国家重点实验室研究员,主要研究领域包括大规模语言模型、大规模分布式训练、语义计算和推荐系统,主持人民网主流价值大模型研发。曾任职腾讯主持研发腾讯万亿参数广告大模型和“混元”大模型框架,产出混元NLP模型在国内最权威中文语言理解评测集合(CLUE)榜单登顶;混元多模态模型在国际跨模态VCR等榜单取得了大满贯。
龙翀,清华大学计算机系本科及博士毕业,曾就职于雅虎北京研究院、亚马逊北京搜索部门、葫芦北京搜索团队,以及在蚂蚁金服集团、阿里巴巴集团曾担任高级算法专家等职务。主要研究方向为自然语言处理、大模型安全、智能安全风控、智能投顾、智能客服等。
思辨嘉宾:
孟雷,山东大学软件学院,教授、博导,山东省泰山学者青年专家,CCF YOCSEF济南主席,长期从事多媒体知识挖掘与内容表征的机器学习理论与技术研究,在TKDE、MM、AAAI、SIGGRAPH等期刊会议发表论文50余篇,获中国发明协会发明创业奖创新奖一等奖;聚焦智慧家庭、智慧社会治理等民生领域关键技术突破和产业化,主持国家重点研发计划“社会治理与智慧社会科技支撑”课题,入选济南市“新高校20条”引进创新团队计划。
冯骁骋,哈尔滨工业大学计算学部社会计算与信息检索研究中心副教授、博导。智能科学与技术系副主任,中文信息处理黑龙江省重点实验室主任助理。研究兴趣包括自然语言处理、文本生成、机器翻译等。在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B类国际会议及期刊发表论文30余篇。据Google学术统计,论文引用数量超过3500次,担任NIPS、ICML、AAAI、IJCAI、ACL等国际会议程序委员会高级/普通成员;兼任鹏城实验室双聘副研究员、中国中文信息学会自然语言生成与智能写作专委会副秘书长、中国计算机协会哈尔滨YOCSEF主席等。
王国安,兰州飞天网景信息技术有限公司副总经理,先后担任甘肃万维信息技术有限责任公司项目经理、软件事业部经理、技术总监,副总经理,兰州乐智教育科技有限责任公司副总经理。负责产品研发和技术发展,带领团队完成了“教育云平台”、“智慧云校园”等多个项目,完成了甘肃电信智慧小区(社区)平台的研发、上线和运营。获得中国电信集团公司“十二五”科技创新奖“优秀工作者”称号。
执行主席:
李子荣,兰州财经大学副教授,工学博士,主要研究方向为医学影像计算机辅助诊断、时间序列预测、数据挖掘与分析、机器学习等方面。主持多项省市级科技计划项目,省科技重大专项骨干成员。目前担任CCF YOCSEF兰州学术秘书。
郑炜豪,兰州大学信息科学与工程学院青年研究员。担任CCF YOCSEF 兰州AC委员、IEEE SMC“心理生理计算”专委会联合主席、中国图形图像学会脑图谱分会委员、中国医学救援协会神经生物反馈干预与治疗分会委员等。在IEEE TAFFC、Neuroimage、J Neurosci、Cereb. Cortex等期刊发表论文50余篇。主持科技创新2030-“脑科学与类脑智能”重大项目课题、国家自然科学基金青年项目等,并作为项目骨干参与国家重点研发计划、国家重大科研仪器研制项目等。