在深度模型成功应用和获得较好效果的背后是网络深度和复杂度的逐步加深,参数量和训练数据的不断增加。由网络模型复杂度增加造成的模型训练时长和成本的提升,也正在逐步拉开企业与高校,乃至重点高校和普通高校间的差距,甚至限制了部分高校的科研方向。因此,在大模型背景下对于算力和数据不足、条件有限的高校和个人,如何有效利用预训练大模型,并结合轻量级模型的优势进行科研是非常有必要讨论的话题。
在此背景下,2024年1月6日上午,由中国计算机学会主办,CCF YOCSEF保定承办的“算力不够拿什么来凑?大模型时代下CV工作者如何有效进行科研”技术论坛在保定职业技术学院(西校区) 笃学楼211举办。本次论坛由YOCSEF保定AC委员、河北保定职业技术学院冯士恩和YOCSEF保定主席、河北大学电信学院王珺担任执行主席。YOCSEF保定学术秘书、北京青城博雅教育科技有限公司尹红涛担任线上主席。论坛邀请了北京交通大学软件学院副教授魏翔、华北电力大学(保定)自动化系张诗吟、北京交通大学计算机与信息学院副教授卢思洋、北京智谱华章科技有限公司联合创始人鄢兴雨、华北电力大学计算机系教师王强、思腾合力解决方案架构师周子露作为参会引导发言和思辨嘉宾,并吸引了来自学术界和工业界20余人参会。
在引导发言阶段,北京交通大学软件学院副教授魏翔,从模型的压缩和模型fine tuning的角度出发对数据和算力资源受限时的科研进行了讲解,并给出了《数据资源受限条件下的半监督学习》。紧接着华北电力大学(保定)自动化系张诗吟,就如何解决数据资源受限的问题,给出了半监督和交互式的数据集标注,并给出了《大模型时代下交互式分割的机遇与挑战》的报告。最后北京交通大学计算机与信息学院副教授卢思洋任务的角度出发,认为在算力受限的情况下可以针对小样本任务进行科研,并给出了《基于深度学习的清代古籍识别研究》的报告。
报告结束后,由CCF YOCSEF保定主席、河北大学电信学院王珺为三位引导发言嘉宾颁发感谢牌,并向他们为本次论坛活动所做出的贡献表示感谢。引导发言环节结束,线下参会者进行了合影留念。
接着,论坛进入思辨环节。与会嘉宾们围绕“小模型有没有可能达到和大模型具有相近的性能指标?”“算力受限时的科研思路有哪些?”以及“继大模型之后的CV技术将走向何方?”等三个议题进行讨论开展了热烈的讨论。以下是对思辨环节内容的总结与凝练:
大模型是具有一定有限能力参数规模的,小模型在固定场景下和10倍以上数量模型结果相差比较大。针对小模型,限定场景下会失去泛化能力。小模型在一些限定的场景下的性能能够比拟大模型。
可以在大模型的基础上做一些微调等。兼顾,发展大模型的同时,小模型不应该被摒弃。在一些特定领域,需要轻量模型。第二,算力的整合和统一,使用一个云计算的框架将学校算力进行整合。可以租赁云平台,进行短期计算。第四,另辟蹊径,结合自身团队、学校,确定研究方向做一些考量,做一些算力要求不高的方向。
图片、视频非结构化数据,机器无法直接分析。CV技术将视觉数据转化特征,成为可以被机器理解的数据。研究多模型融合技术,即如何融合不同模型。多模态融合是未来发展方向。根据给定文本叙述实现对图片或视频的编辑。未来可能将更加依赖强大的计算能力。
思辨结束后,由CCF YOCSEF保定AC委员、保定职业技术学院冯士恩为三位思辨发言嘉宾颁发感谢牌,并向他们为本次论坛活动所做出的贡献表示感谢。