智能图形学作为人工智能(AI)与计算机图形学(CG)相结合的新兴领域,在近年来取得了令人瞩目的进展。智能图形学的不断演进和完善开辟了计算机图形学在传统的电影、游戏和特效等领域之外的更广泛的应用领域,如智能制造、无人系统、文物保护以及医疗健康等。这一发展推动了三维数字中国的全新变革,为满足国家的重大需求提供着不可或缺的技术支持。AI与CG的紧密结合不仅为传统图形学注入了新的活力,而且为各行业带来了更高效、更创新的解决方案。然而,随着技术不断推陈出新,智能图形学也面临着一系列全新的问题和挑战。
为此,中国计算机学会(CCF)青年计算机科技论坛(YOCSEF)广州分论坛学术委员会于2023年12月2日举办了“AI + CG: 智能图形学的机遇与挑战”技术论坛,共论AI + CG的如何加、加之何利、未来何去,旨在为智能图形学的未来发展提供独到见解和创新的解决思路。本次论坛由CCF主办,YOCSEF广州学术委员会、广东工业大学计算机学院、广东工业大学创新创业学院共同承办。YOCSEF广州AC委员朱鉴(广东工业大学)和YOCSEF广州2022-2023副主席谢光强(广东工业大学)共同担任论坛执行主席,广东恒电信息科技股份有限公司提供赞助支持。此次论坛邀请了徐雪妙(华南理工大学)、方美娥(广州大学)、朱磊(香港科技大学(广州))作为引导发言嘉宾,孟敏(广东工业大学)、高博宇(暨南大学)、张天豫(广汽研究院)作为思辨嘉宾。
YOCSEF广州往届主席谭台哲(广东工业大学),YOCSEF广州优秀AC委员刘雷(广东科技报),YOCSEF广州现任主席龙锦益(暨南大学),YOCSEF广州现任副主席李冠彬(中山大学)、刘同来(仲恺农业工程学院),YOCSEF广州AC委员胡建芳(中山大学)、蓝连涛(华南农业大学)、刘伟莉(广东技术师范大学)、黄培涛(唐邦信息科技),战荫伟(广东工业大学),曾碧(广东工业大学),冼楚华(华南理工大学),张怀东(华南理工大学),甘文生(暨南大学),周燕(佛山科学技术学院),刘翔宇(佛山科学技术学院),陈光明(广东财经大学),郭建军(仲恺农业工程学院),陈云华(广东工业大学),陈炳丰(广东工业大学),黄国恒(广东工业大学),杨振国(广东工业大学),孙宇平(广东工业大学),罗玉(广东工业大学),高静(广东恒电信息科技),罗兴勇(超擎科技)等来自广东地区多所高校及企事业单位共60多人参加了此次论坛。
在论坛开幕环节,首先由本次论坛执行主席朱鉴逐一介绍与会嘉宾,再由YOCSEF广州主席龙锦益介绍YOCSEF文化内涵。龙锦益对YOCSEF的含义、理念、分论坛以及YOCSEF广州的特色文化等内容作了介绍。
暨南大学龙锦益教授介绍YOCSEF文化
随后,朱鉴介绍了论坛背景。本次论坛以"AI+CG:智能图形学的机遇与挑战"为主题,旨在探讨在AI技术蓬勃发展的当下,计算机图形学所面临的机遇和挑战,希望本次论坛为该领域的发展提供有益的思考和建议。
论坛执行主席朱鉴介绍论坛背景
- 引导报告环节
华南理工大学计算机科学与工程学院徐雪妙教授以“基于知识引导的场景智能理解和生成技术”为题,紧紧围绕智能视觉技术在实际应用中面临的四大挑战:复杂场景、跨域场景、数据缺失和低质量视觉数据,描述了一系列基于先验知识引导的场景智能理解和生成创新技术,徐雪妙还分享了其团队当前的工作进展并结合实际案例描述研究工作的落地应用情况。
徐雪妙教授作引导报告
广州大学计算机科学与网络工程学院方美娥教授的报告以“AI + CG + 三维医学影像分析”为题,首先简述三维医学影像与自然图像的差别,同时探讨分析了当前三维医疗影像智能分析研究的现状、问题和趋势。接着,方美娥教授重点介绍了如何将计算机图形学及临床医学两个领域的理论与方法结合,并运用到AI医学影像分析中。同时,结合例子说明了医疗影像与图形学的几何建模相结合的有效性,最后还提出了“AI + CG + 三维医学影像分析”相关的若干探讨性问题,引发了与会者的思考和讨论。
方美娥教授作引导报告
香港科技大学(广州)机器人与自主系统学域及电子与计算机工程学系联署助理教授朱磊的报告以“恶劣天气和光照下的复原研究:从静态图像到动态视频”为题,首先通过一个去除图像纹理和恢复图像背景的具体案例,解释了图像智能感知的概念,接着结合不同场景介绍了解决户外视觉系统在恶劣天气条件下图像/视频恢复的创新方法,最后重点介绍了复杂光照下产生的阴影和高光等相关的图像/视频的复原和检测的智能感知工作。
朱磊教授作引导报告
- 思辨发言环节
在引导报告之后,论坛进入思辨环节。思辨嘉宾广东工业大学计算机学院孟敏副教授、暨南大学网络空间安全学院高博宇副教授、广汽研究院张天豫博士以及与会嘉宾围绕“智能时代,传统图形学是否面临瓶颈?理由何在?”“如何突破壁垒将AI与CG更紧密地结合?”“图形学‘智能化’是不是国内图形学实现弯道超车的一次重要机遇?”等议题展开了深入思辨,总结得出以下观点。
论坛执行主席谢光强主持思辨议题
思辨议题一:智能时代,传统图形学的发展是否正面临瓶颈?理由何在?
- 衍生议题1:若是,拥抱AI、发展智能图形学是不是突破瓶颈的利器?
- 衍生议题2:若不是,计算机图形学未来发展潜力与方向何在?
针对此议题,一些嘉宾认为传统图形学发展到现在确实面临瓶颈,拥抱AI是传统图形学未来发展的必然趋势。徐雪妙指出传统图形学在算力、采集技术和效率等方面遇到了瓶颈,认为AI给图形学带来了强大的生命力。孟敏强调深度学习并非解决所有问题的灵丹妙药,拥抱AI将面临一些诸如复杂拓扑、不规则数据建模、算力需求等新的挑战。高博宇提出随着人工智能的迅猛发展,大型模型的涌现极大地提升了生成模型的速度。然而,他也指出大型模型在准确性和用户精细控制上面临一定挑战。
另一些嘉宾则主张传统图形学和智能图形学之间并不存在明确的分界线,两者应该共同发展。方美娥提出了搭建文工合作平台的设想,通过将人文艺术与智能图形学这两个领域交叉融合,来有利于文化传承和艺术呈现。张天豫从产业界角度出发,强调两者的发展应相互促进,认为在实际应用中,传统图形学方法在可靠性和泛化性方面仍具优势。战荫伟提出要从发展的角度看待图形学,强调图形学一直在不断丰富自身内涵,如今在智能时代更应融入AI新元素。
除此之外,朱磊强调在拥抱AI时,广大研究者的聪明才智完全可以在人工智能领域得以发挥,呼吁更多人投入到这一领域的研究和实践中。李冠彬指出应当根据问题的性质选择使用AI或传统方法,不应过分依赖AI工具,而是集中注意力解决实际问题。
思辨议题二:AI赋能CG虽然已有约十年,但智能图形学训练所需的3D数据仍然是稀缺的并且往往是不规则的无结构数据,而且训练的算力要求高,现有AI算法也难以直接应用。如何突破壁垒将AI与CG更紧密地结合?
衍生议题:AI赋能CG的关键在于数据、算力还是技术?
论坛执行主席朱鉴主持思辨议题
针对此议题,一些嘉宾认为AI赋能CG的关键在于数据。冼楚华指出,3D数据的多样性远超过文本和图像的统一规范,导致训练模型变得复杂,成为AI与CG结合发展较晚的原因之一。张怀东补充指出,昂贵的3D采集设备也成为一个制约因素,增加了数据获取的成本,对此可以构建仿真平台,以获取各种不同格式的数据。
另一些嘉宾则认为技术是AI与CG结合需要首要考虑的壁垒。谭台哲指出虽然AI已经具备强大的计算能力,但在处理复杂结构时,仍面临独特挑战,如何实现与人类相似的认知成为关键难题。郭建军指出,技术是数据、算力的根基,没有技术支持,数据和算力就无法得以应用。
针对算力问题,高博宇提出,算力在一定程度上是否构成壁垒取决于所从事问题的规模。对于小规模项目而言,算力并非障碍,若涉及到大型模型的研发,解决算力问题就需要实力雄厚的企业介入。张天豫认为算力问题相对容易解决,但更为困难的壁垒在于学术界与产业界之间存在的鸿沟,并呼吁学术研究应更紧密地服务于实际产业需求。
除此之外,孟敏指出,推动AI和CG结合的一个关键点在于促进数据和模型的开源。在技术方面,孟敏建议在多元多模态技术上多做考虑,特别是与CG领域相关的交互技术,如手势识别、面部表情识别和语音等。通过结合多元多模态技术,可以促进AI+CG的突破。
思辨议题三:图形学“智能化”是不是国内图形学实现弯道超车的一次重要机遇?
- 衍生议题1:CG领域是否会像CV领域被深度学习技术全面“攻占”?
- 衍生议题2:NeRF 作为一种当前AI与CG交叉融合的热门技术,其面临的技术困难与挑战何在,未来发展趋势如何?
针对此议题,嘉宾们对于图形学“智能化”的未来都持有积极态度,同时也意识到其中的挑战和困难,他们在技术、理论和应用层面提出了各自的看法和建议。
在技术层面,高博宇和孟敏指出目前的困难主要集中在模型的可解释、精准性和交互功能方面。张天豫表示算力需求是一大难点,还指出如果要实现弯道超车,可以从基础理论方面进行入手。周燕表示数据的采集方式不统一,数据格式的不统一,增加了CG研究工作的难度。陈云华强调国内在数据量方面具有优势,但也提到针对医疗数据存在数据孤岛的问题。杨振国认为图形学的研究难以避免涉及大模型问题,在没有足够好的数据和强大算力的情况下,研究大模型变得异常困难。孙宇平指出技术方法决定了发展的下限,而数据的质量则决定了上限。在突破这些难题中,数据的获取和处理成为关键的挑战。
在理论层面,曾碧认为AI+CG是一条正确的道路,但要从自身的研究问题和任务的角度去具体分析,并非所有的环节都需要深度学习。此外,曾碧表示NeRF是一个非常好的课题结合点,在动态环境上有许多的挑战可以去尝试。胡建芳指出随着CG生态环境的逐步开放,会有一部分CV的工作者转移到CG领域当中,有助于实现CG的弯道超车。
在应用层面,刘翔宇认为如果在具体的应用问题上出现的瓶颈是目前传统的技术无法解决的,采用AI+CG技术能够解决问题,则可以判断说是可以实现弯道超车。陈光明和甘文生都表示在大模型时代图形学与AI的结合是一个很大的机遇,不能错失发展的良机。除此之外,刘伟莉表示可以将深度学习当成一种工具,工具没有“攻占”之说,强调需要充分利用深度学习来发展CG。她还指出CG的门槛相对于CV来说是比较高的,CG涵盖物理和数学等知识,应用场景偏向高精端领域,不太可能做到像大模型那样的通用化。黄国恒从CV和CG的关系角度分析,指出CV和CG是互相包含的关系。
嘉宾热议
此次论坛历时近四个小时,最后YOCSEF广州主席龙锦益对此次论坛进行了总结并表示肯定。
为引导嘉宾和思辨嘉宾颁发感谢牌
与会嘉宾合影留念
此次论坛对传统图形学是否面临瓶颈,图形学智能化带来的机遇和挑战,热门技术NeRF未来发展趋势等相关内容展开了深入思辨,亦探讨了如何突破数据、算力和技术等壁垒更好的融合CG和AI,推动AI+CG的创新发展,相信可以为相关领域从业人员提供重要的参考与借鉴。最后,论坛在线下会场与线上云会场一片轻松而热烈的氛围中圆满结束。