2024年8月30日,山东计算机学会2024年学术年会期间,YOCSEF济南、YOCSEF青岛在威海联合举办以“大模型时代,人工智能领域青年学者如何跟跑?”为主题的山东青年科技论坛。此次论坛吸引了众多青年学者、行业专家及企业代表齐聚一堂,包括哈尔滨工业大学(威海)张盛平教授、济南大学信息科学与工程学院王琳教授、中国海洋大学计算机科学与技术学院于彦伟教授、中创软件研究院信息安全中心郭庆广主任、山东财经大学李慧宇副教授以及来自山东青年政治学院、济南大学、泉城省实验室等20余人,共同探讨人工智能领域的最新发展趋势与挑战,特别是大模型时代对青年学者提出的新要求与机遇。
论坛在热烈的氛围中拉开帷幕,由山东大学孟雷教授担任主持。他首先介绍了论坛的背景与意义以及CCF YOCSEF的文化介绍,他强调在当前大模型技术蓬勃发展的背景下,青年学者作为未来科技创新的主力军,如何在激烈的竞争中找准定位、快速成长,成为亟待解决的问题。
随后,多位来自知名高校及研究机构的青年学者发表了精彩演讲。他们围绕大模型的技术原理、应用场景、未来趋势等方面进行了深入探讨,并结合自身的研究经历与成果,分享了在大模型时代取得成功的经验与心得。
首先由哈尔滨工业大学(威海)教授张盛平带来题为“超写实虚拟数字人驱动技术”的引导发言,他提到交互式演变与超写实虚拟数字人技术:包括面部表情和人体动作的驱动。并强调传统数字人驱动技术存在时间、金钱、人力和物力成本高的缺点。随着技术的进步,数字人驱动逐渐从传统的复杂专业技术转向用户友好的超写实技术,推动技术平民化。接下来,发言提到多维数字人驱动技术的发展:二维驱动生成式模型形象可控性差,且多帧生成时序不一致,三维驱动技术从基于点云表达逐步发展到高斯点云表达,并进一步发展出基于高斯变形场的三维数字人像化身建模和参数形变技术。最后,他认为基于可驱动3D高斯的人体建模将成为重要的研究方向。在未来的探索中,除了追求高度写实性外,虚拟数字人的情商与沉浸感也将成为关键研究领域。通过情商的引入,虚拟数字人将能够更好地理解和回应用户的情感,从而实现更自然、更人性化的互动体验。而沉浸感的提升则将增强用户在虚拟世界中的参与感,使得虚拟数字人不仅在视觉上逼真,还能在互动中让用户感觉到真实存在。
第二位引导嘉宾是济南大学信息科学与工程学院教授王琳,他以“弱先验的机器学习”为主题进行了引导发言,他首先指出,高度智力活动的研究应更多地交由高校负责,而算力和人力资源则可以由企业承担。这种分工有助于充分利用各自的优势,推动技术进步。接着,他探讨了神经网络的优化空间,特别是如何使大模型与人类的平均智力和知识水平对齐。他认为,如果人工智能能够与人类智能对齐,将为人类带来巨大的好处。关于模型先验问题,他强调先验的适配特性很重要,认为好的数据会决定先验的质量。因此,数据驱动的先验是实现良好模型的关键。此外,他提到了在矿洞内进行自动驾驶定位识别的应用,以及如何在信息不完备的场景中进行决策,尽管信息完备通常伴随着更高的代价。在神经网络优化方面,他讨论了通过优化神经网络来获得更优的表达式,并进一步提及了水泥化计算机建模和计算神经学的研究方向。这些观点共同描绘了在弱先验条件下进行机器学习的多维探索,从理论到应用,再到实际优化的各个方面。
随后,中国海洋大学计算机科学与技术学院教授于彦伟带来题为“多层异质图神经网络及其应用”的引导发言,首先,他介绍了异质多层性网络的概念,强调了多层关系的聚合以及多层图卷积网络的作用。这种网络结构能够处理复杂的关系和数据,从而实现更深层次的图数据分析。接着,讨论了多层异质图的基础建模模式,展示了如何通过这种模式来有效表示和处理不同类型的节点和边,从而捕捉网络中的多样性和复杂性。发言还提到了多层异质图在移动社交关系推理中的应用,展示了这种网络结构在实际场景中的重要性,尤其是在移动社交网络中的潜力。最后,发言涉及图时空大模型的概念,探讨了时空数据挖掘与大模型之间的关系。这表明,多层异质图神经网络不仅在静态数据处理上有优势,也在动态时空数据的分析中表现出色。
最后,由山东大学软件学院教授孟雷进行引导发言,他来的题目是“视觉数据表征及应用”,首先,在视觉表示学习中存在的视觉分类多样性问题,他提出了应对视觉分类中多样性问题的四种方法:基于样本关联性建模的视觉分类算法、基于因果模型的视觉分类算法、基于跨模态增强的视觉分类算法,以及视频时序因果表征算法。这些方法分别针对不同的分类挑战,提供了多样化的解决方案。接着,在多源数据联邦学习中研究中,针对数据分布异构性导致的数据源之间具有不同的特征空间划分,并损害全局模型的泛化能力的问题,介绍了三种解决方法:基于聚类的样本均衡联邦学习课程构建、基于原型蒸馏的联邦学习交叉训练机制研究,以及基于跨源原型校准的联邦学习模型。这些方法旨在优化联邦学习模型,提升多源数据的整合与应用效果。然后,在可控图像编辑模型部分,发言提出了特征解耦的艺术字生成算法和零样本学习的艺术字生成模型,这两种方法为图像编辑,尤其是艺术字的生成,提供了新的思路和技术手段。最后,发言探讨了面向三维世界生成的大语言模型,介绍了个性化文生字体大模型和开放域室内场景生成大模型。这些大模型扩展了视觉数据的应用范围,特别是在三维世界的生成与表达方面展示了广阔的应用前景。
在随后的互动环节,与会者就如何有效应对大模型时代的技术挑战、如何提升青年学者的科研创新能力等问题展开了热烈讨论:涉及大模型对科研方向的冲击、企业与高校的关系变化、高校研究的瓶颈与应对策略以及角色与定位、对自然语言处理和数据挖掘的影响、算力受限等问题与会专家与学者纷纷表示,大模型时代的到来为人工智能领域带来了前所未有的发展机遇,但同时也对青年学者提出了更高的要求。因此,青年学者需要不断学习新知识、掌握新技术,积极投身科研实践,勇于创新、敢于挑战,才能在大模型时代的浪潮中勇立潮头、跟跑前行。
图1.与会学者发言
此次山东青年科技论坛的成功举办,不仅为青年学者提供了一个展示自我、交流思想的平台,更为推动人工智能领域的科技进步与发展注入了新的活力。我们相信,在全社会的共同努力下,青年学者一定能够在人工智能领域取得更加辉煌的成就,为实现科技强国梦贡献自己的智慧和力量。
图2.与会学者合影