中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists & Engineers Forum-ChangChun Branch
如何培养出合格的大数据专业人才?
(CCF-YO-20-CC-3FT)
主办单位:
中国计算机学会
承办单位:
CCF YOCSEF 长春分论坛
协办单位:
长春工业大学
海诚科技有限公司
在“中国制造2025”国家战略、推进“新工科建设”的国家政策正在逐步落地。大数据相关的专业在各个高校频频亮相,成为近两年高校新增专业的“大红人”,但大数据人才培养以及数据科学研究似乎远未做好准备。根据教育部公布的名单,2019年138所高校成功申请数据科学与大数据技术专业。作为新专业、新人才,产业如何支撑专业,专业如何赋能产业,生产过程与教学过程如何对接,输血与造血如何有机结合?论坛邀请业界、高校在大数据领域具有建树和研究成果的学者进行了思辩。
2021年4月4日下午14:00,CCF YOCSEF长春AC举办了“如何培养出合格的大数据专业人才?”技术论坛,此次论坛由长春工业大学数学与统计学院刘铭副院长(CCF YOCSEF 候任副主席)和吉林海诚科技有限公司孙晓海总经理(CCF YOCSEF长春现任副主席)担任执行主席,长春理工大学计算机科学技术学院副教授张昕(CCF YOCSEF长春AC学术委员)担任微论坛主席。本次技术论坛重点探讨了数据科学与大数据技术专业学习内容是“全面撒网”还是“重点选拔”?数据科学与大数据技术专业人才培养是“专业决定产业”vs“产业决定专业”?在数据科学与大数据技术专业的人才培养体系中,工科vs理科的区别在哪里?
本次论坛邀请了长春工业大学秦喜文教授、吉林大学周柚教授、长春理工大学李华教授做特邀报告,还特别邀请了国防科技大学刘新旺教授、北京四维纵横数据有限公司姚延栋总经理、中电文思海辉蒋杨副总裁、东北师范大学王晗副教授、长春工业大学程超副教授、吉林农业大学温长吉副教授参与论坛议题讨论。论坛吸引省内外相关领域专家学者在线参与研讨,对“如何培养出合格的大数据专业人才?”议题进行热烈的讨论。
技术论坛开始,由论坛执行主席刘铭教授做引导发言以及第一位报告嘉宾介绍。
第一项主题发言《自主设置目录外二级学科“数据科学与人工智能” 的探索与实践》。报告嘉宾:秦喜文,长春工业大学,大数据科学研究院院长兼校学科办副主任,教授,博导,吉林省第七批拔尖创新人才,省工业与应用数学学会副理事长、省运筹学会常务理事、省现场统计研究会理事、省数学学会理事,主持承担国家自然科学基金项目3项,省部级项目8项,发表学术论文28篇,获省科技进步奖二等奖1项,省自然科学奖三等奖1项。主要研究机器学习、自适应数据分析、大数据分析与统计计算。
第二项主题发言《吉林大学数据科学与大数据技术专业建设的一些思考》。报告嘉宾:周柚,吉林大学,软件学院副院长,教授,博导,吉林省高校科研春苗人才,吉林大学优秀青年教师。主要研究方向包括机器学习、模式识别和生物大数据挖掘。
第三项主题发言《新工科背景下的大数据技术人才培养模式思考》。报告嘉宾:李华,长春理工大学计算机科学技术学院教授、博士生导师,芬兰埃博学术大学(ÅAU)访问学者,中国计算机学会(CCF)会员,虚拟现实与可视化技术专委委员,CCF YOCSEF 长春候任主席,研究方向为真实感图形学与虚拟现实技术。作为数据科学与大数据技术专业负责人,长期从事教育教学改革的研究工作,主持完成教育部产学合作协同育人项目3项、吉林省高等教育教学改革项目2项。曾获得吉林省教学成果奖一、二等奖,指导大学生程序设计竞赛获国家级奖多项。
论坛第二阶段,议题讨论与思辨环节,由执行主席孙晓海主持。
首先由六位特邀嘉宾做引导发言。
第一位特邀嘉宾:刘新旺,国防科技大学计算机学院教授,国家优秀青年基金获得者。主要研究兴趣包括核算法、多视图聚类、深度聚类等。发表IEEE Trans及CCF A类论文50余篇。
发言内容:大数据涉及多学科的交叉,大数据是AI的动力和基石之一。大数据学科的发展可以借鉴AI学科。AI是大数据应用的体现,AI应用的数据越多,结果也就越准确。二者应用方面有紧密联系。两个学科可以相互借鉴、相互促进。
第二位特邀嘉宾:姚延栋,北京四维纵横数据有限公司创始人、原Greenplum 北京研发中心总经理、Greenplum中国开源社区创始人、壹零贰肆数字基金会联合发起人。自Greenplum开源之后,致力于Greenplum生态和开源社区的发展,奠定了包括阿里云、腾讯云和百度云在内的广大开源Greenplum用户群。在加入Greenplum之前, 曾在Sun Microsystem 与 Symantec 系统和存储部门工作多年。于 2005年以荣誉研究生毕业于中科院软件所, 拥有多项国内外云计算和大数据专利,并著有《Greenplum:从大数据战略到实现》。
发言内容:目前,大数据核心人才的缺口巨大,截至2025年将达到230万。如何快速培养高质量的大数据核心人才,是重大机遇也是挑战。现实中,存在着高校应为未来培养人才的需求,然而现在有些学校的课程内容比较老,学生还没毕业学习的技能就过时了。大数据人才分两类,即研发大数据产品的人才和使用大数据产品的人才。
第三位特邀嘉宾:蒋扬,中国电子旗下中电文思海辉副总裁,负责亚太事业群面向中国国内数智化业务,主要基于工业互联网4.0为企业提供数智化业务产品及整体解决方案的咨询规划及落地实施,帮助企业完善信息化及数字化转型走向数智化的发展道路。目前团队融合了中国国内顶级的数字化咨询专家,包括人工智能,大数据,5G等先进技术领域的技术专家,帮助国内很多大型企业完成数字化转型及数智化布局。
发言内容:中电文思海辉是全球领先的全球数字化转型解决商,为企业建立数据支撑平台,为企业提供数据资产管理提供支撑,具有全域数据服务平台,为企业的合作伙伴提供可靠安全的数据资产盈利方案。公司与多个高校的产学研合作基地,引导高校贴近市场发展,实现有针对性的学生培养。在大数据人才培养方面,强化学生实战能力的培养,希望与高校合作一起培养学生,带着实际课题和应用使学生在学习理论的同时,建立对企业、市场的理解,从而将理论应用于实际,期待与高校的深度合作。
第四位特邀嘉宾:王晗,副教授,博导,吉林大学与美国密苏里大学联合培养博士,现就职于东北师范大学,任东北师范大学计算生物研究所所长,中国计算机学会生物信息学专业委员会委员。人工智能学会生物信息与人工生命专业委员会委员。
发言内容:针对大数据专业面向企业、行业发展的需求,高校在培养学生时,要让学生更适合未来发展。培养过程中的难点在于高校缺少大数据资源,而资源恰恰掌握在一些企业手中,培养过程中学生的培养方向上存在意见尚的分歧,高校相对缺乏对产业的深入理解,培养出的学生可能会不接地气。鉴于此,个人认为,高校应培养学生的“内功”,再面向外部需求形成实际能力,培养的前瞻性要体现在“内功深厚”。
第五位特邀嘉宾:程超,博士,副教授,长春工业大学计算机科学与工程学院副院长,吉林省计算机学会理事,中国计算机学会YOCSEF长春分部学术委员,IEEE/IES Member,中国人工智能学会/计算机学会/自动化学会会员,研究方向:人工智能与数据驱动方法:动态系统故障诊断与预测维护;复杂系统可靠性与安全性研究。
发言内容:重点探讨产业与专业的决定性关系。本论题有点类似于“鸡生蛋还是蛋生鸡”。在一定程度,产业决定了专业,大学的专业兴衰印证了产业的发展情况。专业则决定了产业的高度,很多专业内容与产业并无直接关系,不要使学生沦为“调参侠”,要通过产业拓宽专业视野。从产业决定专业的视野下,坚定专业决定产业原则。
第六位特邀嘉宾:温长吉,工学博士,副教授,吉林农业大学信息技术学院副院长。CCF长春委员,CCF YOCSEF长春副主席,吉林省计算机学会理事,吉林省工业与应用数学学会理事,吉林省科技厅吉林省中小企业服务专家,吉林省软科学研究所农业大数据技术研究员,《Computers and Electronics in Agriculture》、《农业工程学报》等期刊审稿人。
发言内容:吉林农业大学较早地开展了农业大数据人才培养。针对学习内容是“全面撒网”还是“重点选拔”,不能一概而论,要尊重高校特点/特色和师资条件,针对多学科交叉的特点,在学习内容设置上要有核心课程,采用大类招生,开展通识教育,即全面撒网;在此基础上,结合学校资源和实际,引入重点选拔,吉林农大则将农业领域作为重点之一,但同时兼顾其他行业。早期全面撒网,重视基础,后期重点选拔,面向未来发展强化能力。
论坛思辨环节的第一个议题是数据科学与大数据技术专业学习内容是“全面撒网”还是“重点选拔”?
王福德:应采用重点选拔。专业门类被分为理科和工科,其设定重点、师资有所不同,要有侧重,发挥特色。近年来,各学校结合自身特点特色,新增了多个门类的专业,可以看出,重点选拔更适合学校发展实际。全面撒网更适合对基础情况的调研。针对吉林省的情况,本省本科有27所,独立院校10所,除了5-6所高校之外,各高校均设立了大数据相关专业,部分学校的专业师资力量、生源很好。但对于其他院校来说,培养则值得深入思考,重点选拔会更有价值,使其具备有针对性地专精能力。
匡哲君:个人认为应采用全面撒网。关于大数据的来源,不同专业有不同理解。如同医生在看病时,不同科室的医生对于同一病人会有不同的见解和治疗方法。各高校间特色不一样且有各自的倾向,面向大数据专业人才培养,不应仅限于计算机专业内的交叉,建议通过多个领域交叉,激发出新的发展点。
刘铭:结合各位专家的发言内容,认为985院校和其他院校设置大数据院校应该是有所不同。如双非院校,重点选拔更为有效,能够明确对接就业需求。要考虑就业和学校情况。不同学校的资源,有很大差别。如部分院校,在大数据师资方面会有较大的难度,其会迥异于吉林大学等高层次院校。因此,重点选拔可能是个现实选择。
王晗:还要考虑深度与广度问题。如果师资和资源能够达成重点选拔,则最为理想,但对于较多院校,其条件限定其不得不采用全面撒网的方式,使其具备从业基础能力,在参加工作后再开展能力的定向和提升。
叶育鑫:不同的企业,其大数据的技术环节重点不同,优势有所不同。如果采用重点选拔,是否会局限了学生的专业视野和能力。
朱功伟:支持全面撒网。从企业来讲,现有的教学模式,企业的培训难以转换到学校中,学校要承担通识和基础培养,专业培养涉及到跨学科、跨行业,人才要有综合能力,若希望在毕业后通过工作实现能力专精,在培养过程中就要全面。
邰志艳:大家可能对全面撒网和重点选拔的概念理解有所不同。在制定培养方案过程中,各学校培养方案在前阶段基本相近,均需要通识基础和专业基础的设置。针对企业用人需求,部分学校,特别是双非院校,会面向校企合作开展定向设定,采取了重点选拔,以产出为导向采用项目方式形成专业教学方案。
第二个议题是数据科学与大数据技术专业人才培养是“专业决定产业”vs“产业决定专业”?
王福德:所在单位从事工作与高校合作较多。学校在专业设定时,要考虑产业需求,产业决定着专业的设置。现有的教育体系中,在高中阶段分为文科和理科(来源于苏式教育体系)。要结合产业实际,体现专业设置,实现专业设定的时代背景和产业背景。
温长吉:倾向产业决定专业。数据资源是基础,体现了国家层面的导向,进而引导产业提出需求,即产业的飞速发展催生专业。
叶育鑫:产业决定专业相对容易理解。但什么情况下,专业会决定产业,个人认为专业强到一定程度时,即学科基础非常强盛,其理论产出已经领先于产业现状,如高层次的大数据人才,实现自底向上的“似是而不是”的大数据培养效果,会产生新的方向、领域,进而带动催生了新的产业。
秦喜文:产业需求决定专业研究内容。如果产业发展的好,其本质还是专业。专业决定了产业发展的更好、更长远。如量子计算、量子卫星,其专业发展(如潘建伟团队)决定了产业走向。
朱功伟:大数据领域,产业决定专业。大数据已经形成了产业,体现出的是产业决定专业的效果。专业决定产业更适合于基础学科。如顶尖院校应该聚焦于基础学科,从而实现长远推动。
李华:如果专业决定产业,可能是混淆了学科概念,更适合表述为学科决定专业。产业决定专业是受到认可,如新工科恰恰就是产业决定专业的具体体现。然而,无论是以上哪种,最终的追求是在产业与专业的对接,应实现二者的融合对接。
王晗:以统计学为例,有些问题在数学中难以找到特别合理的解释或特别有效的手段,因此分离出统计学。回到大数据领域,核心问题,因为资源限制,难以实现专业决定产业的效果,难以获得来自科研项目、资源等方面的现实支持,而更多的是在产业苗头出现后,才会有专业发展的空间。因此,产业决定专业。
刘铭:大方向来看,产业决定专业,但仍存在特例。如机器学习,是统计学者提出来,计算机学者提供了实现。由此,表述为相辅相成更为合理。产业为专业设置提供了导向。周柚:产业有需求,催生了专业的设立。专业培养的人才,能否适应产业需求,支撑产业走得更远,值得思考和关注。
第三个议题是在数据科学与大数据技术专业的人才培养体系中,工科vs理科的区别在哪里?
王晗:对于大数据专业来说,有两个层次的问题:第一,大数据有哪些技术?第二,这些技术怎么使用?即理论研究和应用研究。理科更倾向关注前者,而工科关注后者。例如,计算机磁盘产生过程中,磁盘的基础结构是由物理学家做出关键性贡献,发展到后期,实现小型化、快速存储,则依赖于工程人员的贡献。
刘铭:数据科学:体现了理科;大数据技术:体现了工科。在专业名称上,也体现出理工结合的特点。
王福德:从专业代码上看,体现工科占比相对较高。理科专业,多加入R语言、SAS等统计学范畴的课程和技术,而工科专业,则注重对程序语言、应用技术等方面的学习。
周柚:专业名称体现了理科和工科。理科培养是重点,也是对基础能力的培养,理工科的区别体现出了对不同人才类型的培养目标。
毕春光:专业的出现背景是在复合人才、信息技术人才、高层次人才匮乏紧缺的情况下产生的,是中国制造2025条件下的新工科专业,表现出更多的工科特点。无论是理科设定还是工科设定,目前尚未体现出显著差异,仅是在毕业设计重点体现在理论研究还是问题解决方面。总体来说,该专业的工科成分多一些。
刘云霄:工科偏向于应用,理科偏向于理论。个人认为培养区别体现在前者培养解决问题的人才,后者培养开展理论研究的人才。
程超:理科工科的区别可以分别从教学和科研两方面来讲。教学中,体现在引导案例上,工科从物理系统中反馈产生学术思考,如线性代数中行列式矩阵等内容来源于空气动力等方面的问题,理科则通过问题求解建立和养成抽象思维。在科研方面,工科强调有效性,要有用;理科强调完备和逻辑性。可见,思维模式和解决问题入手方式有区别。
郭丽娜:个人从事过企业员工内训工作。在开展工作过程中,将员工分为三种不同类型,有针对性地培养,能够发现企业对大数据人才存在较大需求。此外,专业知识只是一个方面,数据思维是其在后续发展中的关键。在从事出版工作中,能够发现目前有些专业教材还是欠缺的。因此,关于数据科学与大数据专业发展的讨论十分有价值。
最后,CCF YOCSEF长春分论坛主席、吉林大学叶育鑫教授对此次技术论坛进行了总结,肯定了此次论坛在议题设定方面体现出了层次和递进,特别是议题一和议题二能够较好地引出正反观点,大家在讨论过程中能够求同存异,从不同的角度、单位、环境围绕大数据交换了彼此的看法和观点。本次技术论坛作为本届分论坛主席团的收官活动,经过周密的准备,在各位嘉宾、参会人员的积极参与支持下,获得了圆满成功。育鑫深情感言:感谢CCF YOCSEF长春各位同仁,其间与大家共同经历的摩擦和碰撞为彼此的成长成熟提供了宝贵经验,大有裨益;真诚感谢各位同仁在论坛准备、召开过程中的付出,感谢三位论坛讲者为大家分享了专业建设的重要经验,感谢六位引导嘉宾,对论坛议题进行的周密准备以及外地嘉宾提供的宝贵观点和建议,感谢各位AC和参会人员的大力支持;希望今后,大家继续保持思辨,把活动推向更好!