中国计算机学会青年计算机科技论坛
CCF Young Computer Scientists & Engineers Forum
CCF YOCSEF
于2014年12月23日(星期二) 8:15-17:10
在中国海洋大学崂山校区大学生活动中心学术报告厅举行
学术研讨会,敬请光临
研讨会主题
智能数据分析
在中国海洋大学崂山校区大学生活动中心学术报告厅举行
学术研讨会,敬请光临
研讨会主题
智能数据分析
程 序
8:15 会议主席致辞等
8:40 研讨会开始
8:40 研讨会开始
特邀讲者:马 毅 博士,国家海洋局第一海洋研究所
演讲题目:信息技术在海岸带遥感中的应用例说
特邀讲者:李武军 博士, 南京大学
演讲题目:大数据机器学习
特邀讲者:张 巍 博士,中国海洋大学
演讲题目:语音库自动构建若干问题的研究
特邀讲者:张燕明 博士,中国科学院自动化研究所
演讲题目:大规模流形学习方法
特邀讲者:韩 雷 博士,中国海洋大学
演讲题目:基于物理属性的卫星可见光和红外数据融合
特邀讲者:苏统华 博士,哈尔滨工业大学
演讲题目:高扩展模式识别方法:异构计算框架及应用
会议主席:董军宇 博士,中国海洋大学
参加人员:机器学习、模式识别和数据挖掘等相关领域研究人员、教师和学生
报名方式:现场报名
报名方式:现场报名
智能数据分析研讨会(IDAS2014)
随着模式识别、机器学习和数据挖掘等领域的发展,数据逐渐成为了多个研究领域的核心,许多的算法和模型都是围绕数据分析和处理的任务建立起来的。智能化的数据分析方法已经逐渐渗透到了互联网数据、海洋数据、生物特征数据等实际的数据分析与处理的应用问题当中。怎样从数据当中发现有价值的知识,并利用这些知识来帮助人们认识现实世界,是许多领域的研究人员和工程师一直以来不懈探索的一个重要问题。目前,一些企业和个人已经得益于智能数据分析技术,而更多的企业和个人还在试图理解数据、研究可行的数据分析方法,以从根本上解决问题。智能数据分析研讨会将为相关领域的研究人员和技术人员提供交流学术成果、进行广泛讨论的平台。我们将邀请来自海洋科学、大数据技术、语音信号处理、并行机器学习算法等领域的六位报告人,为与会人员带来精彩而丰富的报告。
智能数据分析研讨会将于2014年12月23日在中国海洋大学崂山校区举行,由人工智能学会模式识别专业委员会和CCF YOCSEF青岛协办,由中国海洋大学董军宇教授担任会议主席。本次研讨会不征文不设会议注册,所有参会人员需自行解决食宿和交通问题,因场地限制原因,为了保证良好的听会效果,参会人员需尽早到达会场。本次研讨会的六个报告时间均为一个小时,其中报告环节为五十分钟,提问环节为十分钟。

研究员,博士,国家海洋局第一海洋研究所遥感室副主任,中国海洋学会海洋遥感专业委员会副秘书长,全球变化与海气相互作用专项技术组成员,载人航天工程二级课题负责人。主要从事海岛海岸带遥感与应用研究,近年来主持国家自然科学基金、国家载人航天工程、908专项、927工程等课题多项,主持中欧国际合作课题1项。更多信息请参考:http://www.fio.org.cn/people/tutor.jsp?id=38
报告提要:面向海岸带地物分类、赤潮探测、海岛风险评价的需求,应用信息技术开展了海岸带地物遥感分类、赤潮生物量高光谱遥感反演、海岛多源概率型风险评价研究。报告主要内容包括:1)半监督方法与海岸带遥感分类;2)D-S理论与海岸带遥感分类;3)最优化方法与赤潮生物量高光谱遥感反演;4)De Morgan法则与海岛多源风险评价。

博士,副教授,博士生导师。主要研究领域为人工智能、机器学习与数据挖掘,目前主要专注于大数据机器学习的研究。曾获Google奖教金,入选南京大学登峰人才支持计划(B层次)。发表论文30余篇,大部分发表在AAAI、CVPR、ICML、IJCAI、NIPS、SIGIR、IEEE Transactions on TKDE等国际知名会议和期刊上。现任《中国计算机学会通讯》专栏编委和《Frontiers of Computer Science》青年副编辑,担任TPAMI、TNNLS、TKDE、TPDS、TCSVT、中国科学、科学通报、软件学报等多个国际和国内知名期刊的特邀评审人,并担任AAAI、ICML、IJCAI、KDD、NIPS、UAI等多个国际知名会议的程序委员。主持和参加了多项国家级课题研究,包括国家自然科学基金项目、科技部863重大项目等。更多信息请参见:http://cs.nju.edu.cn/lwj/ 。
报告提要:大数据在科学、金融、气象、医疗、环保、教育、军事、交通等领域都具有非常广阔的应用前景,已经成为国家重要的战略资源。对大数据的存储、管理和分析也成为学术界和工业界高度关注的热点。我们收集、存储和管理大数据最终是为了分析和挖掘出数据中蕴含的知识,为用户提供智能化和个性化服务。因此,大数据智能分析和挖掘是实现大数据价值挖掘的关键。大数据机器学习将为大数据智能分析和挖掘提供核心的理论和技术支撑,已经成为大数据研究中最热门的领域之一。本报告将介绍我们在大数据机器学习领域最近的研究成果,包括哈希学习、分布式学习和随机学习,以及在图像检索、推荐系统、互联网广告和社交网络等领域的应用,并对值得进一步探索的几个问题进行展望。

博士,副教授,硕士生导师。进入中国海洋大学计算机科学与技术系后,已在Interspeech,计算机学报,软件学报,等国内外期刊和学术会议发表论文数十篇。并曾负责国家自然科学基金课题一项,山东省自然科学基金一项,山东省优秀中青年科学家科研奖励基金一项。作为主要研究者参与国家重点基础研究发展计划(973计划)子课题一项,国家自然科学基金课题一项,山东省自然科学基金课题一项。
报告提要:语音合成和识别的关键问题之一是语音库的构建,目前语音库构建周期长,人工标注和校对工作量大。研究极小化语音标注和语音库自动构建的方法:力图实现将人工参与最小化,全自动的构建语音库和相应语音合成系统。为避免录音的人工成本,从互联网和媒体自动获取相应音频和不精确文本。首先研究非监督的自动语种鉴别问题:基于潜在语义模型中LDA方法进行自动识别文本的语种。接着研究纯语音提取问题:构建时长可变的HMM,自动从音频中提取纯语音片段;最后研究自动文语对齐问题:构建声学模型和语言模型自适应迭代算法,自动找到语音和文本精确对应部分。目标是将所有人工标注量降到最低,甚至实现无标注全自动生成算法。以原来人工标注量的20%,实现80%的语音合成结果。

博士,于2004年在北京邮电大学获得学士学位,2011年在中国科学院自动化研究所获得博士学位。目前,他在中国科学院自动化研究所模式识别国家重点实验室任助理研究员。他的研究兴趣包括机器学习,及其在模式识别、计算机视觉等领域的应用。目前,他主要从事基于图的机器学习方法的研究,并在TNNLS、TSMCB、AAAI、ICDM等高水平会议和期刊上发表论文十余篇。
报告提要:流形学习作为一类解决非线性问题的机器学习方法,在过去十几年中取得了飞速的发展,产生了很多经典的工作,比如spectral clustering, Laplacian eigenmaps, Manifold regularization等等。然而,由于需要对向量数据构造图拉普拉斯矩阵(graph Laplacian matrix),并对其进行求逆或者特征值分解,这些方法往往具有多项式级的计算复杂度,无法在大数据问题中使用。本次报告将介绍近年来学术界在大规模流形学习方法研究中取得的一些进展,并分析比较这些方法的优劣。

副教授,中国海洋大学信息科学与工程学院,Email:hanlei@ouc.edu.cn。研究方向:遥感数据分析;基于雷达、卫星等多源遥感数据的强对流灾害预警方法;模式识别;图像处理。
报告提要:目前,已有的卫星可见光和红外数据的融合技术,主要关注的是融合图像的视觉效果(如融合后的图像是否看起来更清晰),而往往忽略了融合图像的物理属性。这导致融合的图像只能作为定性分析使用,无法作为定量分析使用。本研究的目标,就是使融合后的图像,在提高其视觉效果的同时,能够在红外亮温上仍然保持其物理意义。
本研究提出的方法包括2个步骤。首先,使用常规的多分辨率方法(MRA),如多小波分析等,将卫星可见光和红外通道的数据进行融合。为保证热红外的物理信息不丢失,低频部分的融合全部采用红外数据。通过这一步的处理,可见光数据中丰富的纹理信息,在融合图像中得以体现,可以取得较好的视觉效果,但如果定量分析,则会在局部出现明显的热辐射信息的光谱失真(spectral distortion)。即,在某些区域,红外亮温异常的低或高,与实际的情况明显不符合。因此,需要下一步的物理订正。第二步,使用黑体辐射理论中的Stefan-Boltzmann公式,对融合图像进行订正,以保证订正后的数据符合实际的情况。使用Stefan-Boltzmann公式,对每个小区域反演其红外辐射的能量,并与原始的红外数据对比,保证在辐射能量上基本匹配。在订正的过程中,需要注意可能出现的马赛克现象。在试验验证的部分,使用MTSAT静止卫星数据(可见光数据的分辨率为1km,红外数据的分辨率为4km),分别进行了定性分析和定量分析。实验结果表明,订正之后的融合图像在取得了与MRA方法相同的视觉效果的同时,也能保持其红外物理属性不失真。

博士,哈尔滨工业大学硕士生导师,哈尔滨工业大学CUDA教学中心和CUDA研究中心负责人。主要研究方向包括:模式识别理论与方法, 神经计算算法,智能媒体计算与交互技术和物联网大数据智能信息处理等。率先开展手写中文文本的研究工作,建立领域内首款手写中文库(HIT-MW库),该库为国内外100余家科研院所采用,支持20多名博士研究生的论文工作。近期在文字识别领域取得的成果:2013年,(德国施普林格出版社)出版手写汉字识别领域首本英文专著(英文专著名称为《Chinese Handwriting Recognition: An Algorithmic Perspective》);在2013年文档分析和识别国际会议(ICDAR’2013)上,所领导的研究组获得手写汉字识别竞赛的2项世界冠军;2014年,两项手写文字识别核心技术授权给某高新技术公司,正在为超过200万终端用户提供技术服务。在大数据的大规模并行计算方面,最近取得的成果:2013年,获英伟达官方认证的首批CUDA工程师称号;2014年帮助哈尔滨工业大学成为英伟达CUDA教学中心和CUDA研究中心并出任负责人;2014年,(机械工业出版社)出版4本GPU计算和大数据分析方面的译作。
报告提要:统计模式识别一直是数据驱动型任务,当前的大数据为统计模式识别提供了更广阔的舞台。面对大规模数据下的模式识别任务,如何构建具有高扩展能力的模式识别方法是现在和未来的一项长期任务。面对这一需求,传统的计算框架存在严重挑战。结合CPU和GPU各自的优势,构建基于CPU+GPU的异构计算平台是当前最为经济、实用的处理思路。本报告前半部分分以Google、Facebook、百度、腾讯等互联网巨头的计算平台为蓝本,介绍当前主流CPU+GPU异构计算框架。报告的后半部分,结合我们在高扩展原型学习方面的工作,介绍异构计算框架的实际应用和具体实践。

教授,博士生导师。现任中国海洋大学计算机科学与技术系主任。2008年被列入教育部新世纪人才支持计划。主要研究方向为计算机视觉、水下视觉、视觉感知、机器学习及海洋大数据分析。承担了科技部国际合作、国家自然科学基金、国家海洋公益专项及其他省部级项目10余项,在主流国际期刊及国际学术会议上 (IJCV, PR, JOSA, Information Science等)发表论文40余篇。
研讨会的日程安排:
时间
|
会议内容
|
主持人
|
8:15 – 8:40
|
会议主席致辞等
|
仲国强
|
8:40 – 9:40
|
报告 1
马毅,国家海洋局第一海洋研究所
|
解翠
|
9:40 – 10:00
|
茶歇
|
|
10:00 – 11:00
|
报告 2
李武军,南京大学
|
孙鑫
|
11:00 – 12:00
|
报告 3
张巍,中国海洋大学
|
|
12:00 – 13:45
|
午餐
|
|
13:45 – 14:45
|
报告 4
张燕明,中国科学院自动化研究所
|
王胜科
|
14:45 – 15:45
|
报告 5
韩雷,中国海洋大学
|
|
15:45 – 16:00
|
茶歇
|
|
16:00 – 17:00
|
报告 6
苏统华,哈尔滨工业大学
|
亓琳
|
17:00 – 17:10
|
闭幕式
|
仲国强
|
会场方位示意图:
所有评论仅代表网友意见