李国良副教授对大数据群体计算相关问题进行了探讨。针对大数据计算中海量计算分析和复杂认知推理需求并存的技术挑战,基于人机协作的群体计算是有效的解决途径。大数据群体计算是一种新型计算模型,其目的是通过整合互联网上大量用户和计算资源来处理现有计算技术难以解决的大数据问题。报告介绍了大数据群体计算的研究现状,面临的挑战以及发展趋势。
毛睿副教授对大数据抽象及UMAD项目最新进展进行了探讨。数据种类的多样性是大数据问题带来的主要挑战之一。度量空间数据处理技术把数据抽象成度量空间中的点,把数据间相似性的衡量抽象成满足三角不等式的距离函数,只利用三角不等式进行数据的管理和挖掘等工作,具有高度的通用性。UMAD项目以度量空间为基础,构建通用大数据管理挖掘框架,目前已经在索引和分类等方面取得了一定的进展。
邹兆年副教授对不确定图数据计算的一种新方法进行了讲解。该方法利用不确定图可能世界间的结构相似性,将不同可能世界上相同的计算步骤进行合并,实现“同时计算”,因而发挥了计算算法的内在并行性。实验结果表明,该方法对于解决不确定图数据计算问题是十分有效的。
蔡毅教授对在向量空间模型中的基于信息熵的文本分类权重计算方案进行了说明,提出了两种基于熵的加权方案。为了证明所提出的加权方案的有效性,对7个长文和短文的资料库进行了比较,实验结果表明,使用KNN和SVM文本分类的此方案优于其他方案。
Panel环节,在场老师和同学们提出了很多有价值的问题,四位主讲者结合自己的经历和体会对提出问题做了细致的回答,活动圆满成功。
所有评论仅代表网友意见