WWW的迅速发展使其成为全球信息传递与共享日益重要和最具潜力的资源,它作为一种新的环境资源,为新技术的产生开辟了新的领域,同时也为传统技术(如数据库、人工智能等)的研究提出了新的方向。如何管理WWW上的大量信息,以满足用户不断增长的信息需求,是研究人员面临的新课题。其中,Web页面抓取,信息提取和用户检索是主要的研究内容。杨晓春博士就信息查询和检索中的近似查询处理问题作了主题为“字符串近似查询处理技术”的报告。
字符串近似查询处理技术被广泛应用到数据清洗、拼写检测、查询松弛、记录链接等各个领域。报告简单回顾经典的字符串近似查询处理技术,重点介绍了发表于2007年国际权威数据库会议VLDB(超大规模数据库)上的研究成果,通过变长Gram技术,用以改善近似查询算法的性能。其中,关键技术包括如何构建一组高质量Grams,如何索引变长Grams, 如何利用变长Grams实现相似性查询。并且,进一步探讨如何用变长Gram技术支持现有的基于定长q-gram的近似查询算法,显著改善了现有算法的执行效率。而后介绍了VLDB’07会议讨论的主要技术专题和学术动向等。
报告会结束后,与会YOCSEF沈阳的委员讨论了换届人选问题,并定于08年3月初组织一次AC会议,正式进行YOCSEF沈阳的主席换届,以及委员的增补,2008年度的活动计划,2007年度最后一次论坛的组织筹备等事宜。具体时间待定。
鲍玉斌供稿