项目名称: 基于EMD距离的数据流分布式相似性查询处理关键技术研究

项目编号: No.61402494

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 许嘉

作者单位: 广西大学

项目金额: 26万元

中文摘要: 大数据时代的数据分析不但要应对大数据规模之“大”,更要应对大数据产生之“快”,因为许多实际应用中的数据具有时效性。数据流的相似性查询是数据流分析挖掘的重要操作,能够返回和查询对象相似的流数据对象,被广泛应用于对象去重和分类。相似性度量函数是影响查询结果质量的重要因素。研究表明,相比于Lp范式距离,EMD距离量化的数据相似性更符合人们的直观认识。然而求解EMD距离却具有高达三次方的计算复杂度,阻碍了其在数据流快速分析中的应用。新型分布式数据流处理平台的出现为实时处理基于EMD距离的相似性查询提供了可能。本课题基于新型分布式数据流处理平台,研究高效的基于EMD距离的数据流分布式相似性查询处理关键技术,包括基于EMD距离的数据流分布式处理模型、查询优化策略以及系统优化机制,并结合以上技术实现一个原型系统。本课题具有重要的理论意义和应用价值,可以为其它计算密集型数据流分析应用提供实时处理实施范例。

中文关键词: 数据流;分布式处理;EMD距离;相似性查询;大数据

英文摘要: In the era of big data, besides dealing with large volume of data, a more challenging work for data analysis is to cope with fast generating streaming data, since the data generated in many practical applications are time-sensitive. Similarity query over

英文关键词: Data stream;Distributed processing;Earth Mover's Distance;Similarity queries;Big data

成为VIP会员查看完整内容
0

相关内容

空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
33+阅读 · 2021年10月17日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
35+阅读 · 2021年2月20日
空间数据智能:概念、技术与挑战
专知
7+阅读 · 2022年2月4日
作业帮基于Flink的实时计算平台实践
AI前线
0+阅读 · 2022年1月27日
一文详解Redis中BigKey、HotKey的发现与处理
阿里技术
0+阅读 · 2021年8月25日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Disturbance of questionable publishing to academia
Arxiv
0+阅读 · 2022年4月19日
小贴士
相关VIP内容
空间数据智能:概念、技术与挑战
专知会员服务
81+阅读 · 2022年2月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
33+阅读 · 2021年10月17日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
35+阅读 · 2021年2月20日
相关资讯
空间数据智能:概念、技术与挑战
专知
7+阅读 · 2022年2月4日
作业帮基于Flink的实时计算平台实践
AI前线
0+阅读 · 2022年1月27日
一文详解Redis中BigKey、HotKey的发现与处理
阿里技术
0+阅读 · 2021年8月25日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
一种关键字提取新方法
1号机器人网
21+阅读 · 2018年11月15日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
基于二进制哈希编码快速学习的快速图像检索
极市平台
12+阅读 · 2018年5月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员