项目名称: 基于Hadoop的分布式并行联机分析处理技术研究

项目编号: No.61173028

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 计算机科学学科

项目作者: 鲍玉斌

作者单位: 东北大学

项目金额: 54万元

中文摘要: 传统的OLAP技术,在进行OLAP分析时不能再设置数据的过滤条件,只能在分析的维度上选择相应的值范围作为分析条件。实际上,这样的分析过于简单,不能满足应用需求。另外,目前的OLAP技术不能很好地支持复杂的聚集查询(例如分位数、众数)。另外传统的并行OLAP技术存在负载均衡困难以及系统伸缩性差等问题。而基于Hadoop的并行处理模式可伸缩性好且负载均衡容易。本项目提出了用于分布式并行处理的OLAP模型,直方图立方HistCube。基于此模型,研究基于Hadoop架构的解决上述问题的分布式并行OLAP技术。研究内容包括:(1)多维聚集查询通用模型;(2)HistCube的计算、存储和更新技术;(3)基于HistCube模型的支持OLAP操作的聚集查询与优化算法;(4)HistCube的分布式并行索引与优化技术。目标是研究能够解决上述问题的用于OLAP的通用模型和高效聚集查询算法及其相关技术。

中文关键词: OLAP;聚集计算;统计直方图;Hadoop;条件过滤

英文摘要:

英文关键词: OLAP;Aggregation computing;Statistical histogram;Hadoop;Condition filtering

成为VIP会员查看完整内容
0

相关内容

【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
【Manning新书】高级算法与数据结构,769页pdf
专知会员服务
169+阅读 · 2021年11月12日
【SIGMOD2021】数据库与人工智能交叉技术综述
专知会员服务
64+阅读 · 2021年7月14日
专知会员服务
17+阅读 · 2021年5月16日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
专知会员服务
76+阅读 · 2020年12月6日
专知会员服务
37+阅读 · 2020年12月1日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
80+阅读 · 2020年5月23日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
400倍加速, PolarDB HTAP实时数据分析技术解密
阿里技术
0+阅读 · 2021年10月25日
一文详解Redis中BigKey、HotKey的发现与处理
阿里技术
0+阅读 · 2021年8月25日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
基于MySQL Binlog的Elasticsearch数据同步实践
DBAplus社群
15+阅读 · 2019年9月3日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月17日
小贴士
相关VIP内容
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
【Manning新书】高级算法与数据结构,769页pdf
专知会员服务
169+阅读 · 2021年11月12日
【SIGMOD2021】数据库与人工智能交叉技术综述
专知会员服务
64+阅读 · 2021年7月14日
专知会员服务
17+阅读 · 2021年5月16日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
专知会员服务
76+阅读 · 2020年12月6日
专知会员服务
37+阅读 · 2020年12月1日
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
80+阅读 · 2020年5月23日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
数据分片架构的下一次进化
InfoQ
0+阅读 · 2022年2月20日
400倍加速, PolarDB HTAP实时数据分析技术解密
阿里技术
0+阅读 · 2021年10月25日
一文详解Redis中BigKey、HotKey的发现与处理
阿里技术
0+阅读 · 2021年8月25日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
基于MySQL Binlog的Elasticsearch数据同步实践
DBAplus社群
15+阅读 · 2019年9月3日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员