项目名称: Map/Reduce数据处理平台中内存级数据缓存技术研究

项目编号: No.61202075

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 梁毅

作者单位: 北京工业大学

项目金额: 23万元

中文摘要: Map/Reduce数据处理平台是数据中心海量数据处理领域的最新技术进展。降低应用运行时海量数据读取开销,提高应用执行效率,是确保Map/Reduce平台服务质量的关键。内存级数据缓存技术是数据中心提升数据访问效率的一类典型技术。然而,既有的数据缓存研究成果难以适应Map/Reduce平台数据基于计算节点分布存储以及数据本地化处理的新特征,而针对Map/Reduce平台的数据缓存研究尚属空白。本项目拟发展面向Map/Reduce数据处理平台的内存级数据缓存技术;以提升应用执行效率为目标,针对Map/Reduce平台新的数据存储与处理模式,着重对数据访问特征分析方法、数据预取与替换、数据重放置以及缓存感知的Map/Reduce任务调度等关键技术展开研究,并通过原型系统对研究成果进行分析和验证,为在Map/Reduce平台引入内存级数据缓存提供切实可行的理论基础和技术方案。

中文关键词: Map/Reduce;数据缓存;负载分析;替换策略;作业调度

英文摘要: Map/Reduce is on the cutting edge of the massive data processing framework in large-scale data centers. Reducing the I/O performance overhead in the massive data processing is essential to achieve the better execution efficiency of Map/Reduce applications, and hence, the higher quality of service of data centers. In-memory data caching is one of the popular technologies to improve data access rate via reducing the disk I/O in data centers. However, on applied to the Map/Reduce-styled framework, the existing in-memory data caching technology cannot accommodate to the framework's new features including that massive data distributed among computing nodes and computation followed with the data locality. Aiming on this issue, we focus on the research of the adaption and extension of the in-memory data caching technology to the Map/Reduce-styled framework, which is, to our best knowledge, the original work in the field of Map/Reduce framework research. The main research topics include the two-leveled data access characteristic analysis, the data perfecting and replacement, the recovery-cost-oriented data placement and the data caching-aware task scheduling, which constitute an integrated solution for the in-memory data caching in Map/Reduce framework. Along with the in-depth research, a prototype system of Map/Reduce

英文关键词: Map/Reduce;data caching;workload analysis;replacement strategy;job scheduling

成为VIP会员查看完整内容
0

相关内容

面向端边云协同架构的区块链技术综述
专知会员服务
46+阅读 · 2021年12月24日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
14+阅读 · 2021年3月26日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
58+阅读 · 2019年12月21日
一文搞懂redis
阿里技术
1+阅读 · 2022年3月24日
面面观之易华录“数据银行”
THU数据派
0+阅读 · 2021年9月10日
PostgreSQL数据目录深度揭秘
阿里技术
0+阅读 · 2021年8月31日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
已删除
将门创投
12+阅读 · 2017年10月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月15日
小贴士
相关VIP内容
面向端边云协同架构的区块链技术综述
专知会员服务
46+阅读 · 2021年12月24日
面向大数据处理框架的JVM优化技术综述
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
17+阅读 · 2021年5月16日
专知会员服务
14+阅读 · 2021年3月26日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
58+阅读 · 2019年12月21日
相关资讯
一文搞懂redis
阿里技术
1+阅读 · 2022年3月24日
面面观之易华录“数据银行”
THU数据派
0+阅读 · 2021年9月10日
PostgreSQL数据目录深度揭秘
阿里技术
0+阅读 · 2021年8月31日
【Flink】基于 Flink 的流式数据实时去重
AINLP
14+阅读 · 2020年9月29日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
已删除
将门创投
12+阅读 · 2017年10月13日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员