论文摘要:数据中心(datacenter)也叫做“服务器农场”,起源于服务提供商(service provider),它的主要目标是降低用户管理服务器和应用程序的成本。近年来,随着Internet用户的大规模增长以及虚拟化技术、商业化服务器的出现,一些国际知名网络服务企业如美国谷歌、微软等公司都陆续建立了各自的数据中心,用于存储大规模数据,并利用其分布式存储的优势和强大的处理能力,将数据及时高效地传输给全球各个用户。与传统局域网、广域网环境不同,数据中心作为资源密集型基础设施,需要快速响应大量互联网终端用户的业务请求,并行处理多个具有海量数据特征的计算任务。软件定义网络(software defined networking)技术能很好地满足数据中心的新特性,在高效集中式的网络管理、虚拟机自动部署和智能迁移、灵活组网多径转发、虚拟多租户隔离和安全保障等方面展现出了具大的优势。谷歌和微软利用软件定义网络技术连接各自的数据中心,有效地提高了网络带宽利用率,降低了端到端传输时延和丢包率。软件定义的数据中心已成为数据中心演进的一个方向和趋势。本文针对软件定义数据中心网络中最小化拥塞网络异步更新、无环无拥塞网络同步更新和数据平面备份路由设计与部署三个关键问题进行研究,取得的研究成果如下:(1).研究最小化短暂拥塞网络更新问题,即给定网络流量分布的初始状态和目的状态,引入若干中间状态,使得转换时产生的拥塞最小。我们提出的方案是对更新速度和网络拥塞一个合理的权衡,为网络管理者提供了更广泛的设计空间。首先,为了更好的满足不同的应用需求,一些网络流在更新过程中是可分的(splittable),另一些网络流,例如视频流,在更新过程中是不可分的(unsplittable)。我们基于这两个分类,建立了最小拥塞网络更新问题的优化模型并证明这个问题是NP难的。其次,提出两个高效的近似算法:第一个算法是随机舍入算法,这个算法的近似比是O(logk),其中kK是网络中结点的数量;第二个算法是贪婪改进算法,在任意的网络拓扑中,贪婪改进算法和随机舍入算法具有相同的近似比。但在数据中心内部的Fat tree拓扑中,这个算法具有常数近似比4。最后,在数据中心内部的网络和数据中心之间的广域网这两个应用场景,对提出的算法进行性能评估。仿真实验表明提出的算法有效的减少了 60%拥塞,降低了30%的控制开销。Mininet实验表明提出的算法比现有方案的更新时间减少了50%。(2).研究无环无拥塞网络同步更新问题。大量网络更新不一致行为都是由于异步更新时间不确定性导致的。受到最新时钟同步数据平面设计的启发,我们在定时数据平面中研究一致性网络更新问题,即为每个交换机提前计算一个精确的更新调度时间,目标是最小化总的更新时间并且无环路和无拥塞的条件在任意时刻都成立。我们提出了一个方案Chronus,其设计基于可证明的无拥塞和无环路更新调度算法,完全避免了现有的两阶段更新方法所需的流表空间开销。我们将最小化更新时间问题形式化为一个优化问题并证明了问题的难度。我们进一步在多项式时间内提出了一个基于树的算法来计算一个可行的更新序列,以及一个贪心算法来找到更新时间最小的调度序列。Mininet实验和大量的仿真实验表明,Chronus可以大幅度减少更新过程中的短暂拥塞,并且与现有技术相比节省60%的流表规则空间。(3).研究数据平面备份路由设计与部署问题。来自微软的数据中心的统计报告数据表明:数据中心网络中每隔5分钟,有一条链路失效的概率高达21.5%。面对如此频繁出现的数据平面链路失效问题,我们提出了一个新的数据平面错误恢复系统,通过预先计算和建立备份路由来提高软件定义数据中心广域网的鲁棒性。当一条链路失效时,交换机立刻局部重路由数据包到备份路由中,不需要控制器的额外干预,从而大大节省了错误恢复的时间。另外我们的方案完全避免了额外的带宽开销,显著的提高了数据中心广域网的性能。我们形式化备份路由计算问题作为一个优化问题,提出了一个近似算法来解这个问题。基于Openflow的多级流表(multi-level flow table)和组表(group table),我们进一步提出了一个具体的系统设计和实现方案。大量的实验结果表明我们的方案具有节省时间的优势,并且比现有的错误恢复方案相比可以减少45%的拥塞,利用少量的流表空间开销就可以稳定地在现有的Openflow交换机上实现。

关键词: 数据中心网络; 软件定义网络; 网络更新; 数据平面鲁棒性; 集中式流量工程; Openflow

作者介绍:郑嘉琦,男,南京大学计算机科学与技术系博士研究生。2015年入选国家建设高水平大学公派研究生项目,于2015年10月至2016年10月期间,作为国家留学基金委员会的联合培养博士生,以访问学者身份在美国天普大学(Temple University)交流学习。于2015年1月到2015年6月期间,在香港城市大学担任助理研究员(Research Assistant ),与香港华为诺亚方舟实验室(Huawei Noah' S Ark Lab)合作从事数据中心网络方面的研究。2015年荣获计算机网络国际一流会 议IEEE ICNP最佳论文奖。

成为VIP会员查看完整内容
1

相关内容

陈贵海,南京大学教授、博导。1984年获南京大学计算机软件专业学士学位,1987年获东南大学计算机应用专业硕士学位,1997年获得香港大学计算机科学博士学位,1998年任日本九州工业大学访问教授,1999年任香港大学研究员,2000年任澳洲昆士兰大学访问教授,2001~2003年受任美国韦恩州立大学访问教授 (http://ece.eng.wayne.edu/~gchen/)。主要研究方向为分布式网络与数据处理,包括未来网络系统与协议、无线网络结构与优化、物联网与传感网、新型计算机体系结构、数据中心核心技术、数据分析与处理等。 已发表论文450余篇。Google Scholar引用12000余次,单篇论文最高引用1200余次。多次获得国际会议论文奖,包括2009年MOBICOM最佳展示提名奖、2011年INFOCOM学生最佳展示一等奖、2014年ICCS最佳学生论文奖、2014年AAMAS全球交易代理竞赛冠军、2015年ICNP最佳论文奖、2016年ICPADS最佳论文奖、2016年CloudComp最佳论文奖、2017年DSAFA最佳论文奖、2017年INFOCOM最佳论文提名奖、2018年CSoNet最佳学生论文奖、2018年AAIM最佳学生论文奖。现为中国计算机学会会士,中国计算机学会分布计算与系统专委会主任,担任国际学术会议的程序委员或主席60余次。曾获多种奖励,包括2000年江苏省跨世纪学术带头人称号、2001年江苏省教学成果二等奖、2002年教育部高校青年教师奖、2003年国家自然科学基金委员会项目特优评价、2004年中创软件人才奖、2005年南京市人民政府颁发的留学回国人员特殊贡献奖、2006年江苏省六大人才高峰称号、2008年国家杰出青年科学基金、2011年国务院政府特殊津贴、2015年教育部自然科学一等奖等(第一完成人) 、2018年江苏省科学技术一等奖(第一完成人)。
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
158+阅读 · 2019年12月26日
【泡泡图灵智库】协同视觉-惯性SLAM
泡泡机器人SLAM
28+阅读 · 2019年9月6日
通用矩阵乘(GEMM)优化与卷积计算
极市平台
50+阅读 · 2019年6月19日
《常用算法之智能计算 (四) 》:遗传算法
数盟
4+阅读 · 2018年12月21日
已删除
将门创投
9+阅读 · 2018年12月19日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
已删除
将门创投
4+阅读 · 2018年6月12日
图上的归纳表示学习
科技创新与创业
22+阅读 · 2017年11月9日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
12+阅读 · 2017年5月19日
Arxiv
34+阅读 · 2019年11月7日
One-Shot Federated Learning
Arxiv
9+阅读 · 2019年3月5日
Arxiv
3+阅读 · 2018年3月13日
Arxiv
4+阅读 · 2017年4月12日
VIP会员
相关VIP内容
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
158+阅读 · 2019年12月26日
相关资讯
【泡泡图灵智库】协同视觉-惯性SLAM
泡泡机器人SLAM
28+阅读 · 2019年9月6日
通用矩阵乘(GEMM)优化与卷积计算
极市平台
50+阅读 · 2019年6月19日
《常用算法之智能计算 (四) 》:遗传算法
数盟
4+阅读 · 2018年12月21日
已删除
将门创投
9+阅读 · 2018年12月19日
面向云端融合的分布式计算技术研究进展与趋势
中国计算机学会
18+阅读 · 2018年11月27日
已删除
将门创投
4+阅读 · 2018年6月12日
图上的归纳表示学习
科技创新与创业
22+阅读 · 2017年11月9日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
12+阅读 · 2017年5月19日
相关论文
微信扫码咨询专知VIP会员