Over the last two decades, ROOT TTree has been used for storing over one exabyte of High-Energy Physics (HEP) events. The TTree columnar on-disk layout has been proved to be ideal for analyses of HEP data that typically require access to many events, but only a subset of the information stored for each of them. Future colliders, and particularly HL-LHC, will bring an increase of at least one order of magnitude in the volume of generated data. Therefore, the use of modern storage hardware, such as low-latency high-bandwidth NVMe devices and distributed object stores, becomes more important. However, TTree was not designed to optimally exploit modern hardware and may become a bottleneck for data retrieval. The ROOT RNTuple I/O system aims at overcoming TTree's limitations and at providing improved efficiency for modern storage systems. In this paper, we extend RNTuple with a backend that uses Intel DAOS as the underlying storage, demonstrating that the RNTuple architecture can accommodate high-performance object stores. From the user perspective, data can be accessed with minimal changes to the code, that is by replacing a filesystem path by a DAOS URI. Our performance evaluation shows that the new backend can be used for realistic analyses, while outperforming the compatibility solution provided by the DAOS project.


翻译:在过去20年中,ROOT TTree被用于储存一个多版本的高能物理(HEP)事件。TTree 磁盘上的磁盘布局被证明是分析HEP数据的理想,这些数据通常需要访问许多事件,但只是每个事件储存的信息的一个子集。未来的对撞器,特别是HL-LHC,将带来至少一个数量级的增加。因此,使用现代存储硬件,如低延迟高频高频NVME设备和分布式对象存储器,变得更为重要。然而,TTTree不是设计来最佳利用现代硬件的,而可能成为数据检索的瓶颈。ROOT RNTuple I/O系统的目的是克服TTree的局限性,提高现代存储系统的效率。在本文中,我们扩展RNTUPU, 其后端将使用Intel DAOS作为基础存储器, 表明RNTUPOS 结构可以容纳高性能的兼容性设计器,而DADA系统则通过使用最低性分析来取代数据系统。

0
下载
关闭预览

相关内容

专知会员服务
123+阅读 · 2020年9月8日
专知会员服务
38+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
已删除
将门创投
4+阅读 · 2019年11月8日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
Arxiv
0+阅读 · 2021年9月16日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
5+阅读 · 2016年1月15日
VIP会员
相关VIP内容
专知会员服务
123+阅读 · 2020年9月8日
专知会员服务
38+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
已删除
将门创投
4+阅读 · 2019年11月8日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
Top
微信扫码咨询专知VIP会员