Compressed bitmap indexes are used in systems such as Git or Oracle to accelerate queries. They represent sets and often support operations such as unions, intersections, differences, and symmetric differences. Several important systems such as Elasticsearch, Apache Spark, Netflix's Atlas, LinkedIn's Pinot, Metamarkets' Druid, Pilosa, Apache Hive, Apache Tez, Microsoft Visual Studio Team Services and Apache Kylin rely on a specific type of compressed bitmap index called Roaring. We present an optimized software library written in C implementing Roaring bitmaps: CRoaring. It benefits from several algorithms designed for the single-instruction-multiple-data (SIMD) instructions available on commodity processors. In particular, we present vectorized algorithms to compute the intersection, union, difference and symmetric difference between arrays. We benchmark the library against a wide range of competitive alternatives, identifying weaknesses and strengths in our software. Our work is available under a liberal open-source license.


翻译:压缩的位图索引用于诸如 Git 或 Oracle 等系统以加速查询。 它们代表各组, 常常支持诸如工会、 交叉点、 差异和对称差异等操作。 一些重要的系统, 如 Elasticsearch、 Apache Spark、 Netflix's Atlas、 LinkedIn's Pinot、 Metmarked' Druid、 Pilosa、 Apache Hive、 Apache Tez、 微软视觉演播团队服务 和 Apache Kylin 等, 都依赖于一种特定类型的压缩位图索引, 叫做 Roaring。 我们展示了一个优化的软件库, 以 C 执行 Roaring Bitmaps: C Roarring 。 它受益于商品处理器上可用的单项指令的几种算法。 我们用自由的开放源许可提供我们的工作 。

0
下载
关闭预览

相关内容

Apache 是一个开放源代码的网页服务器,可以在大多数电脑操作系统中运行,由于其跨平台和安全性被广泛使用,是最流行的 Web 服务器端软件之一。 同时 Apache 也是一个专门为支持开源软件项目而办的一个非盈利性组织。
Linux导论,Introduction to Linux,96页ppt
专知会员服务
76+阅读 · 2020年7月26日
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
CCF推荐 | 国际会议信息10条
Call4Papers
7+阅读 · 2019年5月27日
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
8+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
随波逐流:Similarity-Adaptive and Discrete Optimization
我爱读PAMI
5+阅读 · 2018年2月6日
carla无人驾驶模拟中文项目 carla_simulator_Chinese
CreateAMind
3+阅读 · 2018年1月30日
计算机类 | 国际会议信息7条
Call4Papers
3+阅读 · 2017年11月17日
A Survey of Deep Learning for Scientific Discovery
Arxiv
29+阅读 · 2020年3月26日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
13+阅读 · 2018年4月6日
Arxiv
5+阅读 · 2018年3月6日
Arxiv
6+阅读 · 2018年2月28日
Arxiv
3+阅读 · 2017年11月20日
VIP会员
相关资讯
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
CCF推荐 | 国际会议信息10条
Call4Papers
7+阅读 · 2019年5月27日
时序数据异常检测工具/数据集大列表
极市平台
65+阅读 · 2019年2月23日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
8+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
随波逐流:Similarity-Adaptive and Discrete Optimization
我爱读PAMI
5+阅读 · 2018年2月6日
carla无人驾驶模拟中文项目 carla_simulator_Chinese
CreateAMind
3+阅读 · 2018年1月30日
计算机类 | 国际会议信息7条
Call4Papers
3+阅读 · 2017年11月17日
相关论文
A Survey of Deep Learning for Scientific Discovery
Arxiv
29+阅读 · 2020年3月26日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
Arxiv
5+阅读 · 2018年5月22日
Arxiv
13+阅读 · 2018年4月6日
Arxiv
5+阅读 · 2018年3月6日
Arxiv
6+阅读 · 2018年2月28日
Arxiv
3+阅读 · 2017年11月20日
Top
微信扫码咨询专知VIP会员