We present KumQuat, a system for automatically generating data parallel implementations of Unix shell commands and pipelines. The generated parallel versions split input streams, execute multiple instantiations of the original pipeline commands to process the splits in parallel, then combine the resulting parallel outputs to produce the final output stream. KumQuat automatically synthesizes the combine operators, with a domain-specific combiner language acting as a strong regularizer that promotes efficient inference of correct combiners. We evaluate KumQuat on 70 benchmark scripts that together have a total of 427 stages. KumQuat synthesizes a correct combiner for 113 of the 121 unique commands that appear in these benchmark scripts. The synthesis times vary between 39 seconds and 331 seconds with a median of 60 seconds. We present experimental results that show that these combiners enable the effective parallelization of our benchmark scripts.


翻译:我们展示了 KumQuat, 这是一个自动生成Unix shell 命令和管道数据平行执行数据的系统。 生成的平行版本分解输入流, 执行原始管道命令的多次即时同步以平行处理拆分, 然后将由此产生的平行输出合并来生成最终输出流。 KumQuat 自动合成组合操作员, 并使用特定域的组合语言作为强大的调节器, 从而推动正确组合器的有效推断。 我们根据70个基准脚本对 KumQuat 进行了评估, 这些脚本共有427 个阶段。 KumQuat 合成了这些基准脚本中显示的121个独有命令中的113个的正确组合器。 合成时间在39 秒到 331秒之间, 中位为60秒。 我们提出实验结果, 显示这些组合器能够有效地平行使用我们的基准脚本。

0
下载
关闭预览

相关内容

UNIX操作系统(UNIX),是美国AT&T公司1971年在PDP-11上运行的操作系统。具有多用户、多任务的特点,支持多种处理器架构,最早由肯·汤普逊(Kenneth Lane Thompson)、丹尼斯·里奇(Dennis MacAlistair Ritchie)和道格拉斯·麦克罗伊于1969年在AT&T的贝尔实验室开发。 现为 Linux、BSD 和 Solaris 等多种符合 POSIX 标准的「Unix 类操作系统」的统称。
【干货书】计算机科学家的数学,153页pdf
专知会员服务
165+阅读 · 2021年7月27日
【干货书】计算机科学,647页pdf,Computer Science
专知会员服务
44+阅读 · 2021年5月10日
【干货书】机器学习速查手册,135页pdf
专知会员服务
122+阅读 · 2020年11月20日
【干货书】流畅Python,766页pdf,中英文版
专知会员服务
223+阅读 · 2020年3月22日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
144+阅读 · 2019年10月12日
《机器学习实战》代码(基于Python3)
专知
32+阅读 · 2019年10月14日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Msfvenom 常用生成 Payload 命令
黑白之道
9+阅读 · 2019年2月23日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【推荐】Python机器学习生态圈(Scikit-Learn相关项目)
机器学习研究会
6+阅读 · 2017年8月23日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Paraphrase Generation with Deep Reinforcement Learning
Arxiv
4+阅读 · 2018年2月13日
Arxiv
7+阅读 · 2018年1月30日
VIP会员
相关资讯
《机器学习实战》代码(基于Python3)
专知
32+阅读 · 2019年10月14日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
Msfvenom 常用生成 Payload 命令
黑白之道
9+阅读 · 2019年2月23日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【推荐】Python机器学习生态圈(Scikit-Learn相关项目)
机器学习研究会
6+阅读 · 2017年8月23日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员