Dask是一个并行计算库,能在集群中进行分布式计算,能以一种更方便简洁的方式处理大数据量,与Spark这些大数据处理框架相比较,Dask更轻。Dask更侧重与其他框架,如:Numpy,Pandas,Scikit-learning相结合,从而使其能更加方便进行分布式并行计算。

精品内容

【电子书推荐】Data Science with Python and Dask
专知会员服务
42+阅读 · 2019年6月1日
参考链接
微信扫码咨询专知VIP会员