当深度学习遇见大数据:一文概览BDL学习框架

2018 年 7 月 6 日 专知

【导读】深度学习的出现让许多机器学习从业者将目光从Spark等大数据计算框架转移到了TensorFlow、PyTorch等深度学习框架上。然而,大数据框架与深度学习框架并不是相互排斥的关系,它们之间有很好的结合。本文介绍一些大数据框架与深度学习框架的结合体。


TensorFlowOnSpark


简介:Yahoo的TensorFlowOnSpark可以让你在Spark集群上使用TensorFlow,也就是说,你可以利用Spark充分利用集群中大量机器的资源,同时可以利用TensorFlow使用节点中GPU超强的计算能力。


项目地址:

https://github.com/yahoo/TensorFlowOnSpark

文档地址:

https://github.com/yahoo/TensorFlowOnSpark/wiki



CaffeOnSpark


简介:同样也是Yahoo出品的开源软件,与TensorFlowOnSpark类似,只不过使用的深度学习框架是Caffe。


项目地址:

https://github.com/yahoo/CaffeOnSpark

文档地址:

https://github.com/yahoo/CaffeOnSpark/wiki



elephas


简介:在Spark上使用Keras。相对于TensorFlow、PyTorch,Keras具有相对简单易用的接口和各种工具类,更适合开发人员使用。elephas使得大数据工程师可以方便地在自己熟悉的Spark中使用容易上手深度学习框架Keras。


项目地址:

https://github.com/maxpumperla/elephas

文档地址:

http://maxpumperla.com/elephas/



Deeplearning4j


简介:Deeplearning4j由一个叫Skymind的小公司发起,后被加入Eclipse开源软件。虽然它难用、不灵活、不适合做模型迭代,但是Deeplearning4j是深度学习生态圈中屈指可数的几个用Java编写的框架之一,另外,它原生支持在Spark中运行。对于数据量大、模型相对固定且不需要复杂科学计算流程的任务,Deeplearning4j是一个不错的选择。


项目地址:

https://github.com/deeplearning4j/deeplearning4j

文档地址:

https://deeplearning4j.org/documentation



BigDL


简介:BigDL是另一个Java生态圈中的深度学习框架,原生就有Spark支持。相对于Deeplearning4j,BigDL具有更为强大的开发团队支持,它是由Intel发起的开源项目。BigDL的目标之一就是充分利用大规模集群中的Intel CPU,这也是它的弱点之一:没有GPU支持。


项目地址:

https://github.com/intel-analytics/BigDL

文档地址:

https://github.com/intel-analytics/BigDL/wiki


-END-

专 · 知


人工智能领域主题知识资料查看与加入专知人工智能服务群

【专知AI服务计划】专知AI知识技术服务会员群加入人工智能领域26个主题知识资料全集获取欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~



关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

登录查看更多
0

相关内容

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
【干货书】现代数据平台架构,636页pdf
专知会员服务
250+阅读 · 2020年6月15日
【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架
专知会员服务
25+阅读 · 2020年5月25日
【CMU】深度学习模型中集成优化、约束和控制,33页ppt
专知会员服务
44+阅读 · 2020年5月23日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
117+阅读 · 2020年5月6日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
【课程】伯克利2019全栈深度学习课程(附下载)
专知会员服务
54+阅读 · 2019年10月29日
Pytorch作者Adam Paszke-53页Pytorch教程PPT
专知
34+阅读 · 2018年10月27日
181页机器学习Python介绍书籍pdf下载
专知
16+阅读 · 2018年8月11日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
基于TensorFlow的深度学习实战
七月在线实验室
9+阅读 · 2018年4月25日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
A Survey on Bayesian Deep Learning
Arxiv
60+阅读 · 2020年7月2日
Arxiv
38+阅读 · 2020年3月10日
Arxiv
19+阅读 · 2019年11月23日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
53+阅读 · 2018年12月11日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
相关VIP内容
相关资讯
相关论文
A Survey on Bayesian Deep Learning
Arxiv
60+阅读 · 2020年7月2日
Arxiv
38+阅读 · 2020年3月10日
Arxiv
19+阅读 · 2019年11月23日
Arxiv
8+阅读 · 2019年3月28日
Arxiv
53+阅读 · 2018年12月11日
3D-LaneNet: end-to-end 3D multiple lane detection
Arxiv
7+阅读 · 2018年11月26日
Arxiv
19+阅读 · 2018年3月28日
Top
微信扫码咨询专知VIP会员