Spark - 专知主题

会员服务 ·

Spark

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

精品内容

【2023新书】使用Spark扩展机器学习:使用MLlib、TensorFlow和PyTorch实现分布式机器学习530页pdf

【2023新书】使用Spark扩展机器学习:使用MLlib、TensorFlow和PyTorch实现分布式机器学习530页pdf

专知会员服务

79+阅读 · 2023年3月24日

【2020新书】企业级机器学习: Spark XGBoost LightGBM, NLP, Keras深度学习, 367页pdf

【2020新书】企业级机器学习: Spark XGBoost LightGBM, NLP, Keras深度学习, 367页pdf

专知会员服务

115+阅读 · 2020年2月24日

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

专知会员服务

98+阅读 · 2019年12月4日

【O'Reilly AI Conference 2019】LinkedIn上的机器学习挑战：Spark，TensorFlow等（Machine learning challenges at LinkedIn: Spark, TensorFlow, and beyond)，LinkedIn，Zhe Zhang

【O'Reilly AI Conference 2019】LinkedIn上的机器学习挑战：Spark，TensorFlow等（Machine learning challenges at LinkedIn: Spark, TensorFlow, and beyond)，LinkedIn，Zhe Zhang

专知会员服务

7+阅读 · 2019年11月5日

【O'Reilly AI Conference 2019】使用GPU和Docker容器进行Horovod和Spark深度学习（Deep learning with Horovod and Spark using GPUs and Docker containers），BlueData的联合创始人兼首席架构师Thomas Phelan

【O'Reilly AI Conference 2019】使用GPU和Docker容器进行Horovod和Spark深度学习（Deep learning with Horovod and Spark using GPUs and Docker containers），BlueData的联合创始人兼首席架构师Thomas Phelan

专知会员服务

21+阅读 · 2019年11月5日

参考链接

父主题

大数据处理

数据批处理框架

子主题

微信扫码咨询专知VIP会员