利用机器和深度学习模型,使用PySpark在实时数据上构建应用程序。这本书对于那些想要学习使用这种语言来执行探索性数据分析和解决一系列商业挑战的人来说是完美的。

您将从回顾PySpark的基础知识开始,例如Spark的核心架构,并了解如何使用PySpark进行大数据处理,如数据摄取、清理和转换技术。接下来,使用PySpark构建用于分析流数据的工作流,并比较各种流平台。

然后,您将看到如何使用带PySpark的气流调度不同的Spark作业,并通过本书检查调优机和深度学习模型进行实时预测。本书最后讨论了图帧以及在PySpark中使用图算法执行网络分析。书中提供的所有代码都可以在Github的Python脚本中找到。

成为VIP会员查看完整内容
47

相关内容

Python是一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言。
【2021新书】基于Python的实用深度学习概述,464页pdf
专知会员服务
85+阅读 · 2021年10月25日
【干货书】Python机器学习,361页pdf
专知会员服务
255+阅读 · 2021年2月25日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
18+阅读 · 2019年1月16日
Arxiv
25+阅读 · 2018年8月19日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员