这本实用指南作者Sev Leonard提供了一种在云中设计可扩展数据管道的整体方法,以解决低成本入门后可能演变成重要开销的问题。对于开发数据管道的团队,特别是在技术和工作负载快速变化的情况下,需要不断进行重新设计,这是一个挑战。本书将帮助中级数据工程师、软件开发人员和架构师学习如何在成本和性能之间进行权衡,并选择和配置计算和存储。同时,您还将掌握代码开发、测试和监控的最佳实践。通过关注整个设计过程,您将能够提供成本效益高、质量高的产品。本书可以帮助您:- 通过选择成本较低的云服务和智能设计策略,减少云服务支出- 通过合理配置计算资源,最大程度地减少浪费而不损失性能- 通过有效的监控,推动管道的发展,防止性能问题并快速调试- 设置开发和测试环境,尽量减少对云服务的依赖- 创建可测试和可扩展的数据管道代码库,促进快速开发和演进- 通过验证和测试提高数据质量和管道操作效率。通过本书,您将学习如何在云上交付可扩展且高度可用的产品,同时保持成本可控。这对于在不断变化的技术和工作负载下开发数据管道的团队非常有用。

成为VIP会员查看完整内容
32

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【2023新书】数字孪生:动态系统与计算视角,252页pdf
专知会员服务
112+阅读 · 2023年4月2日
【2022新书】高效Go语言,数据驱动的性能优化,776页pdf
专知会员服务
55+阅读 · 2022年11月23日
【Manning新书】面向数据编程降低软件复杂度,426页pdf
专知会员服务
74+阅读 · 2022年9月5日
【2021新书】分布式优化,博弈和学习算法,227页pdf
专知会员服务
216+阅读 · 2021年5月25日
【干货书】现代数据平台架构,636页pdf
专知会员服务
250+阅读 · 2020年6月15日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
139+阅读 · 2020年5月19日
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
11+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
131+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
325+阅读 · 2023年3月31日
Arxiv
53+阅读 · 2023年3月26日
Arxiv
111+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
5+阅读 · 2017年6月30日
国家自然科学基金
11+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员