这篇经过彻底修改的指南演示了命令行的灵活性如何帮助您成为更高效和高效的数据科学家。您将学习如何组合小型但功能强大的命令行工具来快速获取、清理、探索和建模您的数据。首先,作者Jeroen Janssens提供了一个Docker映像,其中包含超过100个Unix强大工具——无论您是在Windows、macOS还是Linux上工作都很有用。

您将很快发现为什么命令行是一种敏捷的、可伸缩的和可扩展的技术。即使您习惯于使用Python或R处理数据,您也将了解如何通过利用命令行的强大功能来极大地改进数据科学工作流。本书是数据科学家、分析师、工程师、系统管理员和研究人员的理想读物。

  • 从网站、API、数据库和电子表格中获取数据
  • 对文本、CSV、HTML、XML和JSON文件执行擦洗操作
  • 研究数据,计算描述性统计数据,并创建可视化
  • 管理您的数据科学工作流
  • 从一行程序和现有的Python或R代码创建您自己的工具
  • 并行和分发数据密集型管道
  • 用降维、回归和分类算法建模数据
  • 利用Python、Jupyter、R、RStudio和Apache Spark中的命令行
成为VIP会员查看完整内容
42

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【开放书】Python + Matplotlib可视化指南,249页pdf
专知会员服务
95+阅读 · 2021年11月17日
【干货书】Python 数据科学学习手册,548页pdf
专知会员服务
85+阅读 · 2021年3月14日
专知会员服务
90+阅读 · 2020年12月26日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
229+阅读 · 2020年5月21日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
139+阅读 · 2020年5月19日
Python导论,476页pdf,现代Python计算
专知会员服务
253+阅读 · 2020年5月17日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
173+阅读 · 2020年1月1日
Jupyter Notebooks数据科学最佳实践指南
AI研习社
4+阅读 · 2019年3月4日
数据科学、机器学习IDE概览
论智
8+阅读 · 2018年11月12日
10本必读的机器学习和数据科学免费在线电子书
算法与数据结构
11+阅读 · 2018年6月19日
这可能是学习Python最好的免费在线电子书
程序猿
51+阅读 · 2018年5月17日
Arxiv
20+阅读 · 2021年12月19日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
5+阅读 · 2016年1月15日
VIP会员
相关VIP内容
【开放书】Python + Matplotlib可视化指南,249页pdf
专知会员服务
95+阅读 · 2021年11月17日
【干货书】Python 数据科学学习手册,548页pdf
专知会员服务
85+阅读 · 2021年3月14日
专知会员服务
90+阅读 · 2020年12月26日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
229+阅读 · 2020年5月21日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
139+阅读 · 2020年5月19日
Python导论,476页pdf,现代Python计算
专知会员服务
253+阅读 · 2020年5月17日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
189+阅读 · 2020年3月12日
【书籍推荐】简洁的Python编程(Clean Python),附274页pdf
专知会员服务
173+阅读 · 2020年1月1日
微信扫码咨询专知VIP会员