使用Microsoft Excel中流行的数据挖掘技术,更好地理解机器学习方法。

软件工具和编程语言包接受数据输入并直接交付数据挖掘结果,对工作机制没有任何见解,并在输入和输出之间造成了鸿沟。这就是Excel可以提供帮助的地方。

Excel允许您以透明的方式处理数据。当您打开一个Excel文件时,数据立即可见,您可以直接使用它。在执行挖掘任务时,可以检查中间结果,从而更深入地理解如何操作数据和获得结果。这些是隐藏在软件工具和编程语言包中的模型构建过程的关键方面。

这本书教你通过Excel进行数据挖掘。您将了解当数据集不是很大时Excel在数据挖掘方面的优势。它可以为您提供数据挖掘的可视化表示,在结果中建立信心。您将手动完成每一个步骤,这不仅提供了一个主动学习体验,而且还告诉您挖掘过程是如何工作的,以及如何发现数据内部隐藏的模式。

你将学到什么

  • 使用可视化的一步一步的方法理解数据挖掘
  • 首先从理论上介绍了一种数据挖掘方法,然后是Excel的实现
  • 揭开机器学习算法背后的神秘面纱,让每个人都能接触到一个复杂的话题
  • 熟练使用Excel公式和函数
  • 获得数据挖掘和Excel的实际操作经验

这本书是给谁的

  • 任何对学习数据挖掘或机器学习感兴趣的人,特别是数据科学视觉学习者和擅长Excel的人,希望探索数据科学主题和/或扩展他们的Excel技能的人。建议对Excel有基本或初级的了解。
成为VIP会员查看完整内容
0
61

相关内容

本书建立在基本的Python教程的基础上,解释了许多没有被常规覆盖的Python语言特性:从通过利用入口点作为微服务扮演双重角色的可重用控制台脚本,到使用asyncio高效地整理大量来源的数据。通过这种方式,它涵盖了基于类型提示的linting、低开销测试和其他自动质量检查,以演示一个健壮的实际开发过程。

Python的一些功能强大的方面通常用一些设计的示例来描述,这些示例仅作为一个独立示例来解释该特性。通过遵循从原型到生产质量的真实应用程序示例的设计和构建,您不仅将看到各种功能是如何工作的,而且还将看到它们如何作为更大的系统设计过程的一部分进行集成。此外,您还将受益于一些有用的附加说明和库建议,它们是Python会议上问答会议的主要内容,也是讨论现代Python最佳实践和技术的主要内容,以便更好地生成易于维护的清晰代码。

高级Python开发是为已经能用Python编写简单程序的开发人员准备的,这些开发人员希望了解什么时候使用新的和高级语言特性是合适的,并且能够以一种自信的方式这样做。它对于希望升级到更高级别的开发人员和迄今为止使用过较老版本Python的非常有经验的开发人员特别有用。

你将学习

  • 理解异步编程
  • 检查开发插件架构
  • 使用类型注释
  • 回顾测试技术
  • 探索打包和依赖项管理

这本书是给谁的 -已经有Python经验的中高级开发人员。

成为VIP会员查看完整内容
0
156

首先加速介绍R生态系统、编程语言和工具,包括R脚本和RStudio。通过使用许多例子和项目,这本书教你如何将数据导入R,以及如何使用R处理这些数据。一旦基础扎实,《实用R 4》的其余部分将深入具体的项目和例子,从使用R和LimeSurvey运行和分析调查开始。接下来,您将使用R和MouselabWeb执行高级统计分析。然后,您将看到在没有统计信息的情况下R如何工作,包括如何使用R自动化数据格式化、操作、报告和自定义函数。

本书的最后一部分讨论了在服务器上使用R;您将使用R构建一个脚本,该脚本可以运行RStudio服务器并监视报表源的更改,以便在发生更改时向用户发出警报。这个项目包括定期电子邮件提醒和推送通知。最后,您将使用R创建一个定制的个人最重要信息的每日纲要报告,例如天气报告、每日日历、待办事项等等。这演示了如何自动化这样一个过程,以便用户每天早上导航到相同的web页面并获得更新的报告。

你将学到什么

  • 设置并运行R脚本,包括在新机器上的安装以及下载和配置R
  • 使用RStudio Server将任何机器变成可从任何地方访问的强大数据分析平台
  • 编写基本的脚本并修改现有的脚本以满足自己的需要。
  • 在R中创建基本的HTML报告,根据需要插入信息
  • 构建一个基本的R包并发布它

这本书是给谁的

  • 建议您之前接触过统计学、编程和SAS,但不是必需的。
成为VIP会员查看完整内容
0
65

通过这个紧凑的实用指南,开始使用Python进行数据分析。这本书包括三个练习和一个用正确的格式从Python代码中获取数据的案例研究。使用Python学习数据分析还可以帮助您使用分析发现数据中的意义,并展示如何可视化数据。

每一节课都尽可能是独立的,允许您根据需要插入和退出示例。如果您已经在使用Python进行数据分析,那么您会发现您希望知道如何使用Python来完成许多事情。然后,您可以将这些技术直接应用到您自己的项目中。

如果您不使用Python进行数据分析,那么本书从一开始就带您了解基础知识,为您在该主题中打下坚实的基础。当你阅读完这本书的时候,你会对如何使用Python进行数据分析有更好的理解。

你将学到什么

  • 从Python代码中获取数据
  • 准备数据及其格式
  • 找出数据的意义
  • 使用iPython可视化数据

这本书是给谁的

想学习使用Python进行数据分析的同学。建议您具有Python方面的经验,但不是必需的,因为您需要具有数据分析或数据科学方面的经验。

成为VIP会员查看完整内容
0
128

有兴趣的数据科学专业人士可以通过本书学习Scikit-Learn图书馆以及机器学习的基本知识。本书结合了Anaconda Python发行版和流行的Scikit-Learn库,演示了广泛的有监督和无监督机器学习算法。通过用Python编写的清晰示例,您可以在家里自己的机器上试用和试验机器学习的原理。

所有的应用数学和编程技能需要掌握的内容,在这本书中涵盖。不需要深入的面向对象编程知识,因为工作和完整的例子被提供和解释。必要时,编码示例是深入和复杂的。它们也简洁、准确、完整,补充了介绍的机器学习概念。使用示例有助于建立必要的技能,以理解和应用复杂的机器学习算法。

对于那些在机器学习方面追求职业生涯的人来说,Scikit-Learn机器学习应用手册是一个很好的起点。学习这本书的学生将学习基本知识,这是胜任工作的先决条件。读者将接触到专门为数据科学专业人员设计的蟒蛇分布,并将在流行的Scikit-Learn库中构建技能,该库是Python世界中许多机器学习应用程序的基础。

你将学习

  • 使用Scikit-Learn中常见的简单和复杂数据集
  • 将数据操作为向量和矩阵,以进行算法处理
  • 熟悉数据科学中使用的蟒蛇分布
  • 应用带有分类器、回归器和降维的机器学习
  • 优化算法并为每个数据集找到最佳算法
  • 从CSV、JSON、Numpy和panda格式加载数据并保存为这些格式

这本书是给谁的

  • 有抱负的数据科学家渴望通过掌握底层的基础知识进入机器学习领域,而这些基础知识有时在急于提高生产力的过程中被忽略了。一些面向对象编程的知识和非常基本的线性代数应用将使学习更容易,尽管任何人都可以从这本书获益。
成为VIP会员查看完整内容
0
174

理解并实施panda的大数据分析解决方案,强调性能。本书通过探索其底层实现和数据结构,增强了您使用Python数据分析库pandas的直觉。

《Pandas 编程思想》介绍了大数据的主题,并通过观看pandas帮助解决的激动人心和有影响力的项目来展示概念。从那里,您将学习按大小和类型评估您自己的项目,以确定pandas是否适合您的需要。作者Hannah Stepanek解释了如何在pandas中有效地加载和规范化数据,并回顾了一些最常用的加载器和它们的几个最强大的选项。然后,您将了解如何有效地访问和转换数据,应该避免哪些方法,以及何时使用更高级的性能技术。您还将学习基本的数据访问、学习panda和直观的字典语法。此外,还讨论了如何选择正确的DataFrame格式、使用多层次的DataFrame以及将来如何改进panda。

在本书结束时,您将对pandas库的底层工作原理有一个牢固的理解。准备好用正确的方法在你自己的项目中做出自信的决定。

你将学到什么

  • 理解pandas的底层数据结构,以及为什么在某些情况下它会这样执行
  • 了解如何使用pandas正确地提取、转换和加载数据,重点关注性能
  • 选择正确的数据格式,使数据分析简单有效。
  • 使用其他Python库提高pandas操作的性能

这本书是给谁的

  • 具有基本Python编程技能的软件工程师热衷于在大数据分析项目中使用pandas。Python软件开发人员对大数据感兴趣。
成为VIP会员查看完整内容
0
105

从数据科学的角度研究Python,并学习用于做出关键业务决策的数据可视化的成熟技术。从介绍Python的数据科学开始,您将进一步了解Python环境,并熟悉Jupyter Notebook和Spyder等编辑器。通过Python编程入门之后,您将掌握数据科学中使用的基本Python编程技术。接下来是数据可视化,您将看到它如何满足现代业务需求并形成决策的关键因素。您还将了解Python中一些流行的数据可视化库。

将重点转移到数据结构,您将从数据科学的角度了解数据结构的各个方面。然后使用Python处理文件I/O和正则表达式,然后收集和清理数据。继续探索和分析数据,您将看到Python中的高级数据结构。然后,您将深入研究数据可视化技术,了解Python中的许多绘图系统。

最后,您将完成一个详细的案例研究,您将有机会重温到目前为止介绍的概念。

你会学到什么

  • 在数据科学中使用Python编程技术
  • Python中的主数据收集
  • 为BI系统创建引人入胜的可视化
  • 部署收集和清理数据的有效策略
  • 整合Seaborn和Matplotlib绘图系统

这本书是给谁看的

具有基本Python编程知识的开发人员希望采用使用Python进行数据分析和可视化的关键策略。

成为VIP会员查看完整内容
0
115

本书通过提供真实的案例研究和示例,为使用Python库进行机器学习提供了坚实的基础。它涵盖了诸如机器学习基础、Python入门、描述性分析和预测分析等主题。包括高级机器学习概念,如决策树学习、随机森林、增强、推荐系统和文本分析。这本书在理论理解和实际应用之间采取了一种平衡的方法。所有的主题都包括真实世界的例子,并提供如何探索、构建、评估和优化机器学习模型的逐步方法。

成为VIP会员查看完整内容
Machine Learning using Python by Manaranjan Pradhan.pdf
0
235

在Python中获得操作、处理、清理和处理数据集的完整说明。本实用指南的第二版针对Python 3.6进行了更新,其中包含了大量的实际案例研究,向您展示了如何有效地解决广泛的数据分析问题。在这个过程中,您将学习最新版本的panda、NumPy、IPython和Jupyter。

本书由Python panda项目的创建者Wes McKinney编写,是对Python中的数据科学工具的实用的、现代的介绍。对于刚接触Python的分析人员和刚接触数据科学和科学计算的Python程序员来说,它是理想的。数据文件和相关材料可以在GitHub上找到。

  • 使用IPython外壳和Jupyter笔记本进行探索性计算
  • 学习NumPy (Numerical Python)中的基本和高级特性
  • 开始使用pandas库的数据分析工具
  • 使用灵活的工具来加载、清理、转换、合并和重塑数据
  • 使用matplotlib创建信息可视化
  • 应用panda groupby工具对数据集进行切片、切割和汇总
  • 分析和处理有规律和不规则的时间序列数据
  • 学习如何解决现实世界的数据分析问题与彻底的,详细的例子
成为VIP会员查看完整内容
0
124

这本书在对算法工作原理的高层次理解和对优化模型的具体细节的了解之间找到一个平衡点。这本书将给你的信心和技能时,开发所有主要的机器学习模型。在这本Pro机器学习算法中,您将首先在Excel中开发算法,以便在用Python/R实现模型之前,实际了解可以在模型中调优的所有细节。

你将涵盖所有主要的算法:监督和非监督学习,其中包括线性/逻辑回归;k - means聚类;主成分分析;推荐系统;决策树;随机森林;“GBM”;和神经网络。您还将通过CNNs、RNNs和word2vec等文本挖掘工具了解最新的深度学习。你不仅要学习算法,还要学习特征工程的概念来最大化模型的性能。您将看到该理论与案例研究,如情绪分类,欺诈检测,推荐系统,和图像识别,以便您得到最佳的理论和实践为工业中使用的绝大多数机器学习算法。在学习算法的同时,您还将接触到在所有主要云服务提供商上运行的机器学习模型。

你会学到什么?

  • 深入了解所有主要的机器学习和深度学习算法
  • 充分理解在构建模型时要避免的陷阱
  • 在云中实现机器学习算法
  • 通过对每种算法的案例研究,采用动手实践的方法
  • 学习集成学习的技巧,建立更精确的模型
  • 了解R/Python编程的基础知识和Keras深度学习框架

这本书是给谁看的

希望转换到数据科学角色的业务分析师/ IT专业人员。想要巩固机器学习知识的数据科学家。

成为VIP会员查看完整内容
0
135

书名: Deep Learning for Search

简介:

深度学习搜索是一本实用的书,关于如何使用(深度)神经网络来帮助建立有效的搜索引擎。这本书研究了一个搜索引擎的几个组成部分,提供了关于它们如何工作的见解以及如何在每个环境中使用神经网络的指导。重点介绍了基于实例的实用搜索和深度学习技术,其中大部分都有代码。同时,在适当的地方提供相关研究论文的参考资料,以鼓励阅读更多的书籍,加深对特定主题的知识。

读完这本书,将对搜索引擎的主要挑战有所理解,它们是如何被普遍解决的以及深度学习可以做些什么来帮助。并且将对几种不同的深度学习技术以及它们在搜索环境中的适用范围有一个理解,将很好地了解Lucene和Deeplearning4j库。

这本书主要分为3个部分:

  • 第1部分介绍了搜索、机器学习和深度学习的基本概念。第一章介绍了应用深度学习技术来搜索问题的原理,涉及了信息检索中最常见的方法。第2章给出了如何使用神经网络模型从数据中生成同义词来提高搜索引擎效率的第一个例子。

  • 第2部分讨论了可以通过深度神经网络更好地解决的常见搜索引擎任务。第3章介绍了使用递归神经网络来生成用户输入的查询。第四章在深度神经网络的帮助下,在用户输入查询时提供更好的建议。第5章重点介绍了排序模型:尤其是如何使用词嵌入提供更相关的搜索结果。第6章讨论了文档嵌入在排序函数和内容重新编码上下文中的使用。

  • 第3部分将介绍更复杂的场景,如深度学习机器翻译和图像搜索。第7章通过基于神经网络的方法为你的搜索引擎提供多语言能力来指导你。第8章讨论了基于内容的图像集合的搜索,并使用了深度学习模型。第9章讨论了与生产相关的主题,如微调深度学习模型和处理不断输入的数据流。

作者简介:

Tommaso Teofili是一名软件工程师,他对开源机器学习充满热情。作为Apache软件基金会的成员,他为许多开放源码项目做出了贡献,从信息检索到自然语言处理和机器翻译等主题。他目前在Adobe工作,开发搜索和索引基础结构组件,并研究自然语言处理、信息检索和深度学习等领域。他曾在各种会议上发表过搜索和机器学习方面的演讲,包括BerlinBuzzwords、计算科学国际会议、ApacheCon、EclipseCon等。

成为VIP会员查看完整内容
0
155
小贴士
相关VIP内容
专知会员服务
156+阅读 · 2020年7月31日
专知会员服务
65+阅读 · 2020年7月1日
专知会员服务
128+阅读 · 2020年6月29日
专知会员服务
174+阅读 · 2020年6月10日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
235+阅读 · 2020年3月17日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
124+阅读 · 2020年3月12日
专知会员服务
135+阅读 · 2020年2月11日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
155+阅读 · 2020年1月13日
相关论文
Domain Representation for Knowledge Graph Embedding
Cunxiang Wang,Feiliang Ren,Zhichao Lin,Chenxv Zhao,Tian Xie,Yue Zhang
10+阅读 · 2019年9月11日
Canran Xu,Ruijiang Li
8+阅读 · 2019年6月3日
Discovery and recognition of motion primitives in human activities
Marta Sanzari,Valsamis Ntouskos,Fiora Pirri
4+阅读 · 2019年2月4日
Liang Yao,Chengsheng Mao,Yuan Luo
27+阅读 · 2018年11月13日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Brendan O'Donoghue
3+阅读 · 2018年7月25日
Ahmet Iscen,Giorgos Tolias,Yannis Avrithis,Ondrej Chum
6+阅读 · 2018年3月29日
Tomasz Jurczyk,Amit Deshmane,Jinho Choi
5+阅读 · 2018年1月6日
Top