由于特征工程通常是特定于数据类型且依赖于应用程序的,本书包含专门介绍主要数据类型的特征工程的章节,如文本数据、图像数据、序列数据、时间序列数据、图形数据、流数据、软件工程数据、Twitter 数据和社交媒体数据。这些章节介绍了生成经过反复测试、手工制作的特定于域的功能以及自动通用功能生成方法(如 Word2Vec)的方法。

本书目录:

  1. 预览概述
  2. 文本数据特征工程 
  3. 视觉数据特征提取学习
  4. 基于特征的时序分析
  5. 数据特征流工程
  6. 序列特征生成与特征工程
  7. 图与网络特征生成
  8. 特征选择与评估
  9. 监督学习中的自动特征工程
  10. 基于模式的特征生成
  11. 深度学习特征表示
  12. 用于社交机器人检测的特征工程
  13. 用于软件分析的特征生成与工程
  14. Twitter应用特征工程

本书还包含有关特征选择、基于特征转换的自动方法、使用深度学习方法生成功能以及使用频繁和对比度模式生成特征的章节。有几章是关于在特定应用中使用特征工程的。

本书包含许多有用的特征工程概念和技术,这些概念和技术适用于多种方案:(a) 生成功能以表示没有要素时的数据,(b) 在(人们可能担心)存在时生成有效特征功能不够好/竞争力不够,(c) 在功能过多时选择功能,(d) 为特定类型的应用程序生成和选择有效功能,以及 (e) 了解与相关挑战以及需要处理的方法,各种数据类型。

成为VIP会员查看完整内容
0
46

相关内容

特征工程是使用领域知识通过数据挖掘技术从原始数据中提取特征的过程。这些功能可用于提高机器学习算法的性能。特征工程可以被认为是应用机器学习本身。

发现各种有用的数据挖掘算法,这些算法可以从庞大的候选数据中选择小的重要特征集,或者从测量变量中提取有用的特征。

作为一个严谨的数据挖掘程序员,您将经常面对数以千计的候选特征,用于您的预测或分类应用程序,其中大多数特征几乎没有价值或没有价值。您将知道,其中许多特征可能只有在与某些其他特征结合时才有用,而单独使用或与大多数其他特征结合时实际上是毫无价值的。有些特征可能具有巨大的预测能力,但只能在特征空间的一个小的、专门的领域内。这本书通过介绍现代的特性选择技术和实现这些技术的代码来帮助您解决这个问题。其中一些技巧是:

  • 正向选择分量分析
  • 当地的特征选择
  • 使用隐马尔可夫模型连接特征和目标

所有算法都得到了直观的证明,并得到了相关方程和解释材料的支持。作者还提供并解释了完整的、高度注释的源代码。

示例代码是C++和CUDA C,但Python或其他代码可以替换;重要的是算法,而不是用来编写算法的代码。

你将学到什么

  • 将主成分分析与向前和向后的逐步选择相结合,以确定在整个集合中捕获最大可能变异的大量变量集合的一个紧凑子集。

  • 识别仅对特征域的一个小子集具有预测能力的特征。这些特征可以被现代预测模型有效地利用,但可能被其他特征选择方法所遗漏。

  • 找出同时控制特征变量和目标分布的隐含马尔可夫模型。这种方法固有的记忆在高噪音应用中尤其有价值,例如金融市场的预测。

这本书是给谁的

中级到高级数据科学程序员和分析师。强烈推荐有c++和CUDA C的经验。然而,这本书可以作为框架使用其他语言,如Python。

成为VIP会员查看完整内容
0
29

通过机器学习的实际操作指南深入挖掘数据

机器学习: 为开发人员和技术专业人员提供实践指导和全编码的工作示例,用于开发人员和技术专业人员使用的最常见的机器学习技术。这本书包含了每一个ML变体的详细分析,解释了它是如何工作的,以及如何在特定的行业中使用它,允许读者在阅读过程中将所介绍的技术融入到他们自己的工作中。机器学习的一个核心内容是对数据准备的强烈关注,对各种类型的学习算法的全面探索说明了适当的工具如何能够帮助任何开发人员从现有数据中提取信息和见解。这本书包括一个完整的补充教师的材料,以方便在课堂上使用,使这一资源有用的学生和作为一个专业的参考。

机器学习的核心是一种基于数学和算法的技术,它是历史数据挖掘和现代大数据科学的基础。对大数据的科学分析需要机器学习的工作知识,它根据从训练数据中获得的已知属性形成预测。机器学习是一个容易理解的,全面的指导,为非数学家,提供明确的指导,让读者:

  • 学习机器学习的语言,包括Hadoop、Mahout和Weka
  • 了解决策树、贝叶斯网络和人工神经网络
  • 实现关联规则、实时和批量学习
  • 为安全、有效和高效的机器学习制定战略计划

通过学习构建一个可以从数据中学习的系统,读者可以在各个行业中增加他们的效用。机器学习是深度数据分析和可视化的核心,随着企业发现隐藏在现有数据中的金矿,这一领域的需求越来越大。对于涉及数据科学的技术专业人员,机器学习:为开发人员和技术专业人员提供深入挖掘所需的技能和技术。

成为VIP会员查看完整内容
0
54

简介: 特征工程在机器学习、数据挖掘和数据分析中起着关键作用。本文提供了特征工程的一般定义,以及该领域的主要问题、方法和挑战的概述。特征工程在大数据分析中起着关键作用。没有数据,机器学习和数据挖掘算法就无法工作。如果没有表示基础数据对象的功能,大数据分析则几乎不能实现,并且这些算法的结果质量在很大程度上取决于可用特征的质量。数据通常以各种形式存在,如图像、文本、图形、序列和时间序列。表示数据对象的常见方法是使用特征矢量。即使由特征向量表示的数据可能仍然需要新的有效特征。特征工程涉及满足生成和选择基于特征向量的有效数据表示的需求。

本书目录:

  • 1.预览概述
  • 2 文本数据特征工程 
  • 3 视觉数据特征提取学习
  • 4 基于特征的时序分析
  • 5 数据特征流工程
  • 6 序列特征生成与特征工程
  • 7 图与网络特征生成
  • 8 特征选择与评估
  • 9 监督学习中的自动特征工程
  • 10 基于模式的特征生成
  • 11 深度学习特征表示
  • 12 用于社交机器人检测的特征工程
  • 13 用于软件分析的特征生成与工程
  • 14 Twitter应用特征工程

下载链接: 链接:https://pan.baidu.com/s/1rshWh8-ST_Mtkw525mz-yQ

提取码:4abr

成为VIP会员查看完整内容
0
53

2018年出版了一本关于功能工程的新编辑书,其中12篇由主要专家就特征工程的不同方面提供章节。由于特征工程通常是特定于数据类型且依赖于应用程序的,本书包含专门介绍主要数据类型的特征工程的章节,如文本数据、图像数据、序列数据、时间序列数据、图形数据、流数据、软件工程数据、Twitter 数据和社交媒体数据。这些章节介绍了生成经过反复测试、手工制作的特定于域的功能以及自动通用功能生成方法(如 Word2Vec)的方法。

成为VIP会员查看完整内容
0
27
小贴士
相关论文
A Survey on Bayesian Deep Learning
Hao Wang,Dit-Yan Yeung
20+阅读 · 7月2日
Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark
Ke Li,Gang Wan,Gong Cheng,Liqiu Meng,Junwei Han
10+阅读 · 2019年9月22日
Interpretable machine learning: definitions, methods, and applications
W. James Murdoch,Chandan Singh,Karl Kumbier,Reza Abbasi-Asl,Bin Yu
11+阅读 · 2019年1月14日
Risk-Aware Active Inverse Reinforcement Learning
Daniel S. Brown,Yuchen Cui,Scott Niekum
3+阅读 · 2019年1月8日
Dinghan Shen,Martin Renqiang Min,Yitong Li,Lawrence Carin
5+阅读 · 2018年8月30日
Speeding-up Object Detection Training for Robotics with FALKON
Elisa Maiettini,Giulia Pasquale,Lorenzo Rosasco,Lorenzo Natale
6+阅读 · 2018年8月27日
K. Lakshmanan
6+阅读 · 2018年4月24日
Haque Ishfaq,Assaf Hoogi,Daniel Rubin
3+阅读 · 2018年4月3日
Nicole Novielli,Daniela Girardi,Filippo Lanubile
3+阅读 · 2018年3月17日
Lior Friedman,Shaul Markovitch
4+阅读 · 2018年1月31日
Top