发现各种有用的数据挖掘算法,这些算法可以从庞大的候选数据中选择小的重要特征集,或者从测量变量中提取有用的特征。

作为一个严谨的数据挖掘程序员,您将经常面对数以千计的候选特征,用于您的预测或分类应用程序,其中大多数特征几乎没有价值或没有价值。您将知道,其中许多特征可能只有在与某些其他特征结合时才有用,而单独使用或与大多数其他特征结合时实际上是毫无价值的。有些特征可能具有巨大的预测能力,但只能在特征空间的一个小的、专门的领域内。这本书通过介绍现代的特性选择技术和实现这些技术的代码来帮助您解决这个问题。其中一些技巧是:

  • 正向选择分量分析
  • 当地的特征选择
  • 使用隐马尔可夫模型连接特征和目标

所有算法都得到了直观的证明,并得到了相关方程和解释材料的支持。作者还提供并解释了完整的、高度注释的源代码。

示例代码是C++和CUDA C,但Python或其他代码可以替换;重要的是算法,而不是用来编写算法的代码。

你将学到什么

  • 将主成分分析与向前和向后的逐步选择相结合,以确定在整个集合中捕获最大可能变异的大量变量集合的一个紧凑子集。

  • 识别仅对特征域的一个小子集具有预测能力的特征。这些特征可以被现代预测模型有效地利用,但可能被其他特征选择方法所遗漏。

  • 找出同时控制特征变量和目标分布的隐含马尔可夫模型。这种方法固有的记忆在高噪音应用中尤其有价值,例如金融市场的预测。

这本书是给谁的

中级到高级数据科学程序员和分析师。强烈推荐有c++和CUDA C的经验。然而,这本书可以作为框架使用其他语言,如Python。

成为VIP会员查看完整内容
71

相关内容

【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
最新《自动微分手册》77页pdf
专知会员服务
95+阅读 · 2020年6月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
278+阅读 · 2020年6月3日
【干货书】数值计算C编程,319页pdf,Numerical C
专知会员服务
65+阅读 · 2020年4月7日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
211+阅读 · 2020年2月21日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
346+阅读 · 2020年2月15日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
195+阅读 · 2020年2月11日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
140+阅读 · 2019年10月10日
用Python实现流行机器学习算法
Python程序员
19+阅读 · 2018年12月31日
数据科学即将迎来“无代码”时代
大数据文摘
4+阅读 · 2018年10月21日
2019年机器学习:追踪人工智能发展之路
人工智能学家
4+阅读 · 2018年10月14日
机器学习新手必看10大算法
深度学习世界
4+阅读 · 2018年2月1日
最适合机器学习新手的10种算法
论智
9+阅读 · 2018年1月23日
干货|7步掌握基于Keras的深度学习!
全球人工智能
4+阅读 · 2017年11月14日
A Survey on Bayesian Deep Learning
Arxiv
59+阅读 · 2020年7月2日
Arxiv
42+阅读 · 2019年12月20日
Image Captioning: Transforming Objects into Words
Arxiv
7+阅读 · 2019年6月14日
Accelerated Methods for Deep Reinforcement Learning
Arxiv
6+阅读 · 2019年1月10日
Arxiv
5+阅读 · 2017年7月23日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
最新《自动微分手册》77页pdf
专知会员服务
95+阅读 · 2020年6月6日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
278+阅读 · 2020年6月3日
【干货书】数值计算C编程,319页pdf,Numerical C
专知会员服务
65+阅读 · 2020年4月7日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
211+阅读 · 2020年2月21日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
346+阅读 · 2020年2月15日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
195+阅读 · 2020年2月11日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
140+阅读 · 2019年10月10日
相关资讯
用Python实现流行机器学习算法
Python程序员
19+阅读 · 2018年12月31日
数据科学即将迎来“无代码”时代
大数据文摘
4+阅读 · 2018年10月21日
2019年机器学习:追踪人工智能发展之路
人工智能学家
4+阅读 · 2018年10月14日
机器学习新手必看10大算法
深度学习世界
4+阅读 · 2018年2月1日
最适合机器学习新手的10种算法
论智
9+阅读 · 2018年1月23日
干货|7步掌握基于Keras的深度学习!
全球人工智能
4+阅读 · 2017年11月14日
微信扫码咨询专知VIP会员