新书《面向机器学习和数据分析的特征工程》，419页pdf

由于特征工程通常是特定于数据类型且依赖于应用程序的，本书包含专门介绍主要数据类型的特征工程的章节，如文本数据、图像数据、序列数据、时间序列数据、图形数据、流数据、软件工程数据、Twitter 数据和社交媒体数据。这些章节介绍了生成经过反复测试、手工制作的特定于域的功能以及自动通用功能生成方法（如 Word2Vec）的方法。

本书目录：

预览概述
文本数据特征工程　
视觉数据特征提取学习
基于特征的时序分析
数据特征流工程
序列特征生成与特征工程
图与网络特征生成
特征选择与评估
监督学习中的自动特征工程
基于模式的特征生成
深度学习特征表示
用于社交机器人检测的特征工程
用于软件分析的特征生成与工程
Twitter应用特征工程

本书还包含有关特征选择、基于特征转换的自动方法、使用深度学习方法生成功能以及使用频繁和对比度模式生成特征的章节。有几章是关于在特定应用中使用特征工程的。

本书包含许多有用的特征工程概念和技术，这些概念和技术适用于多种方案：（a）生成功能以表示没有要素时的数据，（b）在（人们可能担心）存在时生成有效特征功能不够好/竞争力不够，（c）在功能过多时选择功能，（d）为特定类型的应用程序生成和选择有效功能，以及（e）了解与相关挑战以及需要处理的方法，各种数据类型。