自然语言理解是人工智能的一个重要分支,主要研究如何利用电脑来理解和生成自然语言。本书重点介绍了自然语言理解所涉及的各个方面,包括语法分析、语义分析、概念分析、语料库语言学、词汇语义驱动、中间语言、WordNet、词汇树邻接文法、链接文法、基于语段的机器翻译方法、内识别与文本过滤、机器翻译的评测等,既有对基础知识的介绍,又有对新研究进展的综述,同时还结合了作者(JamesPustejovsky,生成词库理论的创始人)多年的研究成果。本书内容全面、详略得当,结合实例讲解,使读者更易理解。

编辑推荐

《面向机器学习的自然语言标注》内容全面、详略得当,结合实例讲解,使读者更易理解。自然语言理解是人工智能的一个重要分支,主要研究如何利用计算机来理解和生成自然语言。

名人推荐

“语言标注是自然语言处理的一个关键部分,但是现有的计算语言学课程却少有涉及。本书是难得的一本从实践角度讨论自然语言标注,并且以服务于机器学习算法为目的来考察标注规格与设计的专著。它必将成为本科生和研究生计算语言学课程的一个标准。” ——Nancy Ide瓦萨学院计算机科学系教授

作者简介 James Pustejovsky教授是美国布兰代斯(Brandeis University)大学计算机科学系和Volen国家综合系统中心教授。先后在美国麻省理工学院和马萨诸塞大学获得学士学位和博士学位。 Pustejovsky教授主要从事自然语言的理论和计算研究。研究领域包括:计算语言学、词汇语义学、知识表征、话语语义学、时间推理和抽取等。已经出版多部专著。

成为VIP会员查看完整内容
0
38

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

人工智能是由机器表现出来的智能,而不是由人类表现出来的智能。

这本书涵盖了人工智能的各个领域的基本概念,如人工神经网络,自然语言处理,机器学习,深度学习,遗传算法等,以及它在Python中的实现。

这本书将是有用的毕业生,研究生,和研究学生谁有兴趣在这个课题或有这个课题作为他们的课程的一部分。读者可以是初学者,也可以是高级学习者。

成为VIP会员查看完整内容
0
52

这本书是为任何想学习如何开发机器学习系统的人准备的。我们将从理论和实践两方面涵盖关于机器学习算法的最重要概念,并将使用Python编程语言中的Scikit-learn库实现许多机器学习算法。在第一章中,您将学习机器学习最重要的概念,在下一章中,您将主要学习分类。在最后一章中,你将学习如何训练你的模型。我假定你已经了解了编程的基础知识。

成为VIP会员查看完整内容
0
107

学习使用Python分析数据和预测结果的更简单和更有效的方法

Python机器学习教程展示了通过关注两个核心机器学习算法家族来成功分析数据,本书能够提供工作机制的完整描述,以及使用特定的、可破解的代码来说明机制的示例。算法用简单的术语解释,没有复杂的数学,并使用Python应用,指导算法选择,数据准备,并在实践中使用训练过的模型。您将学习一套核心的Python编程技术,各种构建预测模型的方法,以及如何测量每个模型的性能,以确保使用正确的模型。关于线性回归和集成方法的章节深入研究了每种算法,你可以使用书中的示例代码来开发你自己的数据分析解决方案。

机器学习算法是数据分析和可视化的核心。在过去,这些方法需要深厚的数学和统计学背景,通常需要结合专门的R编程语言。这本书演示了机器学习可以如何实现使用更广泛的使用和可访问的Python编程语言。

使用线性和集成算法族预测结果

建立可以解决一系列简单和复杂问题的预测模型

使用Python应用核心机器学习算法

直接使用示例代码构建自定义解决方案

机器学习不需要复杂和高度专业化。Python使用了更简单、有效和经过良好测试的方法,使这项技术更容易为更广泛的受众所接受。Python中的机器学习将向您展示如何做到这一点,而不需要广泛的数学或统计背景。

成为VIP会员查看完整内容
0
131

“语言标注是自然语言处理的关键环节,但是它很少在计算语言学课程中被提及。这是第一本手把手讲解标注的书籍,从规范和设计到使用机器学习算法面面俱到。它必然成为本科和研究生的计算语言学课程的范本。” ——Nancy Ide Vassar学院的计算机科学教授

是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,本书都可以手把手地指导你一种经验证的标注开发周期——把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。

通过每一步中的详细示例,你将学到“标注开发过程”是如何帮助你建模、标注、训练、测试、评估和修正你的训练语料库。你也将了解到一个实际标注项目的完整演示。

在收集你的数据集(语料库)之前定义一个清晰的标注目标 学习用于分析你的语料库中语言内容的工具 搭建用于你的标注项目的模型和规范 检查从基本的XML到语言标记框架这样一些不同的标注格式 创建适合于训练和测试机器学习算法的黄金标准语料库

选择用来处理你的标注数据的机器学习算法 评估测试结果并修正你的标注任务 学习如何使用用于标注文本和调整标注的轻量级软件

James Pustejovsky是Brandeis大学的教授,他在该大学的计算机科学系讲解和研究人工智能及计算语言学。

Amber Stubbs刚刚获得了Brandeis大学标注方法论的博士学位。她现在是SUNY Albany大学的博士后。

成为VIP会员查看完整内容
0
35

获得金融、医疗保健和零售领域的机器学习实用技能。这本书通过提供这些领域的案例研究,使用了动手的方法:你将看到如何使用机器学习作为商业增强工具的例子。作为一名领域专家,您不仅会发现机器学习在金融、医疗保健和零售领域是如何应用的,而且还会通过实施机器学习的实际案例研究进行工作。

使用Python的机器学习应用程序分为三个部分,分别针对每个领域(医疗保健、金融和零售)。每一节都以机器学习和该领域的关键技术进展的概述开始。然后,您将通过案例研究了解更多关于组织如何改变其所选择市场的游戏规则。这本书有实际的案例研究与Python代码和领域特定的创新想法赚钱的机器学习。

你会学到什么

  • 发现应用的机器学习过程和原理
  • 在医疗保健、金融和零售领域实现机器学习
  • 避免应用机器学习的陷阱
  • 在三个主题领域构建Python机器学习示例

这本书是给谁的

  • 数据科学家和机器学习专家。
成为VIP会员查看完整内容
0
87

管理统计和数据科学的原理包括:数据可视化;描述性措施;概率;概率分布;数学期望;置信区间;和假设检验。方差分析;简单线性回归;多元线性回归也包括在内。另外,本书还提供了列联表、卡方检验、非参数方法和时间序列方法。

教材:

  • 包括通常在入门统计学课程中涵盖的学术材料,但与数据科学扭曲,较少强调理论
  • 依靠Minitab来展示如何用计算机执行任务
  • 展示并促进来自开放门户的数据的使用
  • 重点是发展对程序如何工作的直觉
  • 让读者了解大数据的潜力和目前使用它的失败之处
成为VIP会员查看完整内容
1
107

当前关于机器学习方面的资料非常丰富:Andrew NG在Coursera上的机器学习教程、Bishop的《机器学习与模式识别》 和周志华老师的《机器学习》都是非常好的基础教材;Goodfellow等人的《深度学习》是学习深度学习技术的首选资料;MIT、斯坦福等名校的公开课也非常有价值;一些主要会议的Tutorial、keynote也都可以在网上搜索到。然而,在对学生们进行培训的过程中, 我深感这些资料专业性很强,但入门不易。一方面可能是由于语言障碍,另一个主要原因在于机器学习覆盖 面广,研究方向众多,各种新方法层出不穷,初学者往往在各种复杂的名词,无穷无尽的 算法面前产生畏难情绪,导致半途而废。

本书的主体内容是基于该研讨班形成的总结性资料。基于作者的研究背景,这本书很难说 是机器学习领域的专业著作,而是一本学习笔记,是从一个机器学习 技术使用者角度对机器学习知识的一次总结,并加入我们在本领域研究中的一些经验和发现。与其说是一本教材,不如说是一本科普读物, 用轻松活泼的语言和深入浅出的描述为初学者打开机器学习这扇充满魔力的大门。打开大门以后,我们会发现这是个多么让人激动人心的 领域,每天都有新的知识、新的思路、新的方法产生,每天都有令人振奋的成果。我们希望这本书 可以让更多学生、工程师和相关领域的研究者对机器学习产生兴趣,在这片异彩纷呈的海域上找到 属于自己的那颗贝壳。

强烈推荐给所有初学机器学习的人,里面有: 书籍的pdf 课堂视频 课堂slides 各种延伸阅读 MIT等世界名校的slides 学生的学习笔记等

成为VIP会员查看完整内容
0
114

通过机器学习的实际操作指南深入挖掘数据

机器学习: 为开发人员和技术专业人员提供实践指导和全编码的工作示例,用于开发人员和技术专业人员使用的最常见的机器学习技术。这本书包含了每一个ML变体的详细分析,解释了它是如何工作的,以及如何在特定的行业中使用它,允许读者在阅读过程中将所介绍的技术融入到他们自己的工作中。机器学习的一个核心内容是对数据准备的强烈关注,对各种类型的学习算法的全面探索说明了适当的工具如何能够帮助任何开发人员从现有数据中提取信息和见解。这本书包括一个完整的补充教师的材料,以方便在课堂上使用,使这一资源有用的学生和作为一个专业的参考。

机器学习的核心是一种基于数学和算法的技术,它是历史数据挖掘和现代大数据科学的基础。对大数据的科学分析需要机器学习的工作知识,它根据从训练数据中获得的已知属性形成预测。机器学习是一个容易理解的,全面的指导,为非数学家,提供明确的指导,让读者:

  • 学习机器学习的语言,包括Hadoop、Mahout和Weka
  • 了解决策树、贝叶斯网络和人工神经网络
  • 实现关联规则、实时和批量学习
  • 为安全、有效和高效的机器学习制定战略计划

通过学习构建一个可以从数据中学习的系统,读者可以在各个行业中增加他们的效用。机器学习是深度数据分析和可视化的核心,随着企业发现隐藏在现有数据中的金矿,这一领域的需求越来越大。对于涉及数据科学的技术专业人员,机器学习:为开发人员和技术专业人员提供深入挖掘所需的技能和技术。

成为VIP会员查看完整内容
0
113

高斯过程(GPs)为核机器的学习提供了一种有原则的、实用的、概率的方法。在过去的十年中,GPs在机器学习社区中得到了越来越多的关注,这本书提供了GPs在机器学习中理论和实践方面长期需要的系统和统一的处理。该书是全面和独立的,针对研究人员和学生在机器学习和应用统计学。

这本书处理监督学习问题的回归和分类,并包括详细的算法。提出了各种协方差(核)函数,并讨论了它们的性质。从贝叶斯和经典的角度讨论了模型选择。讨论了许多与其他著名技术的联系,包括支持向量机、神经网络、正则化网络、相关向量机等。讨论了包括学习曲线和PAC-Bayesian框架在内的理论问题,并讨论了几种用于大数据集学习的近似方法。这本书包含说明性的例子和练习,和代码和数据集在网上是可得到的。附录提供了数学背景和高斯马尔可夫过程的讨论。

成为VIP会员查看完整内容
0
123

由于特征工程通常是特定于数据类型且依赖于应用程序的,本书包含专门介绍主要数据类型的特征工程的章节,如文本数据、图像数据、序列数据、时间序列数据、图形数据、流数据、软件工程数据、Twitter 数据和社交媒体数据。这些章节介绍了生成经过反复测试、手工制作的特定于域的功能以及自动通用功能生成方法(如 Word2Vec)的方法。

本书目录:

  1. 预览概述
  2. 文本数据特征工程 
  3. 视觉数据特征提取学习
  4. 基于特征的时序分析
  5. 数据特征流工程
  6. 序列特征生成与特征工程
  7. 图与网络特征生成
  8. 特征选择与评估
  9. 监督学习中的自动特征工程
  10. 基于模式的特征生成
  11. 深度学习特征表示
  12. 用于社交机器人检测的特征工程
  13. 用于软件分析的特征生成与工程
  14. Twitter应用特征工程

本书还包含有关特征选择、基于特征转换的自动方法、使用深度学习方法生成功能以及使用频繁和对比度模式生成特征的章节。有几章是关于在特定应用中使用特征工程的。

本书包含许多有用的特征工程概念和技术,这些概念和技术适用于多种方案:(a) 生成功能以表示没有要素时的数据,(b) 在(人们可能担心)存在时生成有效特征功能不够好/竞争力不够,(c) 在功能过多时选择功能,(d) 为特定类型的应用程序生成和选择有效功能,以及 (e) 了解与相关挑战以及需要处理的方法,各种数据类型。

成为VIP会员查看完整内容
0
87
小贴士
相关VIP内容
专知会员服务
52+阅读 · 3月23日
专知会员服务
131+阅读 · 2月25日
专知会员服务
87+阅读 · 1月1日
专知会员服务
107+阅读 · 2020年7月29日
专知会员服务
114+阅读 · 2020年7月27日
专知会员服务
123+阅读 · 2020年5月2日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
87+阅读 · 2019年10月10日
相关资讯
相关论文
Jeremy Avigad
0+阅读 · 3月27日
Joseph Jay Williams,Jacob Nogas,Nina Deliu,Hammad Shaikh,Sofia S. Villar,Audrey Durand,Anna Rafferty
0+阅读 · 3月26日
Ruocheng Guo,Lu Cheng,Jundong Li,P. Richard Hahn,Huan Liu
23+阅读 · 2020年5月5日
An Analysis of Object Embeddings for Image Retrieval
Bor-Chun Chen,Larry S. Davis,Ser-Nam Lim
4+阅读 · 2019年5月28日
Minjoon Seo,Tom Kwiatkowski,Ankur P. Parikh,Ali Farhadi,Hannaneh Hajishirzi
3+阅读 · 2018年4月20日
Alon Talmor,Jonathan Berant
5+阅读 · 2018年3月18日
Tomasz Jurczyk,Amit Deshmane,Jinho Choi
5+阅读 · 2018年1月6日
Top