当看到这些材料时,一个明显的问题可能会出现:“为什么还要写一本深度学习和自然语言处理的书呢?”一些优秀的论文已经出版,涵盖了深度学习的理论和实践方面,以及它在语言处理中的应用。然而,从我教授自然语言处理课程的经验来看,我认为,尽管这些书的质量非常好,但大多数都不是针对最有可能的读者。本书的目标读者是那些在机器学习和自然语言处理之外的领域有经验的人,并且他们的工作至少部分地依赖于对大量数据,特别是文本数据的自动化分析。这些专家可能包括社会科学家、政治科学家、生物医学科学家,甚至是对机器学习接触有限的计算机科学家和计算语言学家。

现有的深度学习和自然语言处理书籍通常分为两大阵营。第一个阵营专注于深度学习的理论基础。这对前面提到的读者肯定是有用的,因为在使用工具之前应该了解它的理论方面。然而,这些书倾向于假设一个典型的机器学习研究者的背景,因此,我经常看到没有这种背景的学生很快就迷失在这样的材料中。为了缓解这个问题,目前存在的第二种类型的书集中在机器学习从业者;也就是说,如何使用深度学习软件,而很少关注理论方面。我认为,关注实际方面同样是必要的,但还不够。考虑到深度学习框架和库已经变得相当复杂,由于理论上的误解而滥用它们的可能性很高。这个问题在我的课程中也很常见。

因此,本书旨在为自然语言处理的深度学习搭建理论和实践的桥梁。我涵盖了必要的理论背景,并假设读者有最少的机器学习背景。我的目标是让任何上过线性代数和微积分课程的人都能跟上理论材料。为了解决实际问题,本书包含了用于讨论的较简单算法的伪代码,以及用于较复杂体系结构的实际Python代码。任何上过Python编程课程的人都应该能够理解这些代码。读完这本书后,我希望读者能有必要的基础,立即开始构建真实世界的、实用的自然语言处理系统,并通过阅读有关这些主题的研究出版物来扩展他们的知识。

http://clulab.cs.arizona.edu/gentlenlp/gentlenlp-book-05172020.pdf

成为VIP会员查看完整内容
0
50

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

概率论起源于17世纪的法国,当时两位伟大的法国数学家,布莱斯·帕斯卡和皮埃尔·德·费马,对两个来自机会博弈的问题进行了通信。帕斯卡和费马解决的问题继续影响着惠更斯、伯努利和DeMoivre等早期研究者建立数学概率论。今天,概率论是一个建立良好的数学分支,应用于从音乐到物理的学术活动的每一个领域,也应用于日常经验,从天气预报到预测新的医疗方法的风险。

本文是为数学、物理和社会科学、工程和计算机科学的二、三、四年级学生开设的概率论入门课程而设计的。它提出了一个彻底的处理概率的想法和技术为一个牢固的理解的主题必要。文本可以用于各种课程长度、水平和重点领域。

在标准的一学期课程中,离散概率和连续概率都包括在内,学生必须先修两个学期的微积分,包括多重积分的介绍。第11章包含了关于马尔可夫链的材料,为了涵盖这一章,一些矩阵理论的知识是必要的。

文本也可以用于离散概率课程。材料被组织在这样一种方式,离散和连续的概率讨论是在一个独立的,但平行的方式,呈现。这种组织驱散了对概率过于严格或正式的观点,并提供了一些强大的教学价值,因为离散的讨论有时可以激发更抽象的连续的概率讨论。在离散概率课程中,学生应该先修一学期的微积分。

为了充分利用文中的计算材料和例子,假设或必要的计算背景很少。所有在文本中使用的程序都是用TrueBASIC、Maple和Mathematica语言编写的。

成为VIP会员查看完整内容
0
38

这本书是关于运用机器和深度学习来解决石油和天然气行业的一些挑战。这本书开篇简要讨论石油和天然气勘探和生产生命周期中不同阶段的数据流工业操作。这导致了对一些有趣问题的调查,这些问题很适合应用机器和深度学习方法。最初的章节提供了Python编程语言的基础知识,该语言用于实现算法;接下来是监督和非监督机器学习概念的概述。作者提供了使用开源数据集的行业示例以及对算法的实际解释,但没有深入研究所使用算法的理论方面。石油和天然气行业中的机器学习涵盖了包括地球物理(地震解释)、地质建模、油藏工程和生产工程在内的各种行业主题。

在本书中,重点在于提供一种实用的方法,提供用于实现机器的逐步解释和代码示例,以及用于解决油气行业现实问题的深度学习算法。

你将学到什么

  • 了解石油和天然气行业的端到端的行业生命周期和数据流
  • 了解计算机编程和机器的基本概念,以及实现所使用的算法所需的深度学习
  • 研究一些有趣的行业问题,这些问题很有可能被机器和深度学习解决
  • 发现在石油和天然气行业中执行机器和深度学习项目的实际考虑和挑战

这本书是给谁的

  • 石油和天然气行业的专业人员,他们可以受益于对机器的实际理解和解决现实问题的深度学习方法。
成为VIP会员查看完整内容
0
60

本教程介绍了机器学习(ML)的一些主要概念。从工程的角度来看,ML领域围绕着实现科学原理的软件开发: (i) 对一些现象设定一个假设(选择一个模型),(ii) 收集数据来验证假设(验证模型),(iii) 完善假设(迭代)。基于这一原理的一类重要算法是梯度下降法,它旨在迭代地细化由某个(权重)向量参数化的模型。通过结合假设空间(模型)、质量度量(损失)和模型优化(优化方法)的计算实现的不同选择,可以得到大量的ML方法。目前许多被认为是(人工)智能的系统都是基于几种基本机器学习方法的组合。在形式化ML问题的主要构建模块之后,讨论了ML方法的一些流行算法设计模式。本教程是在“机器学习:基本原理”和“人工智能”两门课程的课堂笔记基础上发起来的,这两门课程我从2015年开始在阿尔托大学(Aalto University)与人合作授课。

https://www.zhuanzhi.ai/paper/e45f282b068a1584cb0eaf0f0b338c20

成为VIP会员查看完整内容
0
69

这本书的前半部分快速而彻底地概述了Python的所有基础知识。你不需要任何以前的经验与编程开始,我们将教你一切你需要知道,一步一步。

第二部分着重于用Python以实用的方式解决有趣的、真实的问题。一旦你掌握了基础知识,你就会通过跟随我们的动手编程练习和项目迅速提高。

我们在书中的每一页都精心安排了漂亮的排版,代码示例的语法高亮显示,以及教学截图,这样你可以有效地处理和记忆信息:

所有材料都是Python 3.9的最新版本,Python编程语言在2020年发布的最新和最好的版本。简而言之,以下是你将学到的Python基础知识:Python 3的实用介绍:

安装和运行Python:在Windows、macOS或Linux上设置Python 3.9编码环境

  • 核心Python 3概念和约定:解释器会话、脚本、查找和修复代码bug、如何组织代码和构造Python程序、如何有效地学习和实践

  • Python 3.9基本原理:变量、基本数据类型、函数和循环、条件逻辑和控制流、字符串格式、列表/元组/字典、文件输入和输出、错误处理。

  • 中级Python概念:面向对象编程(OOP)、正则表达式、名称空间和作用域、异常处理、安装第三方包。

  • Python的实际使用:创建和修改PDF文件、使用数据库、从web下载和抓取内容、数据科学基础(科学计算和绘图)、图形用户界面和GUI编程。

成为VIP会员查看完整内容
0
43

现在来自密西根州立大学的汤继良团队即将出版一本全面性介绍图深度学习的书:《Deep Learning on Graphs》。

全书概要

为了最好地适应具有不同背景和阅读目的的读者,该书由四个部分组成。 第1部分介绍了基本概念;第2部分讨论了该领域最成熟的方法;第3部分介绍了最具代表性的实际应用,而第4部分介绍了有可能成为将来研究热点的高级方法和应用。每部分的内容如下:

第1部分:基本概念篇

在该部分的章节重点介绍图和深度学习的基础知识,这些基础将为图的深度学习奠定基础。在第1章中,介绍了图的关键概念和属性,图傅里叶变换,图形信号处理,并正式定义了各种类型的复杂图和在图上的计算任务。在第2章中,讨论了各种最基础的神经网络模型,训练深度模型的关键方法以及防止训练过程中过度拟合的实用技术。

第2部分:方法篇

这些章节涵盖了从基本设置到高级设置的最成熟的图深度学习方法。在第3章中,从信息保存的角度介绍了一种通用的图嵌入框架,提供了有关在图像上保留多种类型信息的代表性算法的技术细节,并介绍了专门为复杂形设计的嵌入方法。典型的图神经网络模型包括两个重要操作,即图过滤操作和图池化操作。

在第4章中,回顾了最新的图过滤和池化操作,并讨论了如何在给定下游任务的时学习GNN参数。GNNs是传统深度模型在图上的泛化,因此它们继承了传统深度模型的缺点,容易受到对抗攻击。

在第5章中,重点介绍图对抗攻击的概念和定义,并详细介绍了具有代表性的对抗攻击和防御技术。GNN执行跨层邻域的递归扩展。单个节点邻域的扩展会迅速涉及图的很大一部分甚至整个图。因此,可扩展性是GNN需要解决的紧迫问题。

在6章中详细介绍了用于可扩展性GNN的代表性技术。在第7章中,讨论了为更复杂的图设计的GNN模型。为了使深度学习技术能够在更广泛的设置下推进更多的图应用,在第8中介绍了GNN之外的众多图深度模型。

第3部分:实际应用篇 图提供了真实数据的通用表示方法;因此,在图深度学习方法已应用于各个领域。在这部分的章节中,将介绍了GNN的最具代表性的应用,包括第9章中的自然语言处理,第10章中的计算机视觉,第11章中的数据挖掘和第12章中的生物化学与医疗保健。

第4部分:进展篇 在该部分章节中,重点介绍方法和实际应用方面的最新进展。在13章中,从表达性,深度,公平性,可解释性和自我监督学习方面介绍了高级GNNs。在第14中,讨论了GNN应用的更多领域,包括组合优化,物理,程序表示, 和计算机网络。

英文书预印本免费下载链接如下。大家可以订阅该书。订阅者会自动推送关于该书的最新信息包括针对该书的中英文版的幻灯片和教程视频。同时欢迎大家提供反馈。

英文书:http://cse.msu.edu/~mayao4/dlg_book/

成为VIP会员查看完整内容
0
191

自Goodfellow等人2014年开创性的工作以来,生成式对抗网(GAN)就受到了相当多的关注。这种关注导致了GANs的新思想、新技术和新应用的爆炸。为了更好地理解GANs,我们需要理解其背后的数学基础。本文试图从数学的角度对GANs进行概述。许多学数学的学生可能会发现关于GAN的论文更难以完全理解,因为大多数论文是从计算机科学和工程师的角度写的。这篇论文的目的是用他们更熟悉的语言来介绍GANs。

成为VIP会员查看完整内容
0
42

介绍

这本书在保持非常务实的教导和结果导向付出很大的精力。构建聊天机器人不只是完成一个教程或遵循几个步骤,它本身就是一种技能。这本书肯定不会用大量的文本和过程让你感到无聊;相反,它采用的是边做边学的方法。到目前为止,在你的生活中,你肯定至少使用过一个聊天机器人。无论你是不是一个程序员,一旦你浏览这本书,你会发现构建模块的聊天机器人,所有的奥秘将被揭开。建立聊天机器人可能看起来很困难,但这本书将让你使它如此容易。我们的大脑不是用来直接处理复杂概念的;相反,我们一步一步地学习。当你读这本书的时候,从第一章到最后一章,你会发现事情的进展是多么的清晰。虽然你可以直接翻到任何一章,但我强烈建议你从第一章开始,因为它肯定会支持你的想法。这本书就像一个网络系列,你在读完一章之后就无法抗拒下一章的诱惑。在阅读完这本书后,你所接触到的任何聊天机器人都会在你的脑海中形成一幅关于聊天机器人内部是如何设计和构建的画面。

这本书适合谁?

这本书将作为学习与聊天机器人相关的概念和学习如何建立他们的一个完整的资源。那些将会发现这本书有用的包括: Python web开发人员希望扩大他们的知识或职业到聊天机器人开发。 学生和有抱负的程序员想获得一种新的技能通过亲身体验展示的东西,自然语言爱好者希望从头开始学习。 企业家如何构建一个聊天机器人的伟大的想法,但没有足够的技术关于如何制作聊天机器人的可行性信息。 产品/工程经理计划与聊天机器人相关项目。

如何使用这本书?

请记住,这本书的写作风格和其他书不一样。读这本书的时候要记住,一旦你完成了这本书,你就可以自己建造一个聊天机器人,或者教会别人如何建造一个聊天机器人。在像阅读其他书籍一样阅读这本书之前,务必记住以下几点:

  • 这本书涵盖了构建聊天机器人所需的几乎所有内容,而不是现有内容。
  • 这本书是关于花更多的时间在你的系统上做事情的,这本书就在你身边。确保您执行每个代码片段并尝试编写代码;不要复制粘贴。
  • 一定要按照书中的步骤去做;如果你不理解一些事情,不要担心。你将在本章的后面部分了解到。
  • 可以使用本书所提供的源代码及Jupyter NoteBook作为参考。

内容概要

  • Chapter 1: 在本章中,你将从商业和开发人员的角度了解与聊天机器人相关的事情。这一章为我们熟悉chatbots概念并将其转换为代码奠定了基础。希望在本章结束时,你会明白为什么你一定要为自己或你的公司创建一个聊天机器人。
  • Chapter 2: 在本章中会涉及聊天机器人的自然语言处理,你将学习到聊天机器人需要NLP时应该使用哪些工具和方法。这一章不仅教你在NLP的方法,而且还采取实际的例子和演示与编码的例子。本章还讨论了为什么使用特定的NLP方法可能需要在聊天机器人。注意,NLP本身就是一种技能。
  • Chapter 3: 在本章中,你将学习如何使用像Dialogflow这样的工具以一种友好而简单的方式构建聊天机器人。如果你不是程序员,你肯定会喜欢它,因为它几乎不需要编程技能。
  • Chapter 4:在本章中,你将学习如何以人们想要的方式构建聊天机器人。标题说的很艰难,但一旦你完成了前一章,你会想要更多,因为这一章将教如何建立内部聊天机器人从零开始,以及如何使用机器学习算法训练聊天机器人。
  • Chapter 5:在本章中,部署你的聊天机器人纯粹是设计给你的聊天机器人应用一个最后的推动。当你经历了创建聊天机器人的简单和艰难的过程后,你肯定不想把它留给自己。你将学习如何展示你的聊天机器人到世界使用Facebook和Slack,最后,整合他们在你自己的网站。
成为VIP会员查看完整内容
Building Chatbots with Python.pdf
0
94

本备忘单是机器学习手册的浓缩版,包含了许多关于机器学习的经典方程和图表,旨在帮助您快速回忆起机器学习中的知识和思想。

这个备忘单有两个显著的优点:

  1. 清晰的符号。数学公式使用了许多令人困惑的符号。例如,X可以是一个集合,一个随机变量,或者一个矩阵。这是非常混乱的,使读者很难理解数学公式的意义。本备忘单试图规范符号的使用,所有符号都有明确的预先定义,请参见小节。

  2. 更少的思维跳跃。在许多机器学习的书籍中,作者省略了数学证明过程中的一些中间步骤,这可能会节省一些空间,但是会给读者理解这个公式带来困难,读者会在中间迷失。

成为VIP会员查看完整内容
0
135
小贴士
相关VIP内容
专知会员服务
38+阅读 · 2020年11月25日
专知会员服务
60+阅读 · 2020年11月3日
专知会员服务
69+阅读 · 2020年10月24日
专知会员服务
43+阅读 · 2020年10月11日
专知会员服务
42+阅读 · 2020年9月3日
专知会员服务
87+阅读 · 2020年7月27日
机器学习速查手册,135页pdf
专知会员服务
135+阅读 · 2020年3月15日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
173+阅读 · 2020年2月7日
相关资讯
相关论文
Albert Tedja
0+阅读 · 2020年12月15日
Andreas L Opdahl,Vimala Nunavath
0+阅读 · 2020年12月15日
Andrei Zaharescu,Radu Horaud
1+阅读 · 2020年12月15日
Lucas Bourtoule,Varun Chandrasekaran,Christopher A. Choquette-Choo,Hengrui Jia,Adelin Travers,Baiwu Zhang,David Lie,Nicolas Papernot
0+阅读 · 2020年12月15日
Marco Schreyer,Chistian Schulze,Damian Borth
0+阅读 · 2020年12月13日
Bernhard Schölkopf
9+阅读 · 2019年11月24日
Tutorial on NLP-Inspired Network Embedding
Boaz Shmueli
5+阅读 · 2019年10月16日
Antoine J. -P. Tixier
10+阅读 · 2018年8月30日
Ndapa Nakashole,Raphael Flauger
3+阅读 · 2018年6月7日
Chris Cremer,Xuechen Li,David Duvenaud
3+阅读 · 2018年1月10日
Top