1.多层感知器（MLP）

多层感知器拥有三个或三个以上节点层。它通过非线性激活函数（主要是双曲正切和Sigmoid函数）对线性不可分数据进行分类。MLP可以被看作是一个有向图，由多个节点层组成，每一层全连接到下一层。其在自然语言处理方面的主要应用是语音识别和机器翻译。

2.卷积神经网络（CNN）

卷积神经网络包括卷积层和池化层两部分。它其实和我们上节所讲述的前馈网络并无太大区别，只是将其中某些层换成了卷积层而已，所以卷积网络也是一种特殊的前馈网络。而这样的结构带来的是更少的参数需求和更深入的网络。
卷积神经网络在图像和语音处理中有着不凡的表现。在Convolutional Neural Networks for Sentence Classification一文中，Yoon Kim描述了使用卷积神经网络进行文本分类的过程和结果。他建立一个基于word2vec的模型，并从多个基准和维度对它进行了一系列的实验，而令人满意的结果也印证了卷积神经网络的出色。
而 Xiang Zhang和Yann LeCun则在其论文Text Understanding from Scratch中揭示了卷积神经网络可不依赖任何语言知识完成本体分类、情感分析、文本分类等任务。

3.递归神经网络（RNN）

递归神经网络是两种人工神经网络的总称。一种是时间递归神经网络（recurrent neural network），另一种是结构递归神经网络（recursive neural network）。时间递归神经网络的神经元间连接构成有向图，而结构递归神经网络利用相似的神经网络结构递归构造更为复杂的深度网络。两者训练的算法不同，但属于同一算法变体。

4.长短期记忆网络（LSTM）

长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。它是一种含有LSTM区块神经网络，在文献或其他资料中LSTM区块可能被描述成智能网络单元，因为它可以记忆不定时间长度的数值，区块中有一个“门”能够决定输入值是否重要到能被记住以及能不能被输出。
在大规模声学建模和词性分类方面，长短期记忆网络被证明拥有优异性能。

5.序列-序列模型

通常，一个序列到序列模型由两个递归神经网络组成：一个处理输入的编码器和一个产生输出的译码器。编码器和解码器可以使用相同或不同的参数集。
序列-序列模型主要用于问答系统，聊天机器人和机器翻译。

6.浅层神经网络

除了深层神经网络外，浅层模型也是实用且广受欢迎的工具。例如，word2vec是一组浅层模型，用于生成词向量。word2vec可以在百万数量级的词典和上亿的数据集上进行高效地训练，训练结果——词向量可以很好地度量词与词之间的相似性。

总结

在本文中，我们介绍了人工神经网络的不同变体，如多层感知器、卷积神经网络、递归神经网络、长短期记忆网络、序列-序列模型以及浅层神经网络。我们展示了这些网络如何运作，以及它们在自然语言处理任务中的具体应用。我们发现，卷积神经网络主要用于文本分类，而递归神经网络通常用于自然语言生成或机器翻译。（云栖社区翻译）

热门文章推荐

厉害了！吉利宣布收购飞行汽车公司Terrafugia ！

周志华：实验表明gcForest是最好的非深度神经网络方法

黑科技｜Adobe出图象技术神器！视频也可以PS了！！

史上第一个被授予公民身份的机器人索菲亚和人对答如流！

浙大90后女黑客在GeekPwn2017上秒破人脸识别系统！

周志华点评AlphaGo Zero：这6大特点非常值得注意！

汤晓鸥教授：人工智能让天下没有难吹的牛!

英伟达发布全球首款人工智能全自动驾驶平台

未来 3~5 年内，哪个方向的机器学习人才最紧缺？

中科院步态识别技术：不看脸 50米内在人群中认出你！

登录查看更多

相关内容

人工神经网络

关注 129

人工神经网络（Artificial Neural Network，即ANN），它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

209+阅读 · 2020年4月26日