长短期记忆(LSTM)是一种用于深度学习领域的人工递归神经网络(RNN)架构。与标准前馈神经网络不同,LSTM具有反馈连接。它不仅可以处理单个数据点(例如图像),而且可以处理整个数据序列(例如语音或视频)。例如,LSTM适用于诸如未分段的连接手写识别,语音识别和网络流量或IDS(入侵检测系统)中的异常检测之类的任务。常见的LSTM单元由单元,输入门,输出门和忘记门组成。单元会记住任意时间间隔内的值,并且三个门控制着进出单元的信息流。LSTM网络非常适合基于时间序列数据进行分类,处理和做出预测,因为时间序列中重要事件之间可能存在未知持续时间的滞后。开发LSTM是为了解决训练传统RNN时可能遇到的梯度消失问题。与缝隙长度相对不敏感是LSTM在众多应用中优于RNN,隐马尔可夫模型和其他序列学习方法的优势。
参考链接
微信扫码咨询专知VIP会员