【CMU博士论文】神经序列建模与应用，Neural Sequential Modeling and Applications - 专知VIP

会员服务 ·

10

神经序列建模 · 多元序列数据 · 时序数据 · Transformer · 论文 ·

2021 年 11 月 2 日

【CMU博士论文】神经序列建模与应用，Neural Sequential Modeling and Applications

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

如何在各种设置中建模序列数据是跨许多领域的一个重要机器学习问题，包括对时间序列数据、自然语言文本和事件流的预测。不同领域的序列数据通常具有不同的特征。例如，自然语言文本可以看作是离散变量的序列，而传感器网络信号可以看作是连续向量空间中的多变量序列。为了在如此多的现实领域中开发成功的神经网络模型，我们需要根据数据和问题的性质定制体系结构和算法。本文针对顺序建模及其应用设计了新颖高效的神经网络解决方案。具体来说，这些贡献可以分为四个部分。 https://www.cs.cmu.edu/~glai1/

第一部分主要关注多元序列数据中变量之间的相关性，如多个传感器的时间序列，提出了利用相关模式提高预测精度的新算法，即深度可分图卷积网络(DSGC)(第2章)[60]和分解递归神经网络(FRNN)(第3章)[63]。

第二部分的重点是在时序数据依赖模式的时间建模中结合人类先验知识。具体地说，我们提出了一种新的方法，称为长短期时间序列网络(LSTNet)(第4章)[59]，它被证明在不同的应用中特别有效地捕捉各种周期模式。

第三部分重点讨论了变换器Transformers在序列分类任务中的有效算法。具体来说，通过识别常用Transformer架构中的计算冗余，并提出一种新的替代方案，即漏斗Transformers(第5章)[27]，我们在计算和精度之间实现了更好的权衡。

第四部分着重于建模/预测事件之间的时间关系，其中的主要挑战是有效地从稀疏标记的数据中学习。我们通过结合高级数据增强、半监督学习和引入人类先验知识来解决这一挑战(第6章)。因此，我们大大提高了这项任务的最先进性能。

成为VIP会员查看完整内容

43

相关内容

神经序列建模

神经序列建模

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

专知会员服务

66+阅读 · 2021年1月5日

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

专知会员服务

20+阅读 · 2020年11月12日

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

专知会员服务

78+阅读 · 2020年8月13日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

【CMU博士论文】使用静态和动态图来异常检测，Mining Anomalies using Static and Dynamic Graphs

【CMU博士论文】使用静态和动态图来异常检测，Mining Anomalies using Static and Dynamic Graphs

专知会员服务

68+阅读 · 2020年5月26日

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

专知会员服务

80+阅读 · 2019年11月5日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

【综述笔记】Graph Neural Networks in Recommender Systems

【综述笔记】Graph Neural Networks in Recommender Systems

图与推荐

5+阅读 · 2020年12月8日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知

6+阅读 · 2020年6月25日

【论文笔记】Graph U-Nets

【论文笔记】Graph U-Nets

专知

81+阅读 · 2019年11月25日

赛尔笔记 | 自然语言处理中的迁移学习(下)

赛尔笔记 | 自然语言处理中的迁移学习(下)

AI科技评论

11+阅读 · 2019年10月21日

【论文笔记】基于LSTM的问答对排序

【论文笔记】基于LSTM的问答对排序

专知

12+阅读 · 2019年9月7日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

36+阅读 · 2019年6月23日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

三次简化一张图：一招理解LSTM/GRU门控机制

三次简化一张图：一招理解LSTM/GRU门控机制

机器之心

16+阅读 · 2018年12月18日

STRCF for Visual Object Tracking

STRCF for Visual Object Tracking

统计学习与视觉计算组

15+阅读 · 2018年5月29日

论文笔记 | VAIN: Attentional Multi-agent Predictive Modeling

论文笔记 | VAIN: Attentional Multi-agent Predictive Modeling

科技创新与创业

4+阅读 · 2017年12月10日

Probing Linguistic Information For Logical Inference In Pre-trained Language Models

Arxiv

5+阅读 · 2021年12月3日

Transformer in Transformer

Arxiv

11+阅读 · 2021年10月26日

Attention, please! A survey of Neural Attention Models in Deep Learning

Arxiv

59+阅读 · 2021年3月31日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Compression of Deep Learning Models for Text: A Survey

Compression of Deep Learning Models for Text: A Survey

Arxiv

7+阅读 · 2020年8月12日

A Survey of Model Compression and Acceleration for Deep Neural Networks

Arxiv

67+阅读 · 2019年9月8日

Hierarchically-Refined Label Attention Network for Sequence Labeling

Hierarchically-Refined Label Attention Network for Sequence Labeling

Arxiv

3+阅读 · 2019年8月23日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Visualizing Attention in Transformer-Based Language Representation Models

Visualizing Attention in Transformer-Based Language Representation Models

Arxiv

3+阅读 · 2019年4月11日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

VIP会员

相关主题

神经序列建模

多元序列数据

相关VIP内容

【NAACL2021】长序列自然语言处理, 250页ppt

【NAACL2021】长序列自然语言处理, 250页ppt

专知会员服务

62+阅读 · 2021年6月7日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

经典《因果性导论》讲座课程，Jonas Peters教授讲解，附253页ppt

专知会员服务

66+阅读 · 2021年1月5日

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

专知会员服务

20+阅读 · 2020年11月12日

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

专知会员服务

78+阅读 · 2020年8月13日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

【CMU博士论文】使用静态和动态图来异常检测，Mining Anomalies using Static and Dynamic Graphs

【CMU博士论文】使用静态和动态图来异常检测，Mining Anomalies using Static and Dynamic Graphs

专知会员服务

68+阅读 · 2020年5月26日

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

【博士论文】自然语言处理的神经图嵌入方法，Neural Graph Embedding methods for Natural Language Processing

专知会员服务

80+阅读 · 2019年11月5日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军：无人机视为弹药

《语言模型的推理时间学习算法》162页博士论文

军事人工智能的能源挑战

自主智能：多模态人工智能代理重塑技术未来

相关资讯

【综述笔记】Graph Neural Networks in Recommender Systems

【综述笔记】Graph Neural Networks in Recommender Systems

图与推荐

5+阅读 · 2020年12月8日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知

6+阅读 · 2020年6月25日

【论文笔记】Graph U-Nets

【论文笔记】Graph U-Nets

专知

81+阅读 · 2019年11月25日

赛尔笔记 | 自然语言处理中的迁移学习(下)

赛尔笔记 | 自然语言处理中的迁移学习(下)

AI科技评论

11+阅读 · 2019年10月21日

【论文笔记】基于LSTM的问答对排序

【论文笔记】基于LSTM的问答对排序

专知

12+阅读 · 2019年9月7日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

36+阅读 · 2019年6月23日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

三次简化一张图：一招理解LSTM/GRU门控机制

三次简化一张图：一招理解LSTM/GRU门控机制

机器之心

16+阅读 · 2018年12月18日

STRCF for Visual Object Tracking

STRCF for Visual Object Tracking

统计学习与视觉计算组

15+阅读 · 2018年5月29日

论文笔记 | VAIN: Attentional Multi-agent Predictive Modeling

论文笔记 | VAIN: Attentional Multi-agent Predictive Modeling

科技创新与创业

4+阅读 · 2017年12月10日

相关论文

Probing Linguistic Information For Logical Inference In Pre-trained Language Models

Arxiv

5+阅读 · 2021年12月3日

Transformer in Transformer

Arxiv

11+阅读 · 2021年10月26日

Attention, please! A survey of Neural Attention Models in Deep Learning

Arxiv

59+阅读 · 2021年3月31日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Compression of Deep Learning Models for Text: A Survey

Compression of Deep Learning Models for Text: A Survey

Arxiv

7+阅读 · 2020年8月12日

A Survey of Model Compression and Acceleration for Deep Neural Networks

Arxiv

67+阅读 · 2019年9月8日

Hierarchically-Refined Label Attention Network for Sequence Labeling

Hierarchically-Refined Label Attention Network for Sequence Labeling

Arxiv

3+阅读 · 2019年8月23日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Visualizing Attention in Transformer-Based Language Representation Models

Visualizing Attention in Transformer-Based Language Representation Models

Arxiv

3+阅读 · 2019年4月11日

Language Modeling with Gated Convolutional Networks

Arxiv

5+阅读 · 2017年9月8日

微信扫码咨询专知VIP会员