【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf - 专知VIP

会员服务 ·

15

CMU · 博士论文 · 自然语言处理 · 语言结构预测 ·

2023 年 9 月 3 日

【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在自然语言处理（NLP）中，许多任务涉及结构化预测：预测由一组相互依赖的变量组成的结构化输出。这允许从非结构化的原始文本中提取有用的信息，这对于人类和机器的下游任务和分析都有益处。为了获得自动化模型，主要范式是以数据驱动的监督学习方式进行。在这个范式中，主要的瓶颈是手动注释数据的可用性，这通常是昂贵且耗时的。此外，我们通常希望将模型扩展到各种新场景，比如不同的领域或语言。如果训练实例不足以涵盖目标场景，模型性能可能会显著下降，而在所有这些新情况下注释大量数据实例是昂贵且低效的。为了减轻这个问题并减少结构化预测模型对大量注释的依赖，我们需要考虑模型和数据两个方面，这是数据驱动机器学习的主要驱动力。与这些核心方面相关，我们探讨了三个方向。首先，我们研究模型设计中的结构化建模，其中涉及如何对复杂的结构化输出进行建模和预测。这对于结构化预测任务特别重要，因为这些任务通常具有大的输出空间。此外，在模型和数据的交互方面，我们研究了迁移学习，其中利用相关数据来帮助低资源的目标任务。在这种情况下，如何设计更不受源数据和目标数据之间差异影响的模型对于迁移的成功也至关重要。最后，我们探讨主动学习，重点关注数据本身。当资源有限时，很难获得大量注释的实例，但注释一小部分实例是可行的。通过选择信息量丰富的实例集的策略，可能只需要较少的手动注释就可以实现令人满意的性能。

这篇论文包括三个部分，对应这三个方向。在第一部分中，我们研究了深度神经模型中结构化输出建模的影响。我们发现，结构化建模在句子级别的完全匹配和更高效的模型方面带来了好处。我们进一步将分析扩展到低资源情景，并研究结构约束与训练数据规模之间的交互作用。在第二部分中，我们研究了一系列相关的结构化任务，并发现来自相关数据的监督，例如来自相同任务但不同语言（跨语言学习）以及来自相关任务（多任务学习）的监督，可以是有益的，尤其是在利用那些对源数据和目标数据差异关注较少的模型时。最后，在第三部分中，我们对NLP中的结构化预测进行了系统的主动学习研究。特别是，我们分析了使用部分结构进行注释和学习的有效性，这可以提高主动学习的数据效率。此外，我们展示了将主动学习与使用主动学习数据池中未标记实例的自训练相结合，可以带来进一步的改进。

成为VIP会员查看完整内容

29

相关内容

CMU

【ETH博士论文】基于离散优化的学习，193页pdf

【ETH博士论文】基于离散优化的学习，193页pdf

专知会员服务

44+阅读 · 2023年9月17日

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

专知会员服务

53+阅读 · 2023年8月22日

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

专知会员服务

25+阅读 · 2023年8月5日

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

专知会员服务

46+阅读 · 2023年4月26日

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

专知会员服务

30+阅读 · 2023年3月6日

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

专知会员服务

28+阅读 · 2023年3月4日

【CMU博士论文】神经序列建模与应用，102页pdf

【CMU博士论文】神经序列建模与应用，102页pdf

专知会员服务

58+阅读 · 2022年8月23日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【Aalto博士论文】高效样本近似贝叶斯计算的高斯过程代理方法，84页pdf

专知会员服务

35+阅读 · 2020年9月30日

【港科大博士论文】神经架构设计:搜索方法和领域知识，147页pdf

【港科大博士论文】神经架构设计:搜索方法和领域知识，147页pdf

专知

3+阅读 · 2022年12月1日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【宾夕法尼亚博士论文】大规模图机器学习，179页pdf

【宾夕法尼亚博士论文】大规模图机器学习，179页pdf

专知

6+阅读 · 2022年11月20日

【牛津大学博士论文】关系数据的学习和推理，243页pdf

【牛津大学博士论文】关系数据的学习和推理，243页pdf

专知

1+阅读 · 2022年11月16日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

专知

2+阅读 · 2022年11月1日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

语义Web知识库补全关键技术研究

国家自然科学基金

15+阅读 · 2017年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Testing for patterns and structures in covariance and correlation matrices

Arxiv

0+阅读 · 2023年10月18日

The epigraph and the hypograph indexes as useful tools for clustering multivariate functional data

Arxiv

0+阅读 · 2023年10月17日

WGoM: A novel model for categorical data with weighted responses

Arxiv

0+阅读 · 2023年10月17日

Machine learning in physics: a short guide

Arxiv

0+阅读 · 2023年10月16日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

自然语言处理

语言结构预测

相关VIP内容

【ETH博士论文】基于离散优化的学习，193页pdf

【ETH博士论文】基于离散优化的学习，193页pdf

专知会员服务

44+阅读 · 2023年9月17日

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

【伯克利博士论文】受约束的机器学习：算法与模型，153页pdf

专知会员服务

53+阅读 · 2023年8月22日

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

【CMU博士论文】在资源受限的情境下探索语言结构化预测, 228页pdf

专知会员服务

25+阅读 · 2023年8月5日

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

【MIT博士论文】非平稳多智能体环境中的有效学习，184页pdf

专知会员服务

46+阅读 · 2023年4月26日

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

【米兰理工学院博士论文】强化学习中环境可配置性的利用，304页pdf

专知会员服务

30+阅读 · 2023年3月6日

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

【博士论文】面向应用环境下深度学习方法的持续学习，195页pdf

专知会员服务

28+阅读 · 2023年3月4日

【CMU博士论文】神经序列建模与应用，102页pdf

【CMU博士论文】神经序列建模与应用，102页pdf

专知会员服务

58+阅读 · 2022年8月23日

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

【MIT-Kenji博士论文】深度学习中的优化与可扩展性，260页pdf

专知会员服务

61+阅读 · 2022年4月3日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【Aalto博士论文】高效样本近似贝叶斯计算的高斯过程代理方法，84页pdf

专知会员服务

35+阅读 · 2020年9月30日

热门VIP内容

开通专知VIP会员享更多权益服务

新型数字杀伤链：理解综合战术网络对野战炮兵体系的能力与效益

《对抗环境中运用数字孪生技术优化预测性维护与后勤保障》2025最新93页

《任务式指挥十六个案例研究》232页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

相关资讯

【港科大博士论文】神经架构设计:搜索方法和领域知识，147页pdf

【港科大博士论文】神经架构设计:搜索方法和领域知识，147页pdf

专知

3+阅读 · 2022年12月1日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【宾夕法尼亚博士论文】大规模图机器学习，179页pdf

【宾夕法尼亚博士论文】大规模图机器学习，179页pdf

专知

6+阅读 · 2022年11月20日

【牛津大学博士论文】关系数据的学习和推理，243页pdf

【牛津大学博士论文】关系数据的学习和推理，243页pdf

专知

1+阅读 · 2022年11月16日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知

9+阅读 · 2022年11月9日

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

【牛津大学博士论文】深度学习数据驱动发现偏微分方程，160页pdf

专知

2+阅读 · 2022年11月1日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

31+阅读 · 2022年7月7日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

15+阅读 · 2017年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

基于低维连续表示的启发式智能规划技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Testing for patterns and structures in covariance and correlation matrices

Arxiv

0+阅读 · 2023年10月18日

The epigraph and the hypograph indexes as useful tools for clustering multivariate functional data

Arxiv

0+阅读 · 2023年10月17日

WGoM: A novel model for categorical data with weighted responses

Arxiv

0+阅读 · 2023年10月17日

Machine learning in physics: a short guide

Arxiv

0+阅读 · 2023年10月16日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

218+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员