【NLP】NLP 领域还有 5 大开放问题

2019 年 10 月 9 日 产业智能官


作者 | 杨晓凡 来源 | AI科技评论




作者 | 杨晓凡
编辑 | 唐里


如题,虽然 NLP 研究领域已经在深度学习的帮助下取得了长足的发展,许多技术也已经商业化落地,但我们也需要知道,这个领域还有几个开放性问题等待解决 —— 如果它们也能比较好地解决,也许我们能迎来 NLP 科研成果与商业落地的一个新的高潮。
下面列举的 5 个开放性问题来自自学 NLP 的机电一体化本科生 Deepak Garasangi 在 Reddit 上的发帖讨论内容总结,并且参考了 Sebastian Ruder 曾经总结的 4 个开放性问题。按重要性从轻到重排序:


5. 评价指标


这个问题在领域内不算很大的瓶颈,但是经常有研究人员觉得有必要重新讨论这个问题,因为现行惯例里往往不问原因就沿用某些固定的架构、数据集和评价指标。有人这样总结:「随着我们探索越来越高级的认知任务,弄明白为什么某些方法、某些架构在某些时候能起到好的效果,这对我们非常有帮助。」

另外一种担忧是对于评价指标自身的,这些评价技巧、这些生成的数字到底能在多大程度上对应人类语言的多样性和表达能力? 对这个问题的回答也可以帮助我们构建出更有趣的自然语言推理数据集。
拓展阅读: EMNLP 2017 论文《Why We Need New Evaluation Metrics for NLG》(https://www.aclweb.org/anthology/D17-1238)


4. 终生学习(Life long learning)

NLP 领域遇到的另一个棘手问题是为这几个问题设计解决方案:
  • 低阶模型用于下游任务时的终生适配

  • 迁移学习的应用

  • 视觉、文本、音频等等语言相关模态的无缝整合

  • 低资源情境中高效的跨任务迁移

拓展阅读:Sebastian Ruder 近期写了一篇文章,总结了 NLP 领域迁移学习的现状,AI 科技评论也做了编辑,可以 点击阅读


3. 面向目标的对话系统

面向目标的对话系统(Goal oriented dialogue systems)
从 ACL 学会出版的论文集来看,近一两年的 ACL 会议、EMNLP 会议中研究面向目标的对话系统的论文都有大幅增加。这就是又一个开放性问题:如何设计具备常识、能在真实世界语境中与人类进行较长的、面向目标的交谈的机器对话系统。目前的研究思路包括:带有状态追踪的任务驱动的对话系统,使用强化学习的对话系统,以及很多别的新点子。
拓展阅读:在 NLP 中应用强化学习
https://www.csie.ntu.edu.tw/~yvchen/doc/KAIST19_Tutorial.pdf



2. 低资源语言

这可以算是最紧迫的问题。目前全世界大约有 7000 种语言,但这些语言中只有很小的一部分,大概 20 种左右,可以算是资源丰富的语言。这个问题除了很实际之外,在其中找到灵感、取得进展也相对比较容易。专家们认为可行的方向包括:
  • 为低资源语言设计收集数据、用较小数据训练语言模型的方法

  • 可以有效用于低资源语言的跨任务迁移方法

拓展阅读:详细的说明文章参见 http://www.cs.cmu.edu/~ytsvetko/jsalt-part1.pdf



1. 自然语言理解

没错,这就是那个最开放的问题,它和 NLP 领域中的许多具体问题也都息息相关。想要解决这个高阶的认知问题,可能需要我们从强化学习、领域适应、小样本/零样本学习等等领域中借鉴很多思想和方法,也还需要 NLP 研究人员们做出更多创新。
现阶段的研究落脚点包括:
  • 共指消歧(Coreference resolution)、多义词解析(Polysemy)、文本/文档总结(Text/Document Summarization)

  • 论证与推理,讽刺与幽默

  • 高效地表征大文本

  • 环境中的语言学习(Grounded language learning),比如联合学习一个世界模型和语言模型,并且学习如何在语言模型中使用世界模型。

Yoshua Bengio 曾说:「要有野心。不要(因为做 NLP 就)仅仅读 NLP 论文。要读很多机器学习、深度学习、强化学习的论文。」我们也希望各位研究者们可以打开眼界,多多参考以前和现在的包括别的领域的有用经验,才能解决更难的问题、做出更大的成果。



先进制造业+工业互联网




产业智能官  AI-CPS


加入知识星球“产业智能研究院”:先进制造业OT(自动化+机器人+工艺+精益)和工业互联网IT(云计算+大数据+物联网+区块链+人工智能)产业智能化技术深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的产业智能化平台;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。


产业智能化平台作为第四次工业革命的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎; 重构设计、生产、物流、服务等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生 新技术、新产品、新产业、新业态和新模式; 引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。

产业智能化技术分支用来的今天,制造业者必须了解如何将“智能技术”全面渗入整个公司、产品、业务等商业场景中, 利用工业互联网形成数字化、网络化和智能化力量,实现行业的重新布局、企业的重新构建和焕然新生。

版权声明产业智能官(ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。



登录查看更多
2

相关内容

NLP:自然语言处理
专知会员服务
102+阅读 · 2020年3月12日
NLP基础任务:文本分类近年发展汇总,68页超详细解析
专知会员服务
57+阅读 · 2020年1月3日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
78+阅读 · 2019年10月12日
NLP 领域还有 5 大开放问题
AI科技评论
4+阅读 · 2019年9月19日
NLP领域中的迁移学习现状
AI科技评论
7+阅读 · 2019年9月1日
四种常见NLP框架使用总结
AI科技评论
4+阅读 · 2019年8月13日
初入NLP领域的一些小建议
AINLP
21+阅读 · 2019年3月15日
直面难题!NLP四大开放性问题详解
新智元
5+阅读 · 2019年1月17日
自然语言处理NLP的坑到底有多大?
专知
45+阅读 · 2018年11月12日
概览迁移学习在NLP领域中的应用
论智
4+阅读 · 2018年7月31日
手把手教你搞定90%的NLP问题
AI前线
3+阅读 · 2018年3月18日
教程帖:如何解决90%的NLP问题(上)
论智
3+阅读 · 2018年2月12日
Natural 自然语言处理(NLP)「全解析」
人工智能学家
14+阅读 · 2017年9月23日
Arxiv
6+阅读 · 2019年8月22日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
22+阅读 · 2018年8月30日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
20+阅读 · 2018年1月17日
VIP会员
相关资讯
NLP 领域还有 5 大开放问题
AI科技评论
4+阅读 · 2019年9月19日
NLP领域中的迁移学习现状
AI科技评论
7+阅读 · 2019年9月1日
四种常见NLP框架使用总结
AI科技评论
4+阅读 · 2019年8月13日
初入NLP领域的一些小建议
AINLP
21+阅读 · 2019年3月15日
直面难题!NLP四大开放性问题详解
新智元
5+阅读 · 2019年1月17日
自然语言处理NLP的坑到底有多大?
专知
45+阅读 · 2018年11月12日
概览迁移学习在NLP领域中的应用
论智
4+阅读 · 2018年7月31日
手把手教你搞定90%的NLP问题
AI前线
3+阅读 · 2018年3月18日
教程帖:如何解决90%的NLP问题(上)
论智
3+阅读 · 2018年2月12日
Natural 自然语言处理(NLP)「全解析」
人工智能学家
14+阅读 · 2017年9月23日
Top
微信扫码咨询专知VIP会员