自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。

VIP内容

自然语言生成经过几十年的发展,已经成为人工智能和自然语言处理的重要研究领域。最早的自然语言生成系统采用规则、模板的方法,设计各司其职的模块进行文本生成,其中体现了很多专家设计的词汇、语法、句法甚至语用的语言学知识。统计语言模型则从概率统计的角度提出了语言建模的新思路,将词汇与上下文的依赖关系编码在条件概率中。以深度学习模型为基本架构的现代语言生成模型绝大多数通过端到端训练的方式,能更好地建模词汇与上下文之间统计共现关系,显著地提升了文本生成的性能。特别是以Transformer为基础架构的预训练语言生成模型,能够较好地捕获包括词汇、语法、句法、语义等各层面的语言学知识,极大地推动了自然语言生成的进展,生成效果令人惊叹。

• 自然语言生成(NLG)是自然语言处理的一个子领域

• 专注于构建系统,自动生成连贯和有用的书面或口头文本供人类使用

• NLG系统已经在改变我们生活的世界……

成为VIP会员查看完整内容
0
24
Top