N-gram - 专知主题

n元语法（英语：N-gram）指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型，通过n个语词出现的概率来推断语句的结构。[1][2]这一模型被广泛应用于概率论、通信理论、计算语言学（如基于统计的自然语言处理）、计算生物学（如序列分析）、数据压缩等领域。

专知会员服务

54+阅读 · 2019年11月20日

参考链接

微信扫码咨询专知VIP会员