Developing an automatic part-of-speech (POS) tagging for any new language is considered a necessary step for further computational linguistics methodology beyond tagging, like chunking and parsing, to be fully applied to the language. Many POS disambiguation technologies have been developed for this type of research and there are factors that influence the choice of choosing one. This could be either corpus-based or non-corpus-based. In this paper, we present a review of POS tagging technologies.


翻译:开发对任何新语言的自动部分语音标记被认为是进一步计算语言方法的必要步骤,除了标记之外,还要对语言进行充分应用,例如块块和分解。许多POS分辨技术已经为这种类型的研究开发出来,有些因素影响着选择一种语言的选择。这可以是基于实体的,也可以是非主体的。在本文件中,我们介绍了对POS标记技术的审查。

0
下载
关闭预览

相关内容

词性(part-of-speech)是词汇基本的语法属性,通常也称为词类。词性标注就是在给定句子中判定每个词的语法范畴,确定其词性并加以标注的过程,是中文信息处理面临的重要基础性问题。在语料库语言学中,词性标注(POS标注或PoS标注或POST),也称为语法标注,是将文本(语料库)中的单词标注为与特定词性相对应的过程,[1] 基于其定义和上下文。
【新书】Python编程基础,669页pdf
专知会员服务
197+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
计算机 | 中低难度国际会议信息8条
Call4Papers
9+阅读 · 2019年6月19日
CCF推荐 | 国际会议信息10条
Call4Papers
8+阅读 · 2019年5月27日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
Arxiv
0+阅读 · 2021年12月3日
Arxiv
12+阅读 · 2021年8月19日
Arxiv
19+阅读 · 2020年12月23日
VIP会员
相关资讯
计算机 | 中低难度国际会议信息8条
Call4Papers
9+阅读 · 2019年6月19日
CCF推荐 | 国际会议信息10条
Call4Papers
8+阅读 · 2019年5月27日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
相关论文
Arxiv
0+阅读 · 2021年12月3日
Arxiv
12+阅读 · 2021年8月19日
Arxiv
19+阅读 · 2020年12月23日
Top
微信扫码咨询专知VIP会员