项目名称: 维吾尔语语言资源监测关键技术与方法研究

项目编号: No.61262066

项目类型: 地区科学基金项目

立项/批准年度: 2013

项目学科: 自动化技术、计算机技术

项目作者: 玉素甫·艾白都拉

作者单位: 新疆师范大学

项目金额: 48万元

中文摘要: 维吾尔语言资源监测技术与实态监测不仅是新疆社会发展领域、少数民族语言信息处理领域急需研究的重要课题,而且涉及国家稳定、安全与国际影响的重大社会问题。本项目在现有的维吾尔语常用词干与规范研究成果的基础上,根据维吾尔语的特点和统计学原理理论,四大媒体作为维吾尔语真实语料对象,计算语言学角度研究维吾尔语言文字资源动态监测关键技术和维吾尔语常用词干、实态与动态语料库。此项技术将解决维吾尔语使用状况动态监测,构建维吾尔语流通语料库,提出维吾尔语常用词干表和并为开发语言信息资源监测系统提供定量科学依据。特别是在研究舆情分析或信息抽取、网络内容理解、多语种智能软件研发,确定新疆科技维稳等国家安全信息化工作的重要支撑,结束国家层面认可的没有维吾尔语常用词干表和动态流通语料库的被动局面等方面,具有重大的研究与应用价值。为创建和谐社会,为自治区文化教育以及经济社会发展服务,对科技维稳、科技促稳具有十分重要意义

中文关键词: 维吾尔语;监测技术;常用词干表;流通语料库;

英文摘要: Uyghur language resources monitoring technology and solid state monitoring becomes not only an urgent subject need to study in the Xinjiang social development areas and minority language information processing field, but also an significant social problem related to national stability, security and international influence. The project from the angle of computational linguistics research Uyghur language resources dynamic monitoring key technology and the Uyghur language commonly used word stem completion, solid state and dynamic corpus based on the existing achievement of normative research of the Uyghur language commonly used word stem completion and standard, according to the characteristics of the Uyghur language and principles of statistics theory, the four big media as a Uyghur language real corpora. This technology will solve the Uyghur language use in dynamic monitoring, constructing the national circulation corpus, puts forward in the Uyghur language commonly used word stem completion table and for development language information resources monitoring system provide quantitative scientific basis. Especially in the public opinion analysis or information extraction, network content understanding, multilingual intelligent software development, to determine the Xinjiang technology d steady national security i

英文关键词: Uyghur Language;Monitoring technology;Commonly used word stem complelion table;Circulation corpus;

成为VIP会员查看完整内容
0

相关内容

军事知识图谱构建技术
专知会员服务
116+阅读 · 2022年4月8日
基于文档的对话技术研究
专知会员服务
18+阅读 · 2022年2月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
33+阅读 · 2021年10月17日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
【经典书】计算语言学:模型、资源的应用程序,198页pdf
专知会员服务
30+阅读 · 2020年11月19日
专知会员服务
191+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
大数据安全技术研究进展
专知会员服务
90+阅读 · 2020年5月2日
基于文档的对话技术研究
专知
2+阅读 · 2022年2月20日
解读:《金融数据安全 数据安全评估规范》
THU数据派
6+阅读 · 2022年1月18日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
R语言自然语言处理:情感分析
R语言中文社区
16+阅读 · 2019年4月16日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
网络舆情分析
计算机与网络安全
18+阅读 · 2018年10月18日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Wideband Time Frequency Coding
Arxiv
0+阅读 · 2022年5月31日
小贴士
相关VIP内容
军事知识图谱构建技术
专知会员服务
116+阅读 · 2022年4月8日
基于文档的对话技术研究
专知会员服务
18+阅读 · 2022年2月20日
多语言语音识别声学模型建模方法最新进展
专知会员服务
32+阅读 · 2022年2月7日
专知会员服务
33+阅读 · 2021年10月17日
稀缺资源语言神经网络机器翻译研究综述
专知会员服务
26+阅读 · 2020年12月2日
【经典书】计算语言学:模型、资源的应用程序,198页pdf
专知会员服务
30+阅读 · 2020年11月19日
专知会员服务
191+阅读 · 2020年10月14日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
大数据安全技术研究进展
专知会员服务
90+阅读 · 2020年5月2日
相关资讯
基于文档的对话技术研究
专知
2+阅读 · 2022年2月20日
解读:《金融数据安全 数据安全评估规范》
THU数据派
6+阅读 · 2022年1月18日
面向新闻媒体的命名实体识别技术
PaperWeekly
18+阅读 · 2019年4月17日
R语言自然语言处理:情感分析
R语言中文社区
16+阅读 · 2019年4月16日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
网络舆情分析
计算机与网络安全
18+阅读 · 2018年10月18日
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员