项目名称: 基于多维潜层特征抽取模型的演进式文本过滤

项目编号: No.60905017

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 轻工业、手工业

项目作者: 徐蔚然

作者单位: 北京邮电大学

项目金额: 17万元

中文摘要: 本项目研究针对短信、邮件和网页的演进式文本过滤。其特点是个性化需求、变化的文本内容、变化的分类类别和更主动的功能要求等。演进式过滤的根本问题是训练样本不足,拟通过改善特征空间解决关键问题,即利用潜层特征提取知识、表示知识和利用知识。项目将主要研究两方面内容:根据文档、词语、类别、用户和时间等可观测维度以及它们的内在关联建立关系模型,并基于该模型抽取隐藏的、具有概括性和完备性的潜在中间层特征;根据训练样本的内容和数量,综合考虑可观测的和潜在的特征,构建各种训练样本集下都能达到最高分类精度的识别算法。项目的研究内容符合模式识别和统计学习理论的基本要求,也符合当前技术发展的一般趋势,具有合理性、可行性和创新性。预研结果初步验证了研究方案的合理可行性。

中文关键词: 演进式文本过滤;文本分类;潜层特征;多维度;词语激活力

英文摘要:

英文关键词: Evolutional Document Filtering;Text Categorization;Latent Feature;Multi-layer Feature;Word Activation Force

成为VIP会员查看完整内容
0

相关内容

基于文档的对话技术研究
专知会员服务
18+阅读 · 2022年2月20日
面向知识图谱的知识推理综述
专知会员服务
146+阅读 · 2021年11月1日
专知会员服务
16+阅读 · 2021年8月24日
专知会员服务
49+阅读 · 2021年8月13日
应用知识图谱的推荐方法与系统
专知会员服务
110+阅读 · 2020年11月23日
专知会员服务
191+阅读 · 2020年10月14日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
专知会员服务
50+阅读 · 2020年7月16日
【关系抽取】从文本中进行关系抽取的几种不同的方法
深度学习自然语言处理
29+阅读 · 2020年3月30日
AAAI 2020 | 多模态基准指导的生成式多模态自动文摘
AI科技评论
16+阅读 · 2020年1月5日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
技术动态 | 跨句多元关系抽取
开放知识图谱
49+阅读 · 2019年10月24日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
37+阅读 · 2019年8月18日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
Arxiv
29+阅读 · 2020年3月16日
Arxiv
11+阅读 · 2018年1月18日
小贴士
相关VIP内容
基于文档的对话技术研究
专知会员服务
18+阅读 · 2022年2月20日
面向知识图谱的知识推理综述
专知会员服务
146+阅读 · 2021年11月1日
专知会员服务
16+阅读 · 2021年8月24日
专知会员服务
49+阅读 · 2021年8月13日
应用知识图谱的推荐方法与系统
专知会员服务
110+阅读 · 2020年11月23日
专知会员服务
191+阅读 · 2020年10月14日
基于多来源文本的中文医学知识图谱的构建
专知会员服务
52+阅读 · 2020年8月21日
实体关系抽取方法研究综述
专知会员服务
174+阅读 · 2020年7月19日
专知会员服务
50+阅读 · 2020年7月16日
相关资讯
【关系抽取】从文本中进行关系抽取的几种不同的方法
深度学习自然语言处理
29+阅读 · 2020年3月30日
AAAI 2020 | 多模态基准指导的生成式多模态自动文摘
AI科技评论
16+阅读 · 2020年1月5日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
技术动态 | 跨句多元关系抽取
开放知识图谱
49+阅读 · 2019年10月24日
基于知识图谱的文本挖掘 - 超越文本挖掘
专知
37+阅读 · 2019年8月18日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员